Теоретические аспекты инженерии знаний
Вид материала | Лекция |
- Вопросы, выносимые на экзамен по курсу пис, 26.43kb.
- Удк 007. 5: 510. 66: 159. 955. 5 Решение задач психосемантики и инженерии знаний, 119.11kb.
- Программа вступительных испытаний по менеджменту (3,5 года обучения на базе высшего, 14.32kb.
- − Актуальные проблемы стилистики и культуры речи: теоретические и лингвометодические, 34.6kb.
- «Актуальные проблемы современной экономики: теоретические и практические аспекты», 14.16kb.
- Программа вступительного испытания в магистратуру по дисциплине «Теоретические основы, 63.68kb.
- Детских аналитических психологов развитие детской аналитической психологии в украине:, 1453.3kb.
- Международная научная конференция студентов, аспирантов и молодых ученых «Теоретические, 28.69kb.
- Т. В. Белых дифференциальная психология теоретические и прикладные аспекты исследования, 2889.36kb.
- Системы искусственного интеллекта, 15.16kb.
ЛЕКЦИЯ 1
Теоретические аспекты инженерии знаний
Инженерия знаний – достаточно молодое направление искусственного интеллекта, связанное с нетривиальными проблемами извлечения и формализации знаний. Центральным понятием является поле знаний.
Поле знаний – это условное неформальное описание основных понятий и взаимосвязей между понятиями предметной области, выявленных из системы знаний эксперта, в виде графа, диаграммы, таблицы или текста.
Поле знаний, как первый шаг к формализации, представляет модель знаний о ПО, в том виде, в каком ее сумел выразить аналитик на своем языке. Существует ряд языков инженерии знаний – это структурно-логический язык SLL, язык К-систем, УСК.
В науке сложились два подхода к разработке универсальных языков: создание языков-классификаций и логико-конструктивных языков. Второй подход связан с исследованиями в рамках поиска универсального метода познания, наиболее четко высказанного Р. Декартом, а затем Г. Лейбницем. Именно Лейбниц наметил основные контуры учения о символах. Они были развиты Г. Ламбертом, который и дал науке имя «семиотика». Семиотика нашла своих адептов в сфере гуманитарных наук. В последнее время сложилась новая ветвь – прикладная семиотика.
Языки семиотического моделирования как естественное развитие языков ситуационного управления являются первым приближением к языку инженерии знаний. Изменчивость и условность знаков делают семиотическую модель применимой к сложным сферам реальной человеческой деятельности.
Семиотика включает:
- синтаксис – совокупность правил построения языка;
- семантику – связь между элементами языка и их значениями или отношения между знаками и реальностью;
- прагматику – отношения между знаками и пользователями.
^ Семиотическая модель поля знаний
Поле знаний является некоторой семиотической моделью, которая может быть представлена как граф, рисунок, таблица, диаграмма, формула или текст.
Синтаксис. Обобщенно синтаксическую структуру можно представить как
П = (І, О, М),
Где І – структура исходных данных,
О – структура выходных данных,
М – модель ПО, на основании которой происходит модификация І в О.
Модель предметной области представляет совокупность концептуальной и функциональной структуры. Концептуальная структура выступает как статическая, неизменная составляющая поля знаний, а функциональная представляет динамическую составляющую.
Формирование концептуальной структуры основано на выявлении понятий ПО и построении иерархии понятий, так называемой «пирамиды знаний». Функциональная структура моделирует связи и отношения между понятиями. Эти связи отражают модель или стратегию принятия решения. Таким образом функциональная структура образует стратегическую составляющую модели.
Семантика – фактически это набор правил интерпретации предложений и формул любого языка. Семантика должна быть композиционной, то есть значение предложения определяется как функция значений его составляющих. Семантика языка зависит от особенностей ПО, она обладает свойством полиморфизма, одни операторы в разных задачах могут иметь свои особенности.
Семантика поля знаний имеет два уровня: на первом есть семантическая модель знаний эксперта, на втором уровне любое поле знаний является моделью некоторых знаний.
Знания – вещь сугубо авторизованная и ЭС является «базой знаний эксперта Х в понимании инженера по знаниям У». Стоит заменить инженера по знаниям, и получится совсем другая картина.
Прагматика. В качестве прагматической составляющей семиотической модели следует рассматривать технологии проведения структурного анализа ПО. Это практические аспекты разработки и использования поля, то есть как от сеансов извлечения знаний перейти к стройной и ясной модели.
ЛЕКЦИЯ 2
Стратегии получения знаний
Процесс получения знаний является ключевым при формировании поля знаний.
Можно выделить три основные стратегии проведения стадии получения знаний при разработке ЭС:
^ Извлечение знаний (knowledge elicitation) – это процедура взаимодействия эксперта с источником знаний, в результате которой становятся явными процесс рассуждений специалистов при принятии решения и структура их представлений о предметной области.
Трудности:
- организационные неувязки, неудачный метод извлечения, не совпадающий со структурой знаний в данной области,
- неадекватная модель для представления знаний,
- неумение наладить контакт с экспертом,
- терминологический разнобой,
- отсутствие целостной системы знаний в результате извлечения только фрагментов,
- упрощение «картины мира» эксперта.
Процесс извлечения знаний – это длительная и трудоемкая процедура, в которой инженеру по знаниям необходимо воссоздать модель ПО, которой пользуются эксперты для принятия решения. Объекты реального мира связаны более чем 200 типами отношений (временные, пространственные, причинно- следственные и т. п.). Эти отношения и связи ПО образуют сложную систему, из которой необходимо выделить скелет или главную структуру.
^ Приобретение знаний (knowledge acquisition) – процесс наполнения базы знаний экспертом с использованием специализированных программных средств.
Формирование знаний (machine learning) – процесс анализа данных и выявления скрытых закономерностей с использованием специального математического аппарата и программных средств. Этот термин закрепился за перспективной и активно развивающейся областью инженерии знаний, которая занимается разработкой моделей, методов и алгоритмов обучения. Наиболее продвинутыми методами машинного обучения являются методы распознавания образов, в частности алгебраический подход.
^ Теоретические аспекты извлечения знаний
Чтобы разобраться в природе извлечения знаний, выделим три основных аспекта этой процедуры:
А
= { А1, А2, А3} = {психологический, лингвинистический, гносеологический}
Психологический аспект является ведущим, поскольку он определяет успешность и эффективность взаимодействия аналитика с основным источником знаний – экспертом-профессионалом. Извлечение знаний происходит в процессе непосредственного общения, а в общении психология является доминантной. Общение – это междисциплинарное понятие, обозначающее все формы контактов между людьми – от дружеских до деловых.
Потери информации при разговорном общении:
Задумано | Приобрело словесную форму | Высказано | Выслушано | Понято | Осталось в памяти |
100% | 90% | 80% | 70% | 60% | 24% |
Лингвинистический аспект касается исследования языковых проблем, т.к. язык – основное средство общения в процессе извлечения знаний. Можно выделить три слоя лингвинистических проблем: «общий код», понятийная структура, словарь пользователя. «Общий код» решает проблему языковых ножниц между профессиональной терминологией эксперта и обыденной речью инженера по знаниям. «Общий код» включает общенаучную терминологию, специальные понятия из профессиональной литературы, элементы бытового языка, неологизмы, профессиональный жаргон и др. Выработка общего кода – это составление словаря предметной области.
Понятийная структура подразумевает построение иерархии абстракций – глобальной схемы, которая может быть положена в основу концептуального анализа структуры знаний любой предметной области. Лингвинистический эквивалент иерархии – иерархия понятий, которую необходимо построить в понятийной структуре, формируемой инженером по знаниям.
Болезнь У
Мужчина 30-40 лет с болезнью У
Образ больного Х
Взгляд на историю болезни больного Х
Составление словаря пользователя – это формирование отдельного словаря для создания дружественного интерфейса с пользователем ЭС. Для разработки пользовательского интерфейса требуется дополнительная доработка словаря общего кода с поправкой на доступность системы.
Гносеологический аспект извлечения знаний объединяет методологические проблемы получения нового научного знания.
Гносеология – это раздел философии, связанный с теорией познания, или теорией отражения действительности в сознании человека.
Сначала действительность отражается в сознании эксперта, затем деятельность и опыт эксперта интерпретируются сознанием инженера по знаниям, что служит основой для построения третьей интерпретации – поля знаний ЭС.
Само знание имеет два уровня:
- Эмпирический (наблюдения, явления),
- Теоретический (законы, абстракции, обобщения).
Гносеологическая цепочка: факт → обобщенный факт → эмпирический закон → теоретический закон.
Основными методологическими критериями научности нового знания и способа его получения являются: внутренняя согласованность, системность, объективность, историзм.
Эмпирическому знанию свойственны модальность, противоречивость, неполнота. Задача аналитика – сглаживать эти «шероховатости» эмпирики.
Системно-структурный подход к познанию ориентирует аналитика на рассмотрение ПО с позиций закономерностей системного целого и взаимодействия составляющих его частей. Например, системный взгляд на проблематику структурирования знаний позволяет увидеть его иерархическую организацию.
Процесс познания субъективен. Следовательно, более корректно говорить о глубине понимания, чем об объективности знания.
Критерий «историзм» связан с развитием. Познание настоящего – есть познание породившего его прошлого.
Методологическая структура познания может быть представлена как некоторая последовательность этапов:
- Описание и обобщение фактов;
- Установление логических и математических связей, дедукция и индукция законов;
- Построение идеализированной модели;
- Объяснение и предсказание явлений.
ЛЕКЦИЯ 3
Теоретические аспекты структурирования знаний
Разделение стадий извлечения и структурирования знаний является условным. В настоящее время прослеживается тенденция опережения технологических средств разработки интеллектуальных систем по отношению к их теоретическому обоснованию. Практически сейчас существует пропасть между математическими основами кибернетики (Виннер, Шеннон, Джордж, Йордан, Ляпунов) и современным поколением интеллектуальных систем, которые основаны на парадигме обработки знаний ( ЭС, лингвинистические процессоры, обучающие системы).
Иерархический подход традиционно используется при проектировании сложных систем как прием расчленения формально описанной системы на уровни (блоки, модули). На каждом уровне вводятся свои представления о системе и элементах, продвижение от уровня к уровню имеет строгую направленность (сверху вниз или снизу вверх).
Традиционные методологии структурирования:
- Структурный (системный) подход или анализ, основанный на идее алгоритмической декомпозиции, где каждый модуль выполняет этап общего процесса,
- Объектный подход, связанный с декомпозицией и выделением не процессов, а объектов, при этом каждый объект рассматривается как экземпляр определенного класса.
В структурном анализе разработано большое число средств проектирования: диаграммы потоков данных, структурированные словари (тезаурусы), таблицы решений, стрелочные диаграммы, деревья целей, блок-схемы алгоритмов, модели окружения.
Объектно-ориентированный подход основан на следующих элементарных понятиях: объекты, классы как объекты, классификации как средства упорядочения знаний, иерархии с наследованием свойств, средства ограничения доступа, методы для определения функций и отношений.
Объектно-структурный подход (ОСП) – обобщенный метод структурного анализа и формирования поля знаний.
Основные постулаты заимствованы из ООП и расширены:
- Системность – взаимосвязь между понятиями,
- Абстрагирование – выявление характеристик понятия, отличающих его от других,
- Иерархия – упорядочивание системы абстракций,
- Типизация – выделение классов понятий с частичным наследованием свойств,
- Модульность – разбиение задачи на подзадачи,
- Наглядность и простота нотации.
Сертификация знаний
Объектно-структурный анализ ПО подразумевает восемь страт или слоев:
Слой | Знания | Стратификация знаний (анализ) |
S_1 | Зачем | Стратегический анализ: назначение и функции системы |
S_2 | Кто | Организационный: коллектив разработчиков системы |
S_3 | Что | Концептуальный: понятийная структура |
S_4 | Как | Функциональный: гипотезы и модели принятия решений |
S_5 | Где | Пространственный: окружение, оборудование, коммуникации |
S_6 | Когда | Временной: временные параметры и ограничения |
S_7 | Почему | Причинно-следственный: подсистема объяснений |
S_8 | Сколько | Экономический: ресурсы, затраты, прибыль, окупаемость |
Алгоритм ОСА
Алгоритм ОСА предназначен для детального структурирования знаний ПО. Алгоритм содержит последовательность аналитических процедур и разделяется на две составляющие:
- Глобальный (вертикальный) анализ – разбиение ПО на страты,
- Анализ страт (горизонтальный) – построение многоуровневых структур по отдельным стратам.
ЛЕКЦИЯ 4