Теоретические аспекты инженерии знаний

Вид материалаЛекция

Содержание


Семиотическая модель поля знаний
Извлечение знаний
Приобретение знаний
Теоретические аспекты извлечения знаний
Технологии инженерии знаний
Управление знаниями
Гипертекстовые системы
Основные понятия процесса разработки программного обеспечения
Общая структура типовой технологической системы поддержки разработки
Документация, результаты работы подсистем, результаты прогнозов и т.д.
Представление данных и знаний в Интернете Язык HTML и представление знаний
Возможности представления знаний на базе языка
Онтологии и онтологические системы
О понимают упорядоченную тройку вида: О =
Системы и средства представления онтологических знаний
Интеллектуальные Интернет-технологии Программные агенты и мультиагентные системы
Классификация агентов
Общие вопросы проектирования агентов и МАС
Основные направления исследований в области искусственного интеллекта
Представление знаний и вывод на знаниях Данные и знания
...
Полное содержание
Подобный материал:
  1   2   3   4   5   6   7   8   9   10   11

ЛЕКЦИЯ 1

Теоретические аспекты инженерии знаний



Инженерия знаний – достаточно молодое направление искусственного интеллекта, связанное с нетривиальными проблемами извлечения и формализации знаний. Центральным понятием является поле знаний.

Поле знаний – это условное неформальное описание основных понятий и взаимосвязей между понятиями предметной области, выявленных из системы знаний эксперта, в виде графа, диаграммы, таблицы или текста.

Поле знаний, как первый шаг к формализации, представляет модель знаний о ПО, в том виде, в каком ее сумел выразить аналитик на своем языке. Существует ряд языков инженерии знаний – это структурно-логический язык SLL, язык К-систем, УСК.

В науке сложились два подхода к разработке универсальных языков: создание языков-классификаций и логико-конструктивных языков. Второй подход связан с исследованиями в рамках поиска универсального метода познания, наиболее четко высказанного Р. Декартом, а затем Г. Лейбницем. Именно Лейбниц наметил основные контуры учения о символах. Они были развиты Г. Ламбертом, который и дал науке имя «семиотика». Семиотика нашла своих адептов в сфере гуманитарных наук. В последнее время сложилась новая ветвь – прикладная семиотика.

Языки семиотического моделирования как естественное развитие языков ситуационного управления являются первым приближением к языку инженерии знаний. Изменчивость и условность знаков делают семиотическую модель применимой к сложным сферам реальной человеческой деятельности.

Семиотика включает:
  • синтаксис – совокупность правил построения языка;
  • семантику – связь между элементами языка и их значениями или отношения между знаками и реальностью;
  • прагматику – отношения между знаками и пользователями.

^ Семиотическая модель поля знаний

Поле знаний является некоторой семиотической моделью, которая может быть представлена как граф, рисунок, таблица, диаграмма, формула или текст.

Синтаксис. Обобщенно синтаксическую структуру можно представить как

П = (І, О, М),

Где І – структура исходных данных,

О – структура выходных данных,

М – модель ПО, на основании которой происходит модификация І в О.

Модель предметной области представляет совокупность концептуальной и функциональной структуры. Концептуальная структура выступает как статическая, неизменная составляющая поля знаний, а функциональная представляет динамическую составляющую.

Формирование концептуальной структуры основано на выявлении понятий ПО и построении иерархии понятий, так называемой «пирамиды знаний». Функциональная структура моделирует связи и отношения между понятиями. Эти связи отражают модель или стратегию принятия решения. Таким образом функциональная структура образует стратегическую составляющую модели.

Семантика – фактически это набор правил интерпретации предложений и формул любого языка. Семантика должна быть композиционной, то есть значение предложения определяется как функция значений его составляющих. Семантика языка зависит от особенностей ПО, она обладает свойством полиморфизма, одни операторы в разных задачах могут иметь свои особенности.

Семантика поля знаний имеет два уровня: на первом есть семантическая модель знаний эксперта, на втором уровне любое поле знаний является моделью некоторых знаний.

Знания – вещь сугубо авторизованная и ЭС является «базой знаний эксперта Х в понимании инженера по знаниям У». Стоит заменить инженера по знаниям, и получится совсем другая картина.

Прагматика. В качестве прагматической составляющей семиотической модели следует рассматривать технологии проведения структурного анализа ПО. Это практические аспекты разработки и использования поля, то есть как от сеансов извлечения знаний перейти к стройной и ясной модели.


ЛЕКЦИЯ 2

Стратегии получения знаний


Процесс получения знаний является ключевым при формировании поля знаний.

Можно выделить три основные стратегии проведения стадии получения знаний при разработке ЭС:





^ Извлечение знаний (knowledge elicitation) – это процедура взаимодействия эксперта с источником знаний, в результате которой становятся явными процесс рассуждений специалистов при принятии решения и структура их представлений о предметной области.

Трудности:
  • организационные неувязки, неудачный метод извлечения, не совпадающий со структурой знаний в данной области,
  • неадекватная модель для представления знаний,
  • неумение наладить контакт с экспертом,
  • терминологический разнобой,
  • отсутствие целостной системы знаний в результате извлечения только фрагментов,
  • упрощение «картины мира» эксперта.

Процесс извлечения знаний – это длительная и трудоемкая процедура, в которой инженеру по знаниям необходимо воссоздать модель ПО, которой пользуются эксперты для принятия решения. Объекты реального мира связаны более чем 200 типами отношений (временные, пространственные, причинно- следственные и т. п.). Эти отношения и связи ПО образуют сложную систему, из которой необходимо выделить скелет или главную структуру.

^ Приобретение знаний (knowledge acquisition) – процесс наполнения базы знаний экспертом с использованием специализированных программных средств.

Формирование знаний (machine learning) – процесс анализа данных и выявления скрытых закономерностей с использованием специального математического аппарата и программных средств. Этот термин закрепился за перспективной и активно развивающейся областью инженерии знаний, которая занимается разработкой моделей, методов и алгоритмов обучения. Наиболее продвинутыми методами машинного обучения являются методы распознавания образов, в частности алгебраический подход.


^ Теоретические аспекты извлечения знаний

Чтобы разобраться в природе извлечения знаний, выделим три основных аспекта этой процедуры:

А
= { А1, А2, А3} = {психологический, лингвинистический, гносеологический}


Психологический аспект является ведущим, поскольку он определяет успешность и эффективность взаимодействия аналитика с основным источником знаний – экспертом-профессионалом. Извлечение знаний происходит в процессе непосредственного общения, а в общении психология является доминантной. Общение – это междисциплинарное понятие, обозначающее все формы контактов между людьми – от дружеских до деловых.

Потери информации при разговорном общении:

Задумано

Приобрело словесную форму

Высказано

Выслушано

Понято

Осталось в памяти

100%

90%

80%

70%

60%

24%


Лингвинистический аспект касается исследования языковых проблем, т.к. язык – основное средство общения в процессе извлечения знаний. Можно выделить три слоя лингвинистических проблем: «общий код», понятийная структура, словарь пользователя. «Общий код» решает проблему языковых ножниц между профессиональной терминологией эксперта и обыденной речью инженера по знаниям. «Общий код» включает общенаучную терминологию, специальные понятия из профессиональной литературы, элементы бытового языка, неологизмы, профессиональный жаргон и др. Выработка общего кода – это составление словаря предметной области.

Понятийная структура подразумевает построение иерархии абстракций – глобальной схемы, которая может быть положена в основу концептуального анализа структуры знаний любой предметной области. Лингвинистический эквивалент иерархии – иерархия понятий, которую необходимо построить в понятийной структуре, формируемой инженером по знаниям.




Болезнь У




Мужчина 30-40 лет с болезнью У


Образ больного Х




Взгляд на историю болезни больного Х


Составление словаря пользователя – это формирование отдельного словаря для создания дружественного интерфейса с пользователем ЭС. Для разработки пользовательского интерфейса требуется дополнительная доработка словаря общего кода с поправкой на доступность системы.

Гносеологический аспект извлечения знаний объединяет методологические проблемы получения нового научного знания.

Гносеология – это раздел философии, связанный с теорией познания, или теорией отражения действительности в сознании человека.

Сначала действительность отражается в сознании эксперта, затем деятельность и опыт эксперта интерпретируются сознанием инженера по знаниям, что служит основой для построения третьей интерпретации – поля знаний ЭС.

Само знание имеет два уровня:
  1. Эмпирический (наблюдения, явления),
  2. Теоретический (законы, абстракции, обобщения).

Гносеологическая цепочка: факт → обобщенный факт → эмпирический закон → теоретический закон.

Основными методологическими критериями научности нового знания и способа его получения являются: внутренняя согласованность, системность, объективность, историзм.

Эмпирическому знанию свойственны модальность, противоречивость, неполнота. Задача аналитика – сглаживать эти «шероховатости» эмпирики.

Системно-структурный подход к познанию ориентирует аналитика на рассмотрение ПО с позиций закономерностей системного целого и взаимодействия составляющих его частей. Например, системный взгляд на проблематику структурирования знаний позволяет увидеть его иерархическую организацию.

Процесс познания субъективен. Следовательно, более корректно говорить о глубине понимания, чем об объективности знания.

Критерий «историзм» связан с развитием. Познание настоящего – есть познание породившего его прошлого.

Методологическая структура познания может быть представлена как некоторая последовательность этапов:
  1. Описание и обобщение фактов;
  2. Установление логических и математических связей, дедукция и индукция законов;
  3. Построение идеализированной модели;
  4. Объяснение и предсказание явлений.



ЛЕКЦИЯ 3

Теоретические аспекты структурирования знаний


Разделение стадий извлечения и структурирования знаний является условным. В настоящее время прослеживается тенденция опережения технологических средств разработки интеллектуальных систем по отношению к их теоретическому обоснованию. Практически сейчас существует пропасть между математическими основами кибернетики (Виннер, Шеннон, Джордж, Йордан, Ляпунов) и современным поколением интеллектуальных систем, которые основаны на парадигме обработки знаний ( ЭС, лингвинистические процессоры, обучающие системы).

Иерархический подход традиционно используется при проектировании сложных систем как прием расчленения формально описанной системы на уровни (блоки, модули). На каждом уровне вводятся свои представления о системе и элементах, продвижение от уровня к уровню имеет строгую направленность (сверху вниз или снизу вверх).

Традиционные методологии структурирования:
  • Структурный (системный) подход или анализ, основанный на идее алгоритмической декомпозиции, где каждый модуль выполняет этап общего процесса,
  • Объектный подход, связанный с декомпозицией и выделением не процессов, а объектов, при этом каждый объект рассматривается как экземпляр определенного класса.

В структурном анализе разработано большое число средств проектирования: диаграммы потоков данных, структурированные словари (тезаурусы), таблицы решений, стрелочные диаграммы, деревья целей, блок-схемы алгоритмов, модели окружения.

Объектно-ориентированный подход основан на следующих элементарных понятиях: объекты, классы как объекты, классификации как средства упорядочения знаний, иерархии с наследованием свойств, средства ограничения доступа, методы для определения функций и отношений.

 Объектно-структурный подход (ОСП) – обобщенный метод структурного анализа и формирования поля знаний.

Основные постулаты заимствованы из ООП и расширены:
  1. Системность – взаимосвязь между понятиями,
  2. Абстрагирование – выявление характеристик понятия, отличающих его от других,
  3. Иерархия – упорядочивание системы абстракций,
  4. Типизация – выделение классов понятий с частичным наследованием свойств,
  5. Модульность – разбиение задачи на подзадачи,
  6. Наглядность и простота нотации.

Сертификация знаний

Объектно-структурный анализ ПО подразумевает восемь страт или слоев:

Слой

Знания

Стратификация знаний (анализ)

S_1

Зачем

Стратегический анализ: назначение и функции системы

S_2

Кто

Организационный: коллектив разработчиков системы

S_3

Что

Концептуальный: понятийная структура

S_4

Как

Функциональный: гипотезы и модели принятия решений

S_5

Где

Пространственный: окружение, оборудование, коммуникации

S_6

Когда

Временной: временные параметры и ограничения

S_7

Почему

Причинно-следственный: подсистема объяснений

S_8

Сколько

Экономический: ресурсы, затраты, прибыль, окупаемость


Алгоритм ОСА

Алгоритм ОСА предназначен для детального структурирования знаний ПО. Алгоритм содержит последовательность аналитических процедур и разделяется на две составляющие:
  • Глобальный (вертикальный) анализ – разбиение ПО на страты,
  • Анализ страт (горизонтальный) – построение многоуровневых структур по отдельным стратам.


ЛЕКЦИЯ 4