Т. А. Гаврилова В. Ф. Хорошевский

Вид материалаРеферат

Содержание


Т еоретическиеаспекты инженериизнаний
3.1. Поле знаний
Поле знаний
3.1.1. О языке описания поля знаний
3.1.2. Семиотическая модель поля знаний
V, образуется либо текст T
3.1.3. «Пирамида» знаний
3.2. Стратегии получения знаний
Извлечение знаний (knowledge elicitation)
Приобретение знаний (knowledge acquisition) —
Подобный материал:
1   2   3   4   5   6   7   8   9   ...   12

Т

еоретические
аспекты инженерии
знаний


d Поле знаний

D Стратегии получения знаний

D Теоретические аспекты извлечения знаний

о Теоретические аспекты структурирования знаний

3.1. Поле знаний

Инженерия знания — достаточно молодое направление искусственного интел-
лекта, появившееся тогда, когда практические разработчики столкнулись с весь-
ма нетривиальными проблемами трудности «добычи» и формализации знаний.
В первых книгах по ИИ эти факты обычно только постулировались, в дальней-
шем начались серьезные исследования по выявлению оптимальных стратегий
выявления знаний [Boose, 1990; Wielinga, Schreiber, Breuker, 1992; Tuthill, 1994;
Adeli, 1994].

Данная глава целиком посвящена теоретическим проблемам инженерии знаний,
другими словами — проектированию баз знаний — получению и структурирова-
нию знаний специалистов для последующей разработки баз знаний. Централь-
ным понятием на стадиях получения и структурирования является так называе-
мое поле знаний, уже упоминавшееся в параграфе 1.3.



Поле знаний — это условное неформальное описание основных понятий и взаимосвя-
зей между понятиями предметной области, выявленных из системы знаний эксперта, в
виде графа, диаграммы, таблицы или текста.

3.1.1. О языке описания поля знаний

Поле знаний Pz формируется на третьей стадии разработки ЭС (см. п. 2.4) — ста-
дии структурирования.

Поле знаний, как первый шаг к формализации, представляет модель .iiiaiinii о
предметной области, в том виде, в каком ее сумел выразить ана.чптпк на некото-

ром «своем» языке. Что это за язык? Известно, что словарь языка конкретной на-
уки формируется путем пополнения общеупотребительного языка специальны-
ми терминами и знаками, которые либо заимствуются из повседневного языка,
либо изобретаются [Кузичева, 1987]. Назовем этот язык L и рассмотрим его же-
лаемые свойства, учитывая, что стандарта этого языка пока не существует, а каж-
дый инженер по знаниям вынужден сам его изобретать.

Во-первых, как и в языке любой науки, в нем должно быть как можно меньше не-
точностей, присущих обыденным языкам. Частично точность достигается более
строгим определением понятий. Идеалом точности, конечно, является язык ма-
тематики. Язык L, видимо, занимает промежуточное положение между есте-
ственным языком и языком математики.

Во-вторых, желательно не использовать в нем терминов иных наук в другом, то
есть новом, смысле. Это вызывает недоразумения.

В-третьих, язык L, видимо, будет либо символьным языком, либо языком графи-
ческим (схемы, рисунки, пиктограммы).

При выборе языка описания поля знаний не следует забывать, что на стадии
формализации необходимо его заменить на машинно-реализуемый язык пред-
ставления знаний
(ЯПЗ), выбор которого зависит от структуры поля знаний.
Существует ряд языков, достаточно универсальных, чтобы претендовать на роль
языка инженерии знаний, — это структурно-логический язык SLL, включающий
аппарат лямбда-конверсии [Вольфенгаген и др., 1979], язык К-систем [Кузнецов,
1989], УСК [Мартынов, 1977] и др. Однако они не нашли широкого применения.
В некотором смысле создание языка L очень близко к идеям разработки универ-
сальных языков науки [Кузичева, 1987]. К XVII веку сложились два подхода в
разработке универсальных языков: создание языков-классификаций и логико-
конструктивных языков.
К первому примыкают проекты, восходящие к идее
Ф. Бэкона, — это языки Вилкинса и Далгарно. Второй подход связан с исследо-
ваниями в рамках поиска универсального метода познания, наиболее четко выс-
казанного Р. Декартом, а затем в проекте универсальной характеристики Г. Лейб-
ница. Именно Лейбниц наметил основные контуры учения о символах, которые
в соответствии с его замыслами в XVIII веке развивал Г. Ламберт, который дал
имя науке «семиотика». Семиотика в основном нашла своих адептов в сфере гу-
манитарных наук. В последнее время сложилась также новая ветвь семиотики -
прикладная семиотика [Pospelov, 1995].

Представители естественных наук еще не до конца осознали достоинства семи-
отики только из-за того, что имеют дело с достаточно простыми и «жесткими»
предметными областями. Им хватает аппарата традиционной математики. В ин-
женерии знаний, однако, мы имеем дело с «мягкими» предметными областями,
где явно не хватает выразительной адекватности классического математичес-
кого аппарата и где большое значение имеет эффективность нотации (ее ком-
пактность, простота модификации, ясность интерпретации, наглядность и т. д.).
В главе 8 рассматриваются современные тенденции в этой области и вводится
понятие систологического инжиниринга, как одного из подходов к семиотичес-
кому моделированию предметной области.


Языки семиотического моделирования [Осипов, 1988; Поспелов, 1986] как есте-
ственное развитие языков ситуационного управления являются, как нам кажет-
ся, первым приближением к языку инженерии знаний. Именно изменчивость и
условность знаков делают семиотическую модель применимой к сложным сфе-
рам реальной человеческой деятельности. Поэтому главное на стадии концептуа-
лизации — сохранение естественной структуры поля знаний, а не выразительные
возможности языка.

Традиционно семиотика включает (рис. 3.1):
  • синтаксис (совокупность правил построения языка или отношения межд>
    знаками);
  • семантику (связь между элементами языка и их значениями или отношения
    между знаками и реальностью);
  • прагматику (отношения между знаками и их пользователями).



Рис. 3.1. Структура семиотики

3.1.2. Семиотическая модель поля знаний

Поле знаний Pz является некоторой семиотической моделью, которая может
быть представлена как граф, рисунок, таблица, диаграмма, формула или текст i
зависимости от вкуса инженера по знаниям и особенностей предметной области

Особенности ПО могут оказать существенное влияние на форму и содержанш
компонентов структуры Pz.








Рассмотрим соответствующие компоненты Pz (рис. 3.2).


Рис. 3.3. Концептуальная составляющая поля знаний





Рис. 3.2. Структура поля знаний

Синтаксис. Обобщенно синтаксическую структуру поля знаний можно предста-
вить как

П-(1,0,М),

где I - структура исходных данных, подлежащих обработке и интерпретации в
экспертной системе;

О - структура выходных данных, то есть результата работы системы;
М - операциональная модель предметной области, на основании которой про-
исходит модификация I в О.

Включение компонентов I и О в Р обусловлено тем, что составляющие и структу-
ра этих интерфейсных компонентов имплицитно (то есть неявно) присутствуют
в модели репрезентации в памяти эксперта. Операциональная модель М может
быть представлена как совокупность концептуальной структуры Sk, отражающей
понятийную структуру предметной области, и функциональной структуры S,, мо-
делирующей схему рассуждений эксперта:

М = (Sk,Sf).

Sk выступает как статическая, неизменная составляющая Р, в то время как Sf пред-
ставляет динамическую, изменяемую составляющую.

Формирование Sk основано на выявлении понятийной структуры предметной
области. Параграф 3.4. описывает достаточно универсальный алгоритм проведе-
ния концептуального анализа на основе модификации парадигмы структурного
анализа [Yourdon, 1989] и построения иерархии понятий (так называемая «пира-
мида знаний»). Пример Sk и Sf представлен на рис. 3.3 и 3.4.


Рис. 3.4. Функциональная составляющая поля знаний


Структура Sf включает понятия предметной области А и моделирует основные
функциональные связи RA или отношения между понятиями, образующими Sk.
Эти связи отражают модель или стратегию принятия решения в выбранной ПО.
Таким образом Sf образует стратегическую составляющую М.
Семантика. Семантика, придающая определенное значение предложениям любо-
го формального языка, определяется на некоторой области. Фактически это на-
бор правил интерпретации предложений и формул языка. Семантика L должна
быть композиционной, то есть значение предложения определяется как функция
значений его составляющих.

Семантика языка L зависит от особенностей предметной области, она обладает
свойством полиморфизма, то есть одни и те же операторы языка в разных зада-
чах могут иметь свои особенности.

Семантику поля знаний Pz можно рассматривать на двух уровнях. На первом
уровне P'Zg есть семантическая модель знаний эксперта i о некоторой предметной
области Og. На втором уровне любое поле знаний Pz является моделью некоторых
знаний, и, следовательно, можно говорить о смысле его как некоторого зеркала
действительности. Рассматривать первый уровень в отрыве от конкретной облас-
ти нецелесообразно, поэтому остановимся подробнее на втором.
Схему, отображающую отношения между реальной действительностью и полем
знаний, можно представить так, как показано на рис. 3.5.



Рис. 3.5. «Испорченный телефон» при формировании поля знаний

Как следует из рисунка, поле P'JZfi — это результат, полученный «после 4-й транс-
ляции» (если говорить на языке информатики).

• 1-я трансляция (1) — это восприятие и интерпретация действительности О
предметной области gi-м экспертом. В результате /, в памяти эксперта образу-
ется модель My как семантическая репрезентация действительности и его лич-
ного опыта по работе с ней.


  • 2-я трансляция (V, ) — это вербализация опыта i-ro эксперта, когда он пытает-
    ся объяснить свои рассуждения 5, и передать свои знания Z, инженеру по зна-
    ниям. В результате V, образуется либо текст Tjt либо речевое сообщение Ct
  • 3-я трансляция (Ij) — это восприятие и интерпретация сообщений Т: или Ct j-м
    инженером по знаниям. В результате в памяти инженера по знаниям образует-
    ся модель мира Ма.
  • 4-я трансляция (Kj) — это кодирование и вербализация модели Mffl. в форме
    поля знаний P'JZg.

Более всего эта схема напоминает детскую игру в «испорченный телефон»; перед
инженером по знаниям стоит труднейшая задача — добиться максимального со-
ответствия Mgi и P'JZg. У читателей не должно возникать иллюзий, что Pzg отобра-
жает Og. Ни в коем случае, ведь знания — вещь сугубо авторизованная, следовало
бы на каждой ЭС ставить четкий ярлык i-j, то есть «база знаний эксперта i в пони-
мании инженера по знаниям]». Стоит заменить, например, инженера по знаниям
j на h, и получится совсем другая картина.

Пример 3.1

Приведем пример влияния субъективных взглядов эксперта на М и V,. Реаль-
ность (Ок): два человека прибегают на вокзал за 2 минуты до отхода поезда. В кассы —
очередь. В автоматических кассах свободно, но ни у того, ни у другого нет мелочи. Сле-
дующий поезд через 40 минут. Оба опаздывают на важную встречу.

Интерпретация 1-го эксперта (I,): нельзя приходить на вокзал менее чем за 10 минут.
Интерпретация 2-го эксперта (12): надо всегда иметь мелочь в кармане.

Вербализация 1-го эксперта (V,): опоздал к нужному поезду, так как не рассчитал
время.

Вербализация 2-го эксперта (V2): опоздал, так как на вокзале неразбериха, в кассах
толпа.

Последующие трансляции еще больше будут искажать и видоизменять модель, но те-
перь уже с учетом субъективного восприятия инженеров по знаниям.

Таким образом, если считать поле знаний смысловой (семантической) моделью пред-
метной области, то эта модель дважды субъективна. И если модель mk! (см. рис. 3.5) —
это усеченное отображение Og, то само Pz — лишь отблеск Mgi через призму \Л и М.

Прагматика. В качестве прагматической составляющей семиотической модели
следует рассматривать технологии проведения структурного анализа ПО, поль-
зуясь которым инженер по знаниям может сформировать Pz по результатам ста-
дии извлечения знаний.

Таким образом, под прагматикой будем понимать практические аспекты разра-
ботки и использования поля, то есть как от хаоса черновиков и стенограмм сеан-
сов извлечения знаний перейти к стройной или хотя бы ясной модели.

Подробнее эти вопросы освещены в параграфах 3.4. и 4.4. Однако поле знаний,
несмотря на все старания инженера по знаниям и эксперта, всегда будут лишь
бледным отпечатком реально существующей предметной области, ведь окружа-
ющий нас мир так изменчив, сложен и многообразен, а то, что хранится в нашем
сознании, так плохо поддается вербализации. Тем не менее с точки зрения науч-

ной методологии без продуманного, четкого и красивого поля знаний не может
идти и речи о создании базы знаний промышленной ЭС.

3.1.3. «Пирамида» знаний

Иерархичность понятийной структуры сознания подчеркивается в работах мно-
гих психологов [Брунер, 1971; Веккер, 1976]. Поле знаний можно стратифициро-
вать, то есть рассматривать на различных уровнях абстракции понятий. В «пира-
миде знаний» каждый следующий уровень служит для восхождения на новую
ступень обобщения и углубления знаний в предметной области. Таким образом,
возможно наличие нескольких уровней понятийной структуры Sk
Представляется целесообразным связать это с глубиной профессионального опы-
та (например, как в системе АВТАНТЕСТ [Гаврилова, Червинская, 1992]) или с
уровнем иерархии в структурной лестнице организации (рис. 4.12 главы 4).
Естественно, что и стратегии принятия решений, то есть функциональные струк-
туры Sf, на различных уровнях будут существенно отличаться.
Если попытаться дать математическую интерпретацию уровней пирамиды зна-
ний U = (U,, U2, U3 ,..., Un ), то наиболее прозрачным является понятие гомомор-
физма —
отображения некоторой системы Е, сохраняющего основные операции и
основные отношения этой системы.
Пусть


3.2. Стратегии получения знаний

При формировании поля знаний ключевым вопросом является сам процесс по-
лучения знаний, когда происходит перенос компетентности экспертов на инже-
неров по знаниям. Для названия этого процесса в литературе по ЭС получило
распространение несколько терминов: приобретение, добыча, извлечение, полу-
чение, выявление, формирование знаний. В англоязычной специальной литера-
туре в основном используются два: acquisition (приобретение) и elicitation (вы-
явление, извлечение, установление).

Термин «приобретение» трактуется либо очень широко — тогда он включает
весь процесс передачи знаний от эксперта к базе знаний ЭС, либо уже как способ
автоматизированного построения базы знаний посредством диалога эксперта и
специальной программы (при этом структура поля знаний заранее закладывает-
ся в программу). В обоих случаях термин «приобретение» не касается самого та-
инства экстрагирования структуры знаний из потока информации о предметной
области. Этот процесс описывается понятием «извлечение».
Авторы склонны использовать этот термин как более емкий и более точно выра-
жающий смысл процедуры переноса компетентности эксперта через инженера по
знаниям в базу знаний ЭС.





некоторая система с основными понятиями о,, i 6 I и основными отношениями г;

J6J.

Гомоморфизмом системы Е в однотипную ей систему Е':



называется отображение

1

удовлетворяющее следующим двум условиям:





Для всех элементовиз Е и всех i I, jJ.

Согласно введенным обозначениям уровни пирамиды суть гомоморфизмы моде-
лей (то есть понятий и отношений) предметной области



— мета-понятия, или понятия более высокого
уровня абстракции; R' — мета-отношения;- мета-стратегии.
Восходя по ступеням пирамиды, мы получаем систему гомоморфизмов, что со-
ответствует результатам, полученным в когнитивной психологии об уменьше-
нии размерности семантического пространства памяти с увеличением опыта эк-
спертов.



Извлечение знаний (knowledge elicitation) — это процедура взаимодействия эксперта с
источником знаний, в результате которой становятся явными процесс рассуждений спе-
циалистов при принятии решения и структура их представлений о предметной области.

В настоящее время большинство разработчиков ЭС отмечает, что процесс извле-
чения знаний
остается самым «узким» местом при построении промышленных ЭС.
При этом им приходится практически самостоятельно разрабатывать методы из-
влечения, сталкиваясь со следующими трудностями [Gaines, 1989]:
  • организационные неувязки;
  • неудачный метод извлечения, не совпадающий со структурой знаний в данной
    области;



  • неадекватная модель (язык) для представления знаний.
    Можно добавить к этому [Гаврилова, Червинская, 1992]:
  • неумение наладить контакт с экспертом;
  • терминологический разнобой;



  • отсутствие целостной системы знаний в результате извлечения только «фраг-
    ментов»;
  • упрощение «картины мира» эксперта и др.

Процесс извлечения знаний — это длительная и трудоемкая процедура, в кото-
рой инженеру по знаниям, вооруженному специальными знаниями по когнитив-
ной психологии, системному анализу, математической логике и пр., необходимо
воссоздать модель предметной области, которой пользуются эксперты для при-


нятия решения. Часто начинающие разработчики ЭС, желая упростить эту про-
цедуру, пытаются подменить инженера по знаниям самим экспертом. По многим
причинам это нежелательно.

Во-первых, большая часть знаний эксперта — это результат многочисленных на-
слоений, ступеней опыта. И часто, зная, что из А следует В, эксперт не отдает себе
отчета, что цепочка его рассуждений была гораздо длиннее, например А —> D —¥
С
-»В или А -> Q -> R -> В.

Во-вторых, как было известно еще Платону, мышление диалогично. И поэтому
диалог инженера по знаниям и эксперта — наиболее естественная форма изуче-
ния лабиринтов памяти эксперта, в которых хранятся знания, частью носящие
невербальный характер, то есть выраженные не в форме слов, а в форме нагляд-
ных образов, например. И именно в процессе объяснения инженеру по знаниям
эксперт на эти размытые ассоциативные образы надевает четкие словесные яр-
лыки, то есть вербализует знания.

В-третьих, эксперту труднее создать модель предметной области вследствие глу-
бины и объема информации, которой он владеет. Еще в ситуационном управле-
нии [Поспелов, 1986] было выявлено: объекты реального мира связаны более чем
200 типами отношений (временные, пространственные, причинно-следственные,
типа «часть—целое» и др.). Эти отношения и связи предметной области образуют
сложную систему, из которой выделить «скелет» или главную структуру иногда
доступнее аналитику, владеющему к тому же системной методологией.
Термин «приобретение» в рамках данного учебника оставлен за автомати-
зированными системами прямого общения с экспертом. Они действительно
непосредственно приобретают уже готовые фрагменты знаний в соответствии
со структурами, заложенными разработчиками систем. Большинство этих ин-
струментальных средств специально ориентировано на конкретные ЭС с жестко
обозначенной предметной областью и моделью представления знаний, то есть не
являются универсальными.



Приобретение знаний (knowledge acquisition) — процесс наполнения базы знаний экс-
пертом с использованием специализированных программных средств.

Например, система TEIRESIAS [Davis, 1982], ставшая прародительницей всех
инструментариев для приобретения знаний, предназначена для пополнения базы
знаний системы MYCIN или ее дочерних ветвей, построенных на «оболочке»
EMYCIN [Shortliffe, 1976] в области медицинской диагностики с использованием
продукционной модели представления знаний. Три поколения и основные тен-
денции СПЗ будут подробно описаны в параграфе 4.5. Более современные конк-
ретные системы описаны далее в параграфе 4.6.

Термин формирование знаний традиционно закрепился за чрезвычайно перспек-
тивной и активно развивающейся областью инженерии знаний, которая занима-
ется разработкой моделей, методов и алгоритмов обучения. Она включает индук-
тивные модели формирования знаний и автоматического порождения гипотез,
например ДСМ-метод [Аншаков, Скворцов, Финн, 1986] на основе обучающих
выборок, обучение по аналогии и другие методы. Эти модели позволяют выявить


причинно-следственные эмпирические зависимости в базах данных с неполной
информацией, содержащих структурированные числовые и символьные объекты
(часто в условиях неполноты информации).



формирование знаний (machine learning) — процесс анализа данных и выявление
скрытых закономерностей с использованием специального математического аппарата
и программных средств.

Традиционно к задачам формирования знаний или машинного обучения отно-
сятся задачи прогнозирования, идентификация (синтеза) функций, расшифров-
ки языков, индуктивного вывода и синтеза с дополнительной информацией
[Епифанов, 1984]. В широком смысле к обучению по примерам можно отнести и
методы обучения распознаванию образов [Аткинсон, 1989; Schwartz, 1988].
Индуктивный вывод правил из фактов применен также в системах AQ,
AQUINAS, KSSI, INSTIL и некоторых других.

Наиболее продвинутыми среди методов машинного обучения являются, по-ви-
димому, методы распознавания образов, в частности, алгебраический подход, в
котором предусматривается обогащение исходных эвристических алгоритмов с
помощью алгебраических операций и построение семейства алгоритмов, гаран-
тирующего получение корректного алгоритма для решения изучаемого класса
задач, то есть алгоритма, правильно классифицирующего конечную выборку по
всем классам [Берков, 1972]. Однако применение методов формирования зна-
ний пока не стало промышленной технологией разработки баз знаний.
Для того чтобы эти методы стали элементами технологии интеллектуальных си-
стем, необходимо решить ряд задач [Осипов, 1997]:
  • обеспечить механизм сопряжения независимо созданных баз данных, имею-
    щих различные схемы, с базами знаний интеллектуальных систем;
  • установить соответствие между набором полей базы данных и множеством
    элементов декларативной компоненты базы знаний;
  • выполнить преобразование результата работы алгоритма обучения в способ
    представления, поддерживаемый программными средствами интеллектуаль-
    ной системы.

Помимо перечисленных существуют также и другие стратегии получения
знаний, например, в случае обучения на примерах (case-based reasoning), ког-
да источник знаний — это множество примеров предметной области [Оси-
пов, 1997; Попов, Фоминых, Кисель, 1996]. Обучение на основе примеров
(прецедентов) включает настройку алгоритма распознавания на задачу по-
средством предъявления примеров, классификация которых известна [Ибер-
ла, 1980].

Обучение на примерах тесно связано с машинным обучением. Различие заключа-
ется в том, что результат обучения в рассматриваемом здесь случае должен
быть интерпретирован в некоторой модели, в которой, возможно, уже содержатся
факты и закономерности предметной области, и преобразован в способ представ-

дения, который допускает использование результата обучения в базе знаний, для
моделирования рассуждений, для работы механизма объяснения и т. д., то есть
делает результат обучения элементом соответствующей технологии.

Например, в системе INDUCE [Коов и др., 1988] порождается непротиворечивое
эписание некоторого класса объектов по множествам примеров и контр-приме-
ров данного класса. В качестве языка представления используется язык перемен-
но-значной логики первого порядка (вариант языка многозначной логики перво-
го порядка).

Следует отметить также появление двух новых «флагов» в стане сторонников
методов машинного обучения — это data mining и knowledge discovery. Оба подхо-
ца базируются на анализе данных и поиске закономерностей.

Таким образом, можно выделить три основные стратегии проведения стадии по-
лучения знаний при разработке ЭС (рис. 3.6).
  1. С использованием ЭВМ при наличии подходящего программного инструмен-
    тария, иначе приобретение знаний.
  2. С использованием программ обучения при наличии репрезентативной (то есть
    достаточно представительной) выборки примеров принятия решений в пред-
    метной области и соответствующих пакетов прикладных программ, иначе фор-
    мирование
    знаний.
  3. Без использования вычислительной техники путем непосредственного контак-
    та инженера по знаниям и источника знаний (будь то эксперт, специальная
    литература или другие источники), иначе извлечение знаний.



Рис. 3.6. Стратегии получения знаний

3 учебнике подробно будут рассматриваться процессы извлечения и приобрете-
1ия знаний, так как на современном этапе разработки ЭС эти стратегии являются
наиболее эффективными и перспективными. Формирование знаний, тяготеющее
» большей степени к области machine learning, то есть индуктивному обучению,
зсновываясь на хорошо исследованном аппарате распознавания образов [Гаек,
Гавранек, 1983] и обнаружения сходства объектов [Гусакова, Финн, 1987], выхо-
шт за рамки данного учебника. Также вне этой книги остались вопросы форми-
ювания знаний из данных (data mining, knowledge discovery) и др.