Т. А. Гаврилова В. Ф. Хорошевский
Вид материала | Реферат |
- Исследование в 11 классе учителей 1 категории моу «Янгличская сош имени Героя, 80.18kb.
- О. Я. Чекановой заместителя директора Департамента образования атмр, 2067.1kb.
- Н. В. Гаврилова, А. Л. Гусев*, В. И. Кудряш**,, 438.44kb.
- О. Т. Гаврилова, 132.3kb.
- Автор: Гаврилова Ольга Викторовна, 14.56kb.
- Возможные альтернативы, 3457.5kb.
- Семенова Марія Іванівна диплом, 75.73kb.
- Интеграция wiki-технологии и онтологического моделирования в задаче управления знаниями, 110.21kb.
- Липецка Игнатова Елена Юрьевна. Тема реферат, 27.71kb.
- К. В. Самсонова, ст гр. Фк-08-1, Н. В. Гаврилова, викл, 156.11kb.
3.3. Теоретические аспекты извлечения
знаний
Поскольку основной проблемой инженерии знаний является процесс извлечения
знаний, инженеру по знаниям необходимо четко понимать природу и особеннос-
ти этих процессов. Для того чтобы разобраться в природе извлечения знаний,
выделим три основных аспекта этой процедуры (рис. 3.7):
А = (А1, А2, A3} = {психологический, лингвистический, гносеологический}.
Рис. 3.7. Теоретические аспекты инженерии знаний
3.3.1. Психологический аспект
Из трех аспектов извлечения знаний психологический — А1 — является ведущим,
поскольку он определяет успешность и эффективность взаимодействия инжене-
ра по знаниям (аналитика) с основным источником знаний — экспертом-профес-
сионалом. Психологический аспект выделяется еще и потому, что извлечение
знаний происходит чаще всего в процессе непосредственного общения разработ-
чиков системы. А в общении психология является доминантной.
Общение, или коммуникация (от лат. communicatio — связь), — это междисцип-
линарное понятие, обозначающее все формы непосредственных контактов между
людьми — от дружеских до деловых. Оно широко исследуется в психологии, фи-
лософии, социологии, этологии, лингвистике, семиотике и других науках. Суще-
ствует несколько десятков теорий общения, и единственное, в чем сходятся все
авторы, — это сложность, многоплановость процедуры общения. Подчеркивает-
ся, что общение — не просто однонаправленный процесс передачи сообщений и
не двухтактный обмен порциями сведений, а нерасчлененный процесс циркуля-
ции информации, то есть совместный поиск истины [Каган, 1988] (рис. 3.8).
Итак, общение есть процесс выработки новой информации, общей для общаю-
щихся людей и рождающей их общность. И хотя общение — первый вид деятель-
ности, которым овладевает человек в онтогенезе, по-настоящему владеют куль-
турой и наукой общения единицы.
Неправильная схема | | Эксперт | | Инженер по знаниям I |
1 Правильная схема | Эксперт | • | Инженер по знаниям |
Рис. 3.8. Структура процесса общения
Можно выделить четыре основных уровня общения [Саратовский, 1980].
- Уровень манипулирования, когда один субъект рассматривает другого как сред-
ство или помеху по отношению к проекту своей деятельности.
- Уровень «рефлексивной игры», когда в процессе своей деятельности человек
учитывает «контрпроект» другого субъекта, но не признает за ним самоцен-
ность и стремится к «выигрышу», к реализации своего проекта.
- Уровень правового общения, когда субъекты признают право на существова-
ние проектов деятельности друг друга и пытаются согласовать их хотя бы вне-
шне.
- Уровень нравственного общения, когда субъекты внутренне принимают общий
проект взаимной деятельности.
Стремление и умение общаться на высшем, четвертом, уровне может характе-
ризовать степень профессионализма инженера по знаниям. Извлечение зна-
ний — это особый вид общения, который можно отнести к духовно-информа-
ционному типу. Согласно работе [Каган, 1988] общение делится на мате-
риально-практическое; духовно-информационное; практически-духовное. При
этом информационный аспект общения для инженера по знаниям с прагмати-
ческой точки зрения важнейший.
И
Рис. 3.9. Потери информации при разговорном общении
звестно, что потери информации при разговорном общении велики [Мицич,
1987] (рис. 3.9).
В связи с этим рассмотрим проблему увеличения информативности общения
аналитика и эксперта за счет использования психологических знаний.
Можно выделить такие структурные компоненты модели общения при извлече-
нии знаний:
- участники общения (партнеры);
- средства общения (процедура);
- предмет общения (знания).
В соответствии с этой структурой выделим три «слоя» психологических проблем,
возникающих при извлечении знаний (рис. 3.10):
Al = (Sll, S12, S13 } = (контактный, процедурный, когнитивный}.
| S11 Контактный слой |
S12 Процедурный слой | |
S13 Когнитивный слой |
Рис. 3.10. Психологический аспект извлечения знаний
Контактный слой (S11)
Практически все психологи отмечают, что на любой коллективный процесс вли-
яет атмосфера, возникающая в группе участников. Существуют эксперименты,
результаты которых неоспоримо говорят, что часто дружеская атмосфера в кол-
лективе больше влияет на результат, чем индивидуальные способности отдель-
ных членов группы [Немов, 1984]. Особенно важно, чтобы в коллективе раз-
работчиков складывались кооперативные, а не конкурентные отношения. Для
кооперации характерна атмосфера сотрудничества, взаимопомощи, заинтере<
ванности в успехах друг друга, то есть уровень нравственного общения, а для о'
ношений конкурентного типа - атмосфера индивидуализма и межличностного
соперничества (более низкий уровень общения).
В настоящее время прогнозировать совместимость в общении со 100%-й гаран-
тией невозможно. Однако можно выделить ряд факторов и черт личности, ха-
рактера и других особенностей участников общения, несомненно, оказываю-
щих влияние на эффективность процедуры.
Разработка проблематики контактного слоя позволила выявить следующие па-
раметры партнеров, влияющие на результаты процедуры извлечения знаний:
311 = {sll_i} = {пол, возраст, личность, темперамент, мотивация и др.}, часть из
которых впоследствии вошли в формирование модели пользователя.
Значения параметров пола (sll_l) и возраста (sll_2) хотя и влияют на эффек-
тивность контакта, но не являются критическими. В литературе [Иванов, 1986]
этмечается, что хорошие результаты дают гетерогенные пары (мужчина/женщи-
на) и соотношение:
20 > (В, - Ва) > 5,
где Вэ — возраст эксперта; Ва — возраст аналитика.
Под личностью (sll_3) обычно понимается устойчивая система психологичес?
;<их черт, характеризующая индивидуальность человека. Рекомендуемые компо-
ненты si 1_3 исследованы в работе [Гаврилова, 1990] и дополнены качествами из
руководства для журналистов в работе [Schouksmith G., 1978]. si 1_3 = (доброже-
лательность, аналитичность, хорошая память, внимание, наблюдательность, во-
Ьбражение, впечатлительность, большая собранность, настойчивость, общитель-
ность, находчивость).
Со времен Галена и Гиппократа, выделивших четыре классических типа темпе-
эамента (sll_4), вошли в научную терминологию понятия
jll_4= (холерик, сангвиник, меланхолик, флегматик).
Известно, что флегматики и меланхолики медленнее усваивают информацию
"Лунева, Хорошилова, 1987]. И для обеспечения психологического контакта с
ними не следует задавать беседе слишком быстрый темп, торопить их с ответом.
Зато они гораздо лучше усваивают новое, в отличие от холериков, для которых
1войственно поверхностное усваивание информации. Последних следует специ-
шьно наводить на размышление и рефлексию. У меланхоликов часто занижена
тмооценка, они застенчивы и в беседе их надо подбадривать. Таким образом,
ааиболее успешными в рамках слоя S11 являются сангвиники и холерики.
Ла эффективность коллективного решения задач влияет также и мотивация
isll_5), то есть стремление к успеху. Инженер по знаниям в зависимости от ус-
ловий разработки должен изыскивать разнообразные стимулы для экспертов
}включая, разумеется, и материальные). Эксперт передает аналитику один из са-
ных дорогих в мире продуктов — знания. И если одни люди делятся опытом доб-
эовольно и с удовольствием, то другие весьма неохотно приоткрывают свои про-
бессиональные тайны. Иногда полезно оказывается возбудить в эксперте дух
эоперничества, конкуренции (не нарушая, естественно, обстановки кооператив-
посте в коллективе).
Процедурный слой (S12)
параметры процедурного слоя S12 описывают непосредственно процесс прове-
дения процедуры извлечения знаний. Фактически это профессиональные пара-
аетры:
112 = {s!2_i} = {ситуация общения (место, время, продолжительность); оборудо-
вание (вспомогательные средства, освещенность, мебель); профессиональные
рриемы (темп, стиль, методы и др.)}.
Инженер по знаниям, успешно овладевший наукой установления атмосферы до-
верия и взаимопонимания с экспертом (контактный слой — S11), должен еще су-
меть воспользоваться благоприятным воздействием этой атмосферы. Проблема
процедурного слоя касается проведения самой процедуры извлечения знаний.
Здесь мало проницательности и обаяния, полезных для решения проблемы кон-
такта, тут необходимы профессиональные знания.
Остановимся на общих закономерностях проведения процедуры.
s!2_l — ситуация общения определяется следующими компонентами:
- s!2_l_l — место проведения сеансов;
- s!2_l_2 — продолжительность проведения сеансов;
- s!2_l_3 — время проведения сеансов.
Беседу с экспертом лучше всего проводить в небольшом помещении наедине
(s!2_l_l: место), поскольку посторонние люди нарушают доверительность бесе-
ды и могут породить эффект «фасада». Рабочее место эксперта является не са-
мым оптимальным вариантом, так как его могут отвлекать телефонные звонки,
сотрудники и пр. Атмосфера замкнутого пространства и уединенности положи-
тельно влияет на эффективность.
Американский психолог И. Атватер считает, что для делового общения наиболее
благоприятная дистанция от 1,2 до 3 метров [Schouksmith, 1978]. Минимальным
«комфортным» расстоянием можно считать 0,7-0,8 метра.
Реконструкция собственных рассуждений — трудоемкий процесс, и поэтому
длительность одного сеанса (s!2_l_2: продолжительность) обычно не превыша-
ет 1,5-2 часа. Эти два часа лучше выбрать в первой половине дня, например с 10
до 12 часов, если эксперт типа «жаворонок» (s!2_l_3: время). Известно, что вза-
имная утомляемость партнеров при беседе наступает обычно через 20—25 минут
[Ноэль, 1978], поэтому в сеансе нужны паузы.
s!2_2 — оборудование включает:
- s!2_2_l — вспомогательные средства;
- s!2_2_2 — освещенность;
- s!2_2_3 - мебель.
Вспомогательные средства (s!2_2_l):
- средства для увеличения эффективности самого процесса извлечения знаний;
- средства для протоколирования результатов.
К средствам для увеличения эффективности процесса извлечения знаний прежде
всего относится наглядный материал. Независимо от метода извлечения (см. гла-
ву 4), выбранного в конкретной ситуации, его реализация возможна разными спо-
собами. Например, можно учитывать следующий фактор: широко известно, что
людей, занимающихся интеллектуальной деятельностью, можно отнести к худо-
жественному либо мыслительному типу. Термины тут условны и не имеют отно-
шения к той деятельности, которую традиционно называют художественной или
мыслительной. Важно, что, определив тип эксперта, инженер по знаниям может
плодотворнее использовать любой из методов извлечения, зная, что люди худо-
жественного типа легче воспринимают зрительную информацию в форме рисун-
ков, графиков, диаграмм, так как эта информация воспринимается через первую
сигнальную систему. Напротив, эксперты мыслительного типа лучше понимают
язык формул и текстовую информацию. При этом учитывается факт, что боль-
шую часть информации человек получает от зрения. Совет пользоваться актив-
нее наглядным материалом из работы [Хейес—Рот, Уотермена, Ленат, 1987]
можно считать универсальным. Такие методы, как свободный диалог и игры, пре-
доставляют богатые возможности использовать слайды, чертежи, рисунки.
Для протоколирования результатов в настоящее время используются следую-
щие способы:
- запись на бумагу непосредственно по ходу беседы (недостатки — это часто ме-
шает беседе, кроме того, трудно успеть записать все, даже при наличии навы-
ков стенографии);
- магнитофонная запись (диктофон), помогающая аналитику проанализиро-
вать весь ход сеанса и свои ошибки (недостаток — может сковывать эксперта);
- запоминание с последующей записью после беседы (недостаток — годится
только для аналитиков с блестящей памятью).
Наиболее распространенным способом на сегодня является первый. При этом
наибблыпая опасность тут — потеря знаний, поскольку любая запись ответов -
это уже интерпретация, то есть привнесение субъективного понимания предмета.
Значения параметров освещенности (s!2_2_2) и мебели (s!2_2_3) очевидны и
связаны с влиянием внешних факторов на эксперта.
s!2_3 — профессиональные приемы аналитика, включают, в частности:
- s!2_3_l - темп;
- s!2_3_2 - стиль;
- s!2_3_3 — методы.
Учет индивидуального темпа (s!2_3_l) и стиля (s!2_3_2) эксперта позволяет
аналитику снизить напряженность процедуры извлечения знаний. Типичной
ошибкой является навязывание собственных темпа и стиля.
На успешность также влияет длина фраз, которые произносит инженер по зна-
ниям. Этот факт был установлен американскими учеными — лингвистом Ингве
и психологом Миллером при проведении исследования о причинах низкой усво-
яемости команд на Военно-морском флоте США [Gammack, Young, 1985].
Причина была в длине команд. Оказалось, что человек лучше всего воспринимает
предложения глубиной (или длиной) 7+2(-2) слова. Это число (7±2) получило
название число Ингве—Миллера. Можно считать его мерой «разговорности»
речи. Опытные лекторы используют в лекции в основном короткие фразы, умень-
шая потерю информации с 20-30 % (у плохих лекторов) до 3-4 % [Горелов, 1987].
Большая часть информации поступает к инженеру по знаниям в форме предло-
жений на естественном языке. Однако внешняя речь эксперта естевоспроизведе-
ние его внутренней речи (мышления), которая гораздо богаче и многообразнее.
При этом для передачи этой внутренней речи эксперт использует и невербаль-
ные средства, такие как интонация, мимика, жесты. Опытный инженер по знани-
ям старается записывать по возможности в протоколы (в форме ремарок) эту до-
полнительную интонацию.
В целом, невербальная компонента стиля общения важна и для проблем контакт-
ного слоя при установлении контакта, когда по отдельным жестам и выражению
лица эксперта инженер по знаниям может установить границу возможной «дру-
жественности» общения.
Значение параметра методов (s!2_3_3) подробно рассмотрено в следующей
главе, исходя из позиции, что метод должен подходить к эксперту как «ключ к
замку».
Когнитивный слой (S13)
Когнитивные (от англ, cognition — познание) науки исследуют познавательные
процессы человека с позиций возможности их моделирования (психология, ней-
рофизиология, эргономика, инженерия знаний). Наименее исследованы на сегод-
няшний день проблемы когнитивного слоя S13, связанные с изучением семанти-
ческого пространства памяти эксперта и реконструкцией его понятийной струк-
туры и модели рассуждений.
Основными факторами, влияющими на когнитивную адекватность, будут:
S13 = {s!3_i} = {когнитивный стиль, семантическая репрезентативность поля зна-
ний и концептуальной модели}.
Под когнитивным стилем (s!3_l) человека понимается совокупность критериев
предпочтения при решении задач и познании мира, специфическая для каждого
человека. Когнитивный стиль определяет не столько эффективность деятельно-
сти, сколько способ достижения результата [Алахвердов, 1986]. Это способ по-
знания, который позволяет людям с разными способностями добиваться оди-
наковых результатов в деятельности. Это система средств и индивидуальных
приемов, к которым прибегает человек для организации своей деятельности.
Инженеру по знаниям полезно изучить и прогнозировать свой когнитивный
стиль, а также стиль эксперта. Особенно важны такие характеристики когнитив-
ного стиля, как:
- s!3_l_l — (полезависимость — поленезависимость);
- s!3_l_2 — (импульсивность — рефлективность (рефлексивность);
- s!3_l_3 — (ригидность — гибкость);
- S13_l_4 — (когнитивная эквивалентность).
s!3_l_l. Поленезависимость позволяет человеку акцентировать внимание лишь
на тех аспектах проблемы, которые необходимы для решения конкретной зада-
чи, и уметь отбрасывать все лишнее, то есть не зависеть от фона или окружаю-
щего задачу шумового поля. Эта характеристика коррелирует с такими чертами
личности, как невербальный интеллект, аналитичность мышления, способность
к пониманию сути. Очевидно, что помимо того, что самому аналитику необходи-
мо иметь высокое значение параметра s!3_l_l, пдденезависимый эксперт — это
тоже желательный фактор. Однако приходится учитывать, что больше нуждают-
ся в общении полезависимые люди, а потому они и более контактны [Орехов,
1985].
Особенно полезны для общения гетерогенные (смешанные) пары, например «по-
лезависимый — поленезависимый» [Иванов, 1986]. В литературе описаны раз-
личные эксперименты, моделирующие общение, требующее понимания и совмест-
ной деятельности. Наиболее успешным в понимании оказались поленезависимые
испытуемые (92 % успеха), для сравнения полезависимые давали 56 % успеха
[Кулюткин, Сухобская, 1971].
!Для совместной профессиональной деятельности важна также гибкость когни-
тивной организации, которая связана с поленезависимостью. Итак, большую
: способность к адекватному пониманию партнера демонстрируют субъекты с вы-
: сокой психологической дифференциацией, то есть поленезависимостью.
Поленезависимость является одной из характерных профессиональных черт ког-
шитивного стиля наиболее квалифицированных инженеров по знаниям. По неко-
торым результатам [Алахвердов, 1986] мужчины более поленезависимы, чем жен-
пцины.
is!3_l_2. Под импульсивностью понимается быстрое принятие решения (часто
)без его достаточного обоснования), а под рефлексивностью — склонность к рас-
судительности. Рефлексивность по экспериментальным данным коррелирует со
способностью к формирования понятий и продуктивностью стратегий решения
шогических задач [Кулюткин, Сухобская, 1971]. Таким образом, и инженеру по
знаниям, и эксперту желательно быть рефлексивным, хотя собственный стиль
изменяется лишь частично и с большим напряжением.
jsl3_l_3. Ригидность — гибкость характеризует способность человека к измене-
шию установок и точек зрения в соответствии с изменяющейся ситуацией. Ригид-
шые люди не склонны менять свои представления и структуру восприятия, напро-
чгив, гибкие легко приспосабливаются к новой обстановке. Очевидно, что если
шксперт еще может себе позволить ригидность (что характерно для долго работа-
оющих над одной проблемой специалистов, особенно старшего возраста), то для
шнженера по знаниям эта характеристика когнитивного стиля явно противопо-
казана. Увеличение ригидности с возрастом отмечается многими психологами
Кулюткин, Сухобская, 1971; Орехов, 1985].
ifc!3_l_4. Когнитивная эквивалентность характеризует способность человека к
различению понятий и разбиению их на классы и подклассы. Чем уже диапазон
скогнитивной эквивалентности, тем более тонкую классификацию способен про-
1вести индивид, тем большее количество признаков понятий он может выделить.
ЭЭбычно у женщин диапазон когнитивной эквивалентности уже, чем у мужчин.
Семантическая репрезентативность (s!3_2) подразумевает подход, исключающий
•ррадиционное навязывание эксперту некой модели представлений (например,
фродукционной или фреймовой), и заставляет инженера по знаниям последова-
тельно воссоздавать модель мира эксперта, используя как неформальные методы,
так и математический аппарат, например многомерное шкалирование (см. главу
4). Проблема семантической репрезентативности ориентирована на достижение
когнитивной адекватности поля знаний и концептуальной модели. В настоящий
момент она может быть сформулирована как проблема «испорченного телефона»
[Гаврнлова, Червинская, 1992] (см. рис. 3.5) — возможные трансформации и по-
тери в цепи передачи информации:
(О,: предметная область или реальный мир) —>
/7,: интерпретация г-го эксперта]'—»
(Mgt: модель мира эксперта) —>
[V? вербализация модели мира эксперта] —>
(Ti & Ci: вербальные и невербальные сообщения г-го эксперта j- му аналитику) ->
[I: их интерпретация j-ым аналитиком]-*
(Mg: модель мира j-го аналитика) —>
[К: кодирование при формировании поля знаний с последующей структуризацией
в концептуальную модель].
Круглые скобки определяют понятия, квадратные — процессы.
3.3.2. Лингвистический аспект
Лингвистический (А2) аспект касается исследований языковых проблем, так как
язык — это основное средство общения в процессе извлечения знаний.
Сразу же следует оговорить, что поскольку тема данной книги ограничена изло-
жением теории и технологии инженерии знаний, то область разработки есте-
ственно-языковых интерфейсов и весь спектр проблем, связанных с ней — лекси-
ческих, синтаксических, семантических, прагматических и т. д. [Виноград, 1976;
Мальковский, 1985; Попов, 1982], — не рассматривается.
В инженерии знаний можно выделить три слоя лингвистических проблем
(рис. 3.11):
А2 = {S21, S22, 523} - («общий код», понятийная структура, словарь пользова-
теля}.
| S21 «Общий код» |
S22 Понятийная структура | |
S23 Словарь пользователя |
Рис. 3.11. Лингвистический аспект извлечения знаний
«Общий код» (S21)
«Общий код» решает проблему языковых ножниц между профессиональной тер-
минологией эксперта и обыденной литературной речью инженера по знаниям и
включает следующие компоненты:
521 = {s21_i} = (общенаучная терминология; специальные понятия из профессио-
нальной литературы; элементы бытового языка; неологизмы, сформированные
за время совместной работы; профессиональный жаргон и др.}.
Детализация схемы общения (см. рис. 3.8) на рис. 3.11 позволяет представить
;редства общения как два потока [Горелов, 1987], в которых нас интересуют ком-
поненты VI и V2 — языки, на которых говорят аналитик и эксперт (VI1, V2' —
невербальные компоненты). Различие языков VI и V2 и обусловливает «языко-
вый барьер» или «языковые ножницы» в общении инженера по знаниям и экс-
перта.
Эти два языка являются отражением «внутренней речи» эксперта и аналитика,
поскольку большинство психологов и лингвистов считают, что язык — это ос-
новное средство мышления наряду с другими знаковыми системами «внутрен-
него пользования» (универсальный семантический код — УСК [Мартынов, 1977],
языки «смысла» [Мельчук, 1974], концептуальные языки [Шенк, 1980] и др.).
Язык аналитика VI состоит из трех компонентов:
- s21_l — общенаучной терминологии из его «теоретического багажа»;
- s21_2 — терминов предметной области, которые он почерпнул из специальной
литературы в период подготовки;
- s21_3 — бытового разговорного языка, которым пользуется аналитик.
Язык эксперта V2 включает:
- s21_l — общенаучную терминологию;
- s21_2 — специальную терминологию, принятую в предметной области;
- s21_3 — бытовой язык;
• s21_4 — неологизмы, созданные экспертом за время работы, то есть его про-
фессиональный жаргон.
Если считать, что бытовой и общенаучный языки у двух участников общения
примерно совпадают (хотя реально объем второго компонента у эксперта суще-
ственно больше), то некоторый общий язык или код, который необходимо выра-
ботать партнерам для успешного взаимодействия, будет складываться из пото-
ков, представленных на рис. 3.12.
В дальнейшем этот общий код преобразуется в некоторую понятийную (семан-
тическую) сеть, которая является прообразом поля знаний предметной области.
Выработка общего кода начинается с выписыванием аналитиком всех терминов,
употребляемых экспертом, и уточнения их смысла. Фактически это составление
словаря предметной области. Затем следует группирование терминов и выбор
синонимов (слов, означающих одно и то же). Разработка общего кода заканчи-
вается составлением словаря терминов предметной области с предварительной
группировкой их по смыслу, то есть по понятийной близости (это уже первый
шаг структурирования знаний).
На этом этапе аналитик должен с большим вниманием отнестись ко всем специ-
альным терминам, пытаясь максимально вникнуть в суть решаемых проблем и
терминологию. Освоение аналитиком языка предметной области — первый ру-
беж на подступах к созданию адекватной базы знаний.
Рис. 3.12. Структура общего кода
Р
Рис. 3.13. Неоднозначность интерпретации
исунок 3.12 дает представление о процессе неоднозначности интерпретации
терминов двумя специалистами. В семиотике, науке о знаковых системах,
проблема интерпретации является одной из центральных. Интерпретация свя-
зывает «знак» и «означаемый предмет». Только в интерпретации знак получает
смысл. Так, на рис. 3.13 слова «прибор X» для эксперта означает некоторую кон-
кретную схему, которая соответствует схеме оригинала прибора, а в голове начи-
нающего аналитика слова «прибор X» вызывают пустой образ или некоторый
черный ящик с ручками.
Внимание к лингвистическому аспекту проблемы извлечения знаний способству-
ет сближению образа 1 с образом 2 и интерпретации 11с интерпретацией 12, а сло-
ва «прибор X» перейдут в действительно «общий» код.
Таким образом, слой S21 включает изучение и управление процессом разработ-
ки специального промежуточного языка, необходимого для взаимодействия ин-
женера по знаниям и эксперта.
Понятийная структура (S22)
Проблемы формирования понятийной структуры представляют следующий
слой S22 лингвистического аспекта проблемы извлечения знаний. Особенности
формирования понятийной структуры обусловлены установленным постулатом
когнитивной психологии о взаимосвязи понятий в памяти человека и наличии
семантической сети, объединяющей отдельные термины во фрагменты, фраг-
менты в сценарии и т. д. Построение иерархической сети понятий, так называе-
мой «пирамиды знаний», — важнейшее звено в проектировании интеллектуаль-
ных систем.
Большинство специалистов по искусственному интеллекту и когнитивной пси-
хологии считают, что основная особенность естественного интеллекта и памяти
в частности — это связанность всех понятий в некоторую сеть. Поэтому для раз-
работки базы знаний и нужен не словарь, а «энциклопедия» [Шенк, Бирнбаум,
Мей, 1989], в которой все термины объяснены в словарных статьях со ссылками
на другие термины.
Таким образом, лингвистическая работа инженера по знаниям на данном слое
проблем заключается в построении таких связанных фрагментов с помощью
«сшивания» терминов. Фактически эта работа является подготовкой к этапу кон-
цептуализации, где это «шитье» (по Шенку — КОП, концептуальная организация
памяти [Шенк, Хантер, 1987]) приобретает некоторый законченный вид.
При тщательный работе аналитика и эксперта в понятийных структурах начина-
ет просматриваться иерархия понятий, подробно о которой будет говориться в
параграфах 4.4. и 8.2. Такие структуры имеют важнейшее гносеологическое и
дидактическое значение и последнее время для них используется специальный
термин — онтологии. Следует заметить, что эта иерархическая организация хо-
рошо согласуется с теорией универсального предметного кода (УПК) [Горелов,
1987; Жинкин, 1982], согласно которой при мышлении используются не языко-
вые конструкции, а их коды в форме некоторых абстракций, что в общем согла-
суется с результатами когнитивной психологии [Величковский, 1982].
Иерархия абстракций — это глобальная схема, которая может быть положена в
основу концептуального анализа структуры знаний любой предметной области.
Лингвистический эквивалент иерархии — иерархия понятий, которую необхо-
димо построить в понятийной структуре, формируемой инженером по знаниям
(рис. 3.14).
Следует подчеркнуть, что работа по составлению словаря и понятийной структу-
ры требует лингвистического «чутья», легкости манипулирования терминами и
богатого словарного запаса инженера по знаниям, так как зачастую аналитик вы-
нужден самостоятельно разрабатывать словарь признаков. Чем богаче и вырази-
тельнее получается общий код, тем более полнее база знаний.
Рис. 3.14. Пример иерархии
Аналитик вынужден все время помнить о трудности передачи образов и пред-
ставлений в вербальной форме. Полезными тут оказываются свойства многознач-
ности слов естественного языка. Часто инженеру по знаниям приходится под-
сказывать слова и выражения эксперту, и такие новые лексические конструкции
оказываются полезными.
Способность к словесной интерпретации зависит и от пола аналитика (параметр
sl_l). Установлено, что традиционно женщины придают большую значимость
невербальным компонентам общения, а в вербальных имеют более обширный ал-
фавит признаков. И вообще, существуют половые различия восприятия не толь-
ко в бытовой сфере, что очевидно, но и в профессиональной. Следовательно, у
эксперта-мужчины и у эксперта-женщины могут существенно отличаться алфа-
виты для вербализации признаков воспринимаемых объектов.
Словарь пользователя (S23)
Лингвистические результаты, соотнесенные к слоям общего кода и понятийной
структуры, направлены на создание адекватной базы знаний. Однако часто про-
фессиональный уровень конечного пользователя не позволяет ему применить
специальный язык предметной области в полном объеме.
Неожиданными для начинающих разработчиков являются проблемы формиро-
вания отдельного словаря для создания дружественного интерфейса с пользова-
телем ЭС, исследуемые в слое S23. Необходимы специальные приемы, увеличи-
вающие «прозрачность» и доступность системы. Для разработки пользователь-
ского интерфейса требуется дополнительная доработка словаря общего кода с по-
правкой на доступность и «прозрачность» системы.
Так, при разработке экспертной системы по психодиагностике АВТАНТЕСТ
[Гаврилова, 1984] пришлось разработать два словаря терминов — один для психо-
логов-профессионалов, второй — для неспециалистов (испытуемых). Поскольку
результат психодиагностического тестирования всегда интересен испытуемому,
ему выдается листинг с психологическим заключением на общелитературном
языке без употребления специальных терминов. Интересно, что при внедрении
системы использовался в основном этот второй словарь; даже профессиональные
психологи предпочитали получать тексты на обыденном языке.
3.3.3. Гносеологический аспект извлечения
знаний
Гносеология — это раздел философии, связанный с теорией познания, или теорией
отражения действительности в сознании человека. Гносеологический аспект (A3)
извлечения знаний объединяет методологические проблемы получения нового
научного знания, поскольку при создании БЗ эксперт часто впервые формулиру-
ет некоторые закономерности, до того момента составлявшие его личный опыт.
Инженерия знаний как наука, если можно так выразиться, дважды гносеологич-
на — сначала действительность (О) отражается в сознании эксперта (Ml), а за-
тем деятельность и опыт эксперта интерпретируются сознанием инженера по
знаниям (М2), что служит уже основой для построения третьей интерпретации
(Р) — поля знаний экспертной системы (см. рис. 3.5). Процесс познания, в сущ-
ности, направлен на создание внутренней репрезентации окружающего мира в
сознании человека.
Предметом данного учебника являются в основном процессы отображения 12 и 13
(II — изучают психология и философия); подробно интерпретация 13 будет рас-
смотрена далее.
Если описать процессы 12 и 13 в терминологии, введенной в главе 1, то мы имеем
дело с превращением экспертного знания и теоретического (книжного) опыта Z1
в поле знаний Z2, которое есть материализация модели мира М2 инженера по зна-
ниям.
В процессе извлечения знаний аналитика в основном интересует компонент Z1,
связанный с неканоническими индивидуальными знаниями экспертов, посколь-
ку предметные области, требующие именно такого типа знаний, считаются наи-
более восприимчивыми к внедрению экспертных систем. Эти области обычно
называют эмпирическими, так как в них накоплен большой объем отдельных эм-
пирических фактов и наблюдений, в то время как их теоретическое обобщение —
вопрос будущего.
Если считать, что инженер по знаниям извлекает только фрагмент Z1', то есть