Т. А. Гаврилова В. Ф. Хорошевский

Вид материалаРеферат

Содержание


3.3. Теоретические аспекты извлечениязнаний
3.3.1. Психологический аспект
Контактный слой (S11)
Процедурный слой (S12)
Когнитивный слой (S13)
3.3.2. Лингвистический аспект
Язык аналитика
Понятийная структура (S22)
Словарь пользователя (S23)
3.3.3. Гносеологический аспект извлечениязнаний
Подобный материал:
1   2   3   4   5   6   7   8   9   ...   12

3.3. Теоретические аспекты извлечения
знаний


Поскольку основной проблемой инженерии знаний является процесс извлечения
знаний, инженеру по знаниям необходимо четко понимать природу и особеннос-
ти этих процессов. Для того чтобы разобраться в природе извлечения знаний,
выделим три основных аспекта этой процедуры (рис. 3.7):

А = (А1, А2, A3} = {психологический, лингвистический, гносеологический}.



Рис. 3.7. Теоретические аспекты инженерии знаний

3.3.1. Психологический аспект

Из трех аспектов извлечения знаний психологический — А1 — является ведущим,
поскольку он определяет успешность и эффективность взаимодействия инжене-
ра по знаниям (аналитика) с основным источником знаний — экспертом-профес-
сионалом. Психологический аспект выделяется еще и потому, что извлечение
знаний происходит чаще всего в процессе непосредственного общения разработ-
чиков системы. А в общении психология является доминантной.
Общение, или коммуникация (от лат. communicatio — связь), — это междисцип-
линарное понятие, обозначающее все формы непосредственных контактов между
людьми — от дружеских до деловых. Оно широко исследуется в психологии, фи-
лософии, социологии, этологии, лингвистике, семиотике и других науках. Суще-
ствует несколько десятков теорий общения, и единственное, в чем сходятся все
авторы, — это сложность, многоплановость процедуры общения. Подчеркивает-
ся, что общение — не просто однонаправленный процесс передачи сообщений и
не двухтактный обмен порциями сведений, а нерасчлененный процесс циркуля-
ции информации, то есть совместный поиск истины [Каган, 1988] (рис. 3.8).
Итак, общение есть процесс выработки новой информации, общей для общаю-
щихся людей и рождающей их общность. И хотя общение — первый вид деятель-
ности, которым овладевает человек в онтогенезе, по-настоящему владеют куль-
турой и наукой общения единицы.



Неправильная
схема

|

Эксперт



Инженер
по знаниям

I

1

Правильная
схема

Эксперт



Инженер
по знаниям

Рис. 3.8. Структура процесса общения

Можно выделить четыре основных уровня общения [Саратовский, 1980].
  1. Уровень манипулирования, когда один субъект рассматривает другого как сред-
    ство или помеху по отношению к проекту своей деятельности.
  2. Уровень «рефлексивной игры», когда в процессе своей деятельности человек
    учитывает «контрпроект» другого субъекта, но не признает за ним самоцен-
    ность и стремится к «выигрышу», к реализации своего проекта.
  3. Уровень правового общения, когда субъекты признают право на существова-
    ние проектов деятельности друг друга и пытаются согласовать их хотя бы вне-
    шне.
  4. Уровень нравственного общения, когда субъекты внутренне принимают общий
    проект взаимной деятельности.

Стремление и умение общаться на высшем, четвертом, уровне может характе-
ризовать степень профессионализма инженера по знаниям. Извлечение зна-
ний — это особый вид общения, который можно отнести к духовно-информа-
ционному типу. Согласно работе [Каган, 1988] общение делится на мате-
риально-практическое; духовно-информационное; практически-духовное. При
этом информационный аспект общения для инженера по знаниям с прагмати-
ческой точки зрения важнейший.

И



Рис. 3.9. Потери информации при разговорном общении

звестно, что потери информации при разговорном общении велики [Мицич,
1987] (рис. 3.9).


В связи с этим рассмотрим проблему увеличения информативности общения
аналитика и эксперта за счет использования психологических знаний.
Можно выделить такие структурные компоненты модели общения при извлече-
нии знаний:
  • участники общения (партнеры);
  • средства общения (процедура);
  • предмет общения (знания).

В соответствии с этой структурой выделим три «слоя» психологических проблем,

возникающих при извлечении знаний (рис. 3.10):

Al = (Sll, S12, S13 } = (контактный, процедурный, когнитивный}.







S11 Контактный
слой

S12 Процедурный
слой

S13 Когнитивный
слой

Рис. 3.10. Психологический аспект извлечения знаний

Контактный слой (S11)

Практически все психологи отмечают, что на любой коллективный процесс вли-
яет атмосфера, возникающая в группе участников. Существуют эксперименты,
результаты которых неоспоримо говорят, что часто дружеская атмосфера в кол-
лективе больше влияет на результат, чем индивидуальные способности отдель-
ных членов группы [Немов, 1984]. Особенно важно, чтобы в коллективе раз-
работчиков складывались кооперативные, а не конкурентные отношения. Для
кооперации характерна атмосфера сотрудничества, взаимопомощи, заинтере<
ванности в успехах друг друга, то есть уровень нравственного общения, а для о'
ношений конкурентного типа - атмосфера индивидуализма и межличностного
соперничества (более низкий уровень общения).

В настоящее время прогнозировать совместимость в общении со 100%-й гаран-
тией невозможно. Однако можно выделить ряд факторов и черт личности, ха-
рактера и других особенностей участников общения, несомненно, оказываю-
щих влияние на эффективность процедуры.

Разработка проблематики контактного слоя позволила выявить следующие па-
раметры партнеров, влияющие на результаты процедуры извлечения знаний:

311 = {sll_i} = {пол, возраст, личность, темперамент, мотивация и др.}, часть из
которых впоследствии вошли в формирование модели пользователя.

Значения параметров пола (sll_l) и возраста (sll_2) хотя и влияют на эффек-
тивность контакта, но не являются критическими. В литературе [Иванов, 1986]
этмечается, что хорошие результаты дают гетерогенные пары (мужчина/женщи-
на) и соотношение:

20 > (В, - Ва) > 5,

где Вэ — возраст эксперта; Ва — возраст аналитика.

Под личностью (sll_3) обычно понимается устойчивая система психологичес?
;<их черт, характеризующая индивидуальность человека. Рекомендуемые компо-
ненты si 1_3 исследованы в работе [Гаврилова, 1990] и дополнены качествами из
руководства для журналистов в работе [Schouksmith G., 1978]. si 1_3 = (доброже-
лательность, аналитичность, хорошая память, внимание, наблюдательность, во-
Ьбражение, впечатлительность, большая собранность, настойчивость, общитель-
ность, находчивость).

Со времен Галена и Гиппократа, выделивших четыре классических типа темпе-
эамента (sll_4), вошли в научную терминологию понятия

jll_4= (холерик, сангвиник, меланхолик, флегматик).

Известно, что флегматики и меланхолики медленнее усваивают информацию
"Лунева, Хорошилова, 1987]. И для обеспечения психологического контакта с
ними не следует задавать беседе слишком быстрый темп, торопить их с ответом.
Зато они гораздо лучше усваивают новое, в отличие от холериков, для которых
1войственно поверхностное усваивание информации. Последних следует специ-
шьно наводить на размышление и рефлексию. У меланхоликов часто занижена
тмооценка, они застенчивы и в беседе их надо подбадривать. Таким образом,
ааиболее успешными в рамках слоя S11 являются сангвиники и холерики.

Ла эффективность коллективного решения задач влияет также и мотивация
isll_5), то есть стремление к успеху. Инженер по знаниям в зависимости от ус-
ловий разработки должен изыскивать разнообразные стимулы для экспертов
}включая, разумеется, и материальные). Эксперт передает аналитику один из са-
ных дорогих в мире продуктов — знания. И если одни люди делятся опытом доб-
эовольно и с удовольствием, то другие весьма неохотно приоткрывают свои про-
бессиональные тайны. Иногда полезно оказывается возбудить в эксперте дух
эоперничества, конкуренции (не нарушая, естественно, обстановки кооператив-
посте в коллективе).

Процедурный слой (S12)

параметры процедурного слоя S12 описывают непосредственно процесс прове-
дения процедуры извлечения знаний. Фактически это профессиональные пара-
аетры:

112 = {s!2_i} = {ситуация общения (место, время, продолжительность); оборудо-
вание (вспомогательные средства, освещенность, мебель); профессиональные
рриемы (темп, стиль, методы и др.)}.


Инженер по знаниям, успешно овладевший наукой установления атмосферы до-
верия и взаимопонимания с экспертом (контактный слой — S11), должен еще су-
меть воспользоваться благоприятным воздействием этой атмосферы. Проблема
процедурного слоя касается проведения самой процедуры извлечения знаний.
Здесь мало проницательности и обаяния, полезных для решения проблемы кон-
такта, тут необходимы профессиональные знания.
Остановимся на общих закономерностях проведения процедуры.
s!2_l — ситуация общения определяется следующими компонентами:
  • s!2_l_l — место проведения сеансов;
  • s!2_l_2 — продолжительность проведения сеансов;
  • s!2_l_3 — время проведения сеансов.

Беседу с экспертом лучше всего проводить в небольшом помещении наедине
(s!2_l_l: место), поскольку посторонние люди нарушают доверительность бесе-
ды и могут породить эффект «фасада». Рабочее место эксперта является не са-
мым оптимальным вариантом, так как его могут отвлекать телефонные звонки,
сотрудники и пр. Атмосфера замкнутого пространства и уединенности положи-
тельно влияет на эффективность.

Американский психолог И. Атватер считает, что для делового общения наиболее
благоприятная дистанция от 1,2 до 3 метров [Schouksmith, 1978]. Минимальным
«комфортным» расстоянием можно считать 0,7-0,8 метра.

Реконструкция собственных рассуждений — трудоемкий процесс, и поэтому
длительность одного сеанса (s!2_l_2: продолжительность) обычно не превыша-
ет 1,5-2 часа. Эти два часа лучше выбрать в первой половине дня, например с 10
до 12 часов, если эксперт типа «жаворонок» (s!2_l_3: время). Известно, что вза-
имная утомляемость партнеров при беседе наступает обычно через 20—25 минут
[Ноэль, 1978], поэтому в сеансе нужны паузы.
s!2_2 — оборудование включает:
  • s!2_2_l — вспомогательные средства;
  • s!2_2_2 — освещенность;
  • s!2_2_3 - мебель.
    Вспомогательные средства (s!2_2_l):
  • средства для увеличения эффективности самого процесса извлечения знаний;
  • средства для протоколирования результатов.

К средствам для увеличения эффективности процесса извлечения знаний прежде
всего относится наглядный материал. Независимо от метода извлечения (см. гла-
ву 4), выбранного в конкретной ситуации, его реализация возможна разными спо-
собами. Например, можно учитывать следующий фактор: широко известно, что
людей, занимающихся интеллектуальной деятельностью, можно отнести к худо-
жественному либо мыслительному типу. Термины тут условны и не имеют отно-
шения к той деятельности, которую традиционно называют художественной или

мыслительной. Важно, что, определив тип эксперта, инженер по знаниям может
плодотворнее использовать любой из методов извлечения, зная, что люди худо-
жественного типа легче воспринимают зрительную информацию в форме рисун-
ков, графиков, диаграмм, так как эта информация воспринимается через первую
сигнальную систему. Напротив, эксперты мыслительного типа лучше понимают
язык формул и текстовую информацию. При этом учитывается факт, что боль-
шую часть информации человек получает от зрения. Совет пользоваться актив-
нее наглядным материалом из работы [Хейес—Рот, Уотермена, Ленат, 1987]
можно считать универсальным. Такие методы, как свободный диалог и игры, пре-
доставляют богатые возможности использовать слайды, чертежи, рисунки.
Для протоколирования результатов в настоящее время используются следую-
щие способы:
  • запись на бумагу непосредственно по ходу беседы (недостатки — это часто ме-
    шает беседе, кроме того, трудно успеть записать все, даже при наличии навы-
    ков стенографии);
  • магнитофонная запись (диктофон), помогающая аналитику проанализиро-
    вать весь ход сеанса и свои ошибки (недостаток — может сковывать эксперта);
  • запоминание с последующей записью после беседы (недостаток — годится
    только для аналитиков с блестящей памятью).

Наиболее распространенным способом на сегодня является первый. При этом
наибблыпая опасность тут — потеря знаний, поскольку любая запись ответов -
это уже интерпретация, то есть привнесение субъективного понимания предмета.
Значения параметров освещенности (s!2_2_2) и мебели (s!2_2_3) очевидны и
связаны с влиянием внешних факторов на эксперта.
s!2_3 — профессиональные приемы аналитика, включают, в частности:
  • s!2_3_l - темп;
  • s!2_3_2 - стиль;
  • s!2_3_3 — методы.

Учет индивидуального темпа (s!2_3_l) и стиля (s!2_3_2) эксперта позволяет
аналитику снизить напряженность процедуры извлечения знаний. Типичной
ошибкой является навязывание собственных темпа и стиля.
На успешность также влияет длина фраз, которые произносит инженер по зна-
ниям. Этот факт был установлен американскими учеными — лингвистом Ингве
и психологом Миллером при проведении исследования о причинах низкой усво-
яемости команд на Военно-морском флоте США [Gammack, Young, 1985].
Причина была в длине команд. Оказалось, что человек лучше всего воспринимает
предложения глубиной (или длиной) 7+2(-2) слова. Это число (7±2) получило
название число Ингве—Миллера. Можно считать его мерой «разговорности»
речи. Опытные лекторы используют в лекции в основном короткие фразы, умень-
шая потерю информации с 20-30 % (у плохих лекторов) до 3-4 % [Горелов, 1987].
Большая часть информации поступает к инженеру по знаниям в форме предло-
жений на естественном языке. Однако внешняя речь эксперта естевоспроизведе-
ние его внутренней речи (мышления), которая гораздо богаче и многообразнее.


При этом для передачи этой внутренней речи эксперт использует и невербаль-
ные средства, такие как интонация, мимика, жесты. Опытный инженер по знани-
ям старается записывать по возможности в протоколы (в форме ремарок) эту до-
полнительную интонацию.

В целом, невербальная компонента стиля общения важна и для проблем контакт-
ного слоя при установлении контакта, когда по отдельным жестам и выражению
лица эксперта инженер по знаниям может установить границу возможной «дру-
жественности» общения.

Значение параметра методов (s!2_3_3) подробно рассмотрено в следующей
главе, исходя из позиции, что метод должен подходить к эксперту как «ключ к
замку».

Когнитивный слой (S13)

Когнитивные (от англ, cognition — познание) науки исследуют познавательные
процессы человека с позиций возможности их моделирования (психология, ней-
рофизиология, эргономика, инженерия знаний). Наименее исследованы на сегод-
няшний день проблемы когнитивного слоя S13, связанные с изучением семанти-
ческого пространства памяти эксперта и реконструкцией его понятийной струк-
туры и модели рассуждений.

Основными факторами, влияющими на когнитивную адекватность, будут:
S13 = {s!3_i} = {когнитивный стиль, семантическая репрезентативность поля зна-
ний и концептуальной модели}.

Под когнитивным стилем (s!3_l) человека понимается совокупность критериев
предпочтения при решении задач и познании мира, специфическая для каждого
человека. Когнитивный стиль определяет не столько эффективность деятельно-
сти, сколько способ достижения результата [Алахвердов, 1986]. Это способ по-
знания, который позволяет людям с разными способностями добиваться оди-
наковых результатов в деятельности. Это система средств и индивидуальных
приемов, к которым прибегает человек для организации своей деятельности.
Инженеру по знаниям полезно изучить и прогнозировать свой когнитивный
стиль, а также стиль эксперта. Особенно важны такие характеристики когнитив-
ного стиля, как:
  • s!3_l_l — (полезависимость — поленезависимость);
  • s!3_l_2 — (импульсивность — рефлективность (рефлексивность);
  • s!3_l_3 — (ригидность — гибкость);
  • S13_l_4 — (когнитивная эквивалентность).

s!3_l_l. Поленезависимость позволяет человеку акцентировать внимание лишь
на тех аспектах проблемы, которые необходимы для решения конкретной зада-
чи, и уметь отбрасывать все лишнее, то есть не зависеть от фона или окружаю-
щего задачу шумового поля. Эта характеристика коррелирует с такими чертами
личности, как невербальный интеллект, аналитичность мышления, способность

к пониманию сути. Очевидно, что помимо того, что самому аналитику необходи-
мо иметь высокое значение параметра s!3_l_l, пдденезависимый эксперт — это
тоже желательный фактор. Однако приходится учитывать, что больше нуждают-
ся в общении полезависимые люди, а потому они и более контактны [Орехов,
1985].

Особенно полезны для общения гетерогенные (смешанные) пары, например «по-
лезависимый — поленезависимый» [Иванов, 1986]. В литературе описаны раз-
личные эксперименты, моделирующие общение, требующее понимания и совмест-
ной деятельности. Наиболее успешным в понимании оказались поленезависимые
испытуемые (92 % успеха), для сравнения полезависимые давали 56 % успеха
[Кулюткин, Сухобская, 1971].

!Для совместной профессиональной деятельности важна также гибкость когни-
тивной организации, которая связана с поленезависимостью. Итак, большую
: способность к адекватному пониманию партнера демонстрируют субъекты с вы-
: сокой психологической дифференциацией, то есть поленезависимостью.
Поленезависимость является одной из характерных профессиональных черт ког-
шитивного стиля наиболее квалифицированных инженеров по знаниям. По неко-
торым результатам [Алахвердов, 1986] мужчины более поленезависимы, чем жен-
пцины.

is!3_l_2. Под импульсивностью понимается быстрое принятие решения (часто
)без его достаточного обоснования), а под рефлексивностью — склонность к рас-
судительности. Рефлексивность по экспериментальным данным коррелирует со
способностью к формирования понятий и продуктивностью стратегий решения
шогических задач [Кулюткин, Сухобская, 1971]. Таким образом, и инженеру по
знаниям, и эксперту желательно быть рефлексивным, хотя собственный стиль
изменяется лишь частично и с большим напряжением.

jsl3_l_3. Ригидность — гибкость характеризует способность человека к измене-
шию установок и точек зрения в соответствии с изменяющейся ситуацией. Ригид-
шые люди не склонны менять свои представления и структуру восприятия, напро-
чгив, гибкие легко приспосабливаются к новой обстановке. Очевидно, что если
шксперт еще может себе позволить ригидность (что характерно для долго работа-
оющих над одной проблемой специалистов, особенно старшего возраста), то для
шнженера по знаниям эта характеристика когнитивного стиля явно противопо-
казана. Увеличение ригидности с возрастом отмечается многими психологами
Кулюткин, Сухобская, 1971; Орехов, 1985].

ifc!3_l_4. Когнитивная эквивалентность характеризует способность человека к
различению понятий и разбиению их на классы и подклассы. Чем уже диапазон
скогнитивной эквивалентности, тем более тонкую классификацию способен про-
1вести индивид, тем большее количество признаков понятий он может выделить.
ЭЭбычно у женщин диапазон когнитивной эквивалентности уже, чем у мужчин.
Семантическая репрезентативность (s!3_2) подразумевает подход, исключающий
•ррадиционное навязывание эксперту некой модели представлений (например,
фродукционной или фреймовой), и заставляет инженера по знаниям последова-
тельно воссоздавать модель мира эксперта, используя как неформальные методы,


так и математический аппарат, например многомерное шкалирование (см. главу
4). Проблема семантической репрезентативности ориентирована на достижение
когнитивной адекватности поля знаний и концептуальной модели. В настоящий
момент она может быть сформулирована как проблема «испорченного телефона»
[Гаврнлова, Червинская, 1992] (см. рис. 3.5) — возможные трансформации и по-
тери в цепи передачи информации:

(О,: предметная область или реальный мир) —>

/7,: интерпретация г-го эксперта]'—»

(Mgt: модель мира эксперта) —>

[V? вербализация модели мира эксперта] —>

(Ti & Ci: вербальные и невербальные сообщения г-го эксперта j- му аналитику) ->

[I: их интерпретация j-ым аналитиком]-*

(Mg: модель мира j-го аналитика) —>

[К: кодирование при формировании поля знаний с последующей структуризацией

в концептуальную модель].

Круглые скобки определяют понятия, квадратные — процессы.

3.3.2. Лингвистический аспект

Лингвистический (А2) аспект касается исследований языковых проблем, так как
язык — это основное средство общения в процессе извлечения знаний.
Сразу же следует оговорить, что поскольку тема данной книги ограничена изло-
жением теории и технологии инженерии знаний, то область разработки есте-
ственно-языковых интерфейсов и весь спектр проблем, связанных с ней — лекси-
ческих, синтаксических, семантических, прагматических и т. д. [Виноград, 1976;
Мальковский, 1985; Попов, 1982], — не рассматривается.

В инженерии знаний можно выделить три слоя лингвистических проблем
(рис. 3.11):

А2 = {S21, S22, 523} - («общий код», понятийная структура, словарь пользова-
теля}.







S21 «Общий код»

S22 Понятийная
структура

S23 Словарь
пользователя

Рис. 3.11. Лингвистический аспект извлечения знаний

«Общий код» (S21)

«Общий код» решает проблему языковых ножниц между профессиональной тер-
минологией эксперта и обыденной литературной речью инженера по знаниям и
включает следующие компоненты:

521 = {s21_i} = (общенаучная терминология; специальные понятия из профессио-
нальной литературы; элементы бытового языка; неологизмы, сформированные
за время совместной работы; профессиональный жаргон и др.}.

Детализация схемы общения (см. рис. 3.8) на рис. 3.11 позволяет представить
;редства общения как два потока [Горелов, 1987], в которых нас интересуют ком-
поненты VI и V2 — языки, на которых говорят аналитик и эксперт (VI1, V2' —
невербальные компоненты). Различие языков VI и V2 и обусловливает «языко-
вый барьер» или «языковые ножницы» в общении инженера по знаниям и экс-
перта.

Эти два языка являются отражением «внутренней речи» эксперта и аналитика,
поскольку большинство психологов и лингвистов считают, что язык — это ос-
новное средство мышления наряду с другими знаковыми системами «внутрен-
него пользования» (универсальный семантический код — УСК [Мартынов, 1977],
языки «смысла» [Мельчук, 1974], концептуальные языки [Шенк, 1980] и др.).

Язык аналитика VI состоит из трех компонентов:
  • s21_l — общенаучной терминологии из его «теоретического багажа»;
  • s21_2 — терминов предметной области, которые он почерпнул из специальной
    литературы в период подготовки;



  • s21_3 — бытового разговорного языка, которым пользуется аналитик.
    Язык эксперта V2 включает:
  • s21_l — общенаучную терминологию;
  • s21_2 — специальную терминологию, принятую в предметной области;
  • s21_3 — бытовой язык;

• s21_4 — неологизмы, созданные экспертом за время работы, то есть его про-
фессиональный жаргон.

Если считать, что бытовой и общенаучный языки у двух участников общения
примерно совпадают (хотя реально объем второго компонента у эксперта суще-
ственно больше), то некоторый общий язык или код, который необходимо выра-
ботать партнерам для успешного взаимодействия, будет складываться из пото-
ков, представленных на рис. 3.12.

В дальнейшем этот общий код преобразуется в некоторую понятийную (семан-
тическую) сеть, которая является прообразом поля знаний предметной области.

Выработка общего кода начинается с выписыванием аналитиком всех терминов,
употребляемых экспертом, и уточнения их смысла. Фактически это составление
словаря предметной области. Затем следует группирование терминов и выбор
синонимов (слов, означающих одно и то же). Разработка общего кода заканчи-


вается составлением словаря терминов предметной области с предварительной
группировкой их по смыслу, то есть по понятийной близости (это уже первый
шаг структурирования знаний).

На этом этапе аналитик должен с большим вниманием отнестись ко всем специ-
альным терминам, пытаясь максимально вникнуть в суть решаемых проблем и
терминологию. Освоение аналитиком языка предметной области — первый ру-
беж на подступах к созданию адекватной базы знаний.



Рис. 3.12. Структура общего кода

Р



Рис. 3.13. Неоднозначность интерпретации

исунок 3.12 дает представление о процессе неоднозначности интерпретации
терминов двумя специалистами. В семиотике, науке о знаковых системах,
проблема интерпретации является одной из центральных. Интерпретация свя-
зывает «знак» и «означаемый предмет». Только в интерпретации знак получает
смысл. Так, на рис. 3.13 слова «прибор X» для эксперта означает некоторую кон-
кретную схему, которая соответствует схеме оригинала прибора, а в голове начи-
нающего аналитика слова «прибор X» вызывают пустой образ или некоторый
черный ящик с ручками.

Внимание к лингвистическому аспекту проблемы извлечения знаний способству-
ет сближению образа 1 с образом 2 и интерпретации 11с интерпретацией 12, а сло-
ва «прибор X» перейдут в действительно «общий» код.

Таким образом, слой S21 включает изучение и управление процессом разработ-
ки специального промежуточного языка, необходимого для взаимодействия ин-
женера по знаниям и эксперта.

Понятийная структура (S22)

Проблемы формирования понятийной структуры представляют следующий
слой S22 лингвистического аспекта проблемы извлечения знаний. Особенности
формирования понятийной структуры обусловлены установленным постулатом
когнитивной психологии о взаимосвязи понятий в памяти человека и наличии
семантической сети, объединяющей отдельные термины во фрагменты, фраг-
менты в сценарии и т. д. Построение иерархической сети понятий, так называе-
мой «пирамиды знаний», — важнейшее звено в проектировании интеллектуаль-
ных систем.

Большинство специалистов по искусственному интеллекту и когнитивной пси-
хологии считают, что основная особенность естественного интеллекта и памяти
в частности — это связанность всех понятий в некоторую сеть. Поэтому для раз-
работки базы знаний и нужен не словарь, а «энциклопедия» [Шенк, Бирнбаум,
Мей, 1989], в которой все термины объяснены в словарных статьях со ссылками
на другие термины.

Таким образом, лингвистическая работа инженера по знаниям на данном слое
проблем заключается в построении таких связанных фрагментов с помощью
«сшивания» терминов. Фактически эта работа является подготовкой к этапу кон-
цептуализации, где это «шитье» (по Шенку — КОП, концептуальная организация
памяти [Шенк, Хантер, 1987]) приобретает некоторый законченный вид.

При тщательный работе аналитика и эксперта в понятийных структурах начина-
ет просматриваться иерархия понятий, подробно о которой будет говориться в
параграфах 4.4. и 8.2. Такие структуры имеют важнейшее гносеологическое и
дидактическое значение и последнее время для них используется специальный
термин — онтологии. Следует заметить, что эта иерархическая организация хо-
рошо согласуется с теорией универсального предметного кода (УПК) [Горелов,
1987; Жинкин, 1982], согласно которой при мышлении используются не языко-
вые конструкции, а их коды в форме некоторых абстракций, что в общем согла-
суется с результатами когнитивной психологии [Величковский, 1982].
Иерархия абстракций — это глобальная схема, которая может быть положена в
основу концептуального анализа структуры знаний любой предметной области.
Лингвистический эквивалент иерархии — иерархия понятий, которую необхо-
димо построить в понятийной структуре, формируемой инженером по знаниям
(рис. 3.14).

Следует подчеркнуть, что работа по составлению словаря и понятийной структу-
ры требует лингвистического «чутья», легкости манипулирования терминами и


богатого словарного запаса инженера по знаниям, так как зачастую аналитик вы-
нужден самостоятельно разрабатывать словарь признаков. Чем богаче и вырази-
тельнее получается общий код, тем более полнее база знаний.



Рис. 3.14. Пример иерархии

Аналитик вынужден все время помнить о трудности передачи образов и пред-
ставлений в вербальной форме. Полезными тут оказываются свойства многознач-
ности слов естественного языка. Часто инженеру по знаниям приходится под-
сказывать слова и выражения эксперту, и такие новые лексические конструкции
оказываются полезными.

Способность к словесной интерпретации зависит и от пола аналитика (параметр
sl_l). Установлено, что традиционно женщины придают большую значимость
невербальным компонентам общения, а в вербальных имеют более обширный ал-
фавит признаков. И вообще, существуют половые различия восприятия не толь-
ко в бытовой сфере, что очевидно, но и в профессиональной. Следовательно, у
эксперта-мужчины и у эксперта-женщины могут существенно отличаться алфа-
виты для вербализации признаков воспринимаемых объектов.

Словарь пользователя (S23)

Лингвистические результаты, соотнесенные к слоям общего кода и понятийной
структуры, направлены на создание адекватной базы знаний. Однако часто про-
фессиональный уровень конечного пользователя не позволяет ему применить
специальный язык предметной области в полном объеме.

Неожиданными для начинающих разработчиков являются проблемы формиро-
вания отдельного словаря для создания дружественного интерфейса с пользова-
телем ЭС, исследуемые в слое S23. Необходимы специальные приемы, увеличи-
вающие «прозрачность» и доступность системы. Для разработки пользователь-
ского интерфейса требуется дополнительная доработка словаря общего кода с по-
правкой на доступность и «прозрачность» системы.

Так, при разработке экспертной системы по психодиагностике АВТАНТЕСТ
[Гаврилова, 1984] пришлось разработать два словаря терминов — один для психо-
логов-профессионалов, второй — для неспециалистов (испытуемых). Поскольку
результат психодиагностического тестирования всегда интересен испытуемому,
ему выдается листинг с психологическим заключением на общелитературном
языке без употребления специальных терминов. Интересно, что при внедрении
системы использовался в основном этот второй словарь; даже профессиональные
психологи предпочитали получать тексты на обыденном языке.

3.3.3. Гносеологический аспект извлечения
знаний


Гносеология — это раздел философии, связанный с теорией познания, или теорией
отражения действительности в сознании человека. Гносеологический аспект (A3)
извлечения знаний объединяет методологические проблемы получения нового
научного знания, поскольку при создании БЗ эксперт часто впервые формулиру-
ет некоторые закономерности, до того момента составлявшие его личный опыт.
Инженерия знаний как наука, если можно так выразиться, дважды гносеологич-
на — сначала действительность (О) отражается в сознании эксперта (Ml), а за-
тем деятельность и опыт эксперта интерпретируются сознанием инженера по
знаниям (М2), что служит уже основой для построения третьей интерпретации
(Р) — поля знаний экспертной системы (см. рис. 3.5). Процесс познания, в сущ-
ности, направлен на создание внутренней репрезентации окружающего мира в
сознании человека.

Предметом данного учебника являются в основном процессы отображения 12 и 13
(II — изучают психология и философия); подробно интерпретация 13 будет рас-
смотрена далее.

Если описать процессы 12 и 13 в терминологии, введенной в главе 1, то мы имеем
дело с превращением экспертного знания и теоретического (книжного) опыта Z1
в поле знаний Z2, которое есть материализация модели мира М2 инженера по зна-
ниям.

В процессе извлечения знаний аналитика в основном интересует компонент Z1,
связанный с неканоническими индивидуальными знаниями экспертов, посколь-
ку предметные области, требующие именно такого типа знаний, считаются наи-
более восприимчивыми к внедрению экспертных систем. Эти области обычно
называют эмпирическими, так как в них накоплен большой объем отдельных эм-
пирических фактов и наблюдений, в то время как их теоретическое обобщение —
вопрос будущего.

Если считать, что инженер по знаниям извлекает только фрагмент Z1', то есть