Т. А. Гаврилова В. Ф. Хорошевский

Вид материала

Содержание

Примеры методов и систем приобретения знаний
156Глава 4 • Технологии инженерии
Какой из указанных способов представления отличается от 'двух дрэугих?
Прямое приобретение знаний в системе SIMER
Например, эксперту в области представления знаний предъявляется
158Глава 4 * Технологии инженерии знаний4 б. Примеры методов и систем приобретения знаний159
Назовите противоположное свойство свойству -легкость описания динамики»?
Базы знаний

Подобный материал:

1 ... 4 5 6 7 8 9 10 11 12

Глава 4 • Технологии инженерии знаний

4.6. Примеры методов и систем приобретения знаний

155

Таблица 4.7. (продолжение)

Тип Сообщение

Т₇а может увеличивать возможность р, и Р может увеличивать возможность а

Т_ва может протекать с р, и р может протекать с а

Т₉а увеличивает возможность Р, и [3 увеличивать возможность а

Т₁₀а сопровождается р, и Р может сопровождает а

Т,, а сопровождается р, и £ сопровождаться а

Т_1га исключает (3,. и р исключает а

Т₁₃а приводит к Р

Т₁₄а может привести к Р

Т₁₅а увеличивает возможностьразвития Р

Т,₆а может увеличить возможность развития р

Т₁₇а исключает возможность развития р

Если считать множества всех атрибутов равновеликими, то можно рисовать пря-
моугольники.

Тогда типу сообщения Т, можно поставить в соответствие диаграмму (пересече-
ние а и [3 всюду далее заштриховано).

В качестве примера приведем интерпретации некоторых диаграмм. Так, диаграм-
му, соответствующую сообщению типа Т₃, можно интерпретировать следующим
образом: для всякого примера объекта р качестве примера приведем интерпрета-
ции некоторых диаграмм. Так, диаграмму, соответствующую сообщению типа Т₃,
можно интерпретировать следующим образом: для всякого примера объекта р
найдутся такие примеры объекта а, в которых равны совпадающие имена и значе-
ния атрибутов.
Для остальных типов сообщений получим диаграммы, представленные в табл. 4.8.

Таблица 4.8. Диаграммы для различных типов сообщений

Для сообщения типа Т₈: для всякого имени атрибута примера объекта а найдется
совпадающее с ним имя атрибута из примера объекта р, н наоборот; при этом со-
ответствующие значения атрибутов равны. Найдутся такие примеры объекта а, в
которых равны совпадающие имена и значения атрибутов.

Каждой из изображенных диаграмм можно дать такую теоретико-множествен-
ную интерпретацию, связав с каждым из типов сообщений Т, нетоторое бинарное
отношение R_k примеров объектов (при k = i).

Способ представления с определенными так отношениями называется неодно-
родной семантической сетью.

В реализации базы знаний основными элементами структур _данных являются
элементы «вершина», «элемент кортежа», «атрибут», «цепь», «с=трелка». Элемент
«вершина» соответствует объекту (событию), он содержит имя=, списки входных
и выходных «стрелок» и список типа «элемент кортежа». Списогк «элементов кор-
тежа» соответствует совокупности атрибутов события.

Для обеспечения простого способа определения указателя «вер шины» существу-
ют элементы типа «цепь». Элемент типа «цепь» содержит указатель на «верши-
ну» и указатель на следующий элемент типа «цепь». Указатель на первый элемент
списка «цепь» входит в описание элемента типа «атрибут». «Атрибут» характе-
ризуется также именем, множеством значений и единицей измерения.

Отношения на множестве объектов реализованы в элементамх типа «стрелка».
Каждый такой элемент содержит имя, сорт, вес, тип веса, указат-ель на «вершину»
и указатель на следующий элемент тина «стрелка». Отношения на двух объектах
описываются парой элементов типа «стрелка», один из которы х входит в список

156

Глава 4 • Технологии инженерии знаний

46. Примеры методов и систем приобретения знаний

157

входящих стрелок одного объекта, другой — в список входящих стрелок другого
объекта.

Процедурная компонента системы содержит функции создания структур дан-
ных, поддержки корректности базы знаний, наследования свойств и ряд других
функций. Для обеспечения поиска по именам элементов типа «вершина» и «ат-
рибут» в системе реализовано В-дерево. Доступ ко всем элементам базы осуще-
ствляется через виртуальную память. Каждый элемент имеет внутренний иден-
тификатор, по значению которого однозначно определяется его размещение в
оперативной или внешней памяти. Для работы с объектами, отсутствующими в
оперативной памяти, осуществляется их динамический перенос из внешней па-
мяти в оперативную. Это позволяет системе работать на компьютере с ограничен-
ным объемом оперативной памяти.

Прямое приобретение знаний в системе SIMER

Для выявления структурных знаний о предметной области используются страте-
гии разбиения на ступени и репертуарных решеток. Подробнее о репертуарных
решетках см. параграф 5.2.

Стратегия разбиения на ступени направлена на выявление структурных и клас-
сификационных свойств событий (понятий, объектов) области и таксонометри-
ческой структуры событий предметной области.

Стратегия разбиения на ступени реализуется в одном из двух сценариев, который
выбирается экспертом

«Имя — свойство».

«Множество имен — свойство».

Сценарий «Имя — свойство»

1. Вопрос системы об имени события.
2. Сообщение эксперта об имени события.
3. Вопрос системы об имени свойства.
4. Сообщение эксперта об имени свойства.
5. Вопрос системы о существовании множества значений свойства.
6. Ответ эксперта (Да/Нет).

7. В случае отрицательного ответа имя свойства воспринимается как имя
события.

8. Если имя события, образованного на шаге 3, отсутствует в базе знаний,
то это событие рассматривается как новое, и для него выполняются шаги
2-7.

9. Вопрос системы о типе множества значений свойства (непрерывное/дис-
кретное).

10. Ответ эксперта.

11. Вопрос системы о единице измерения свойства.
12. Сообщение эксперта о единице измерения.
13. Вопрос системы о множестве значений свойства.
14. Сообщения эксперта о множестве значений свойства.

15. В процессе выполнения шагов 2—6 создается глобальный объект «имя
свойства» и область его значений. Совокупность таких обт=>ектов будем
называть базисом свойств области.

16. Вопрос системы о подмножестве значений свойства, характерного для
описываемого события.

17. Сообщение эксперта о подмножестве значений свойства.

В результате выполнения шага 7 один из элементов базиса свойстгв связывается с
описываемым событием (с указанием подмножества области значений элемента
базиса, характеризующего описываемое событие).

Сценарий «Множество имен — свойство»

При работе сценария шаг 1 многократно повторяется, а затем выполняются
шаги 2—7 для каждого имени события.

Стратегия репертуарных решеток направлена на преодоление когнитивной за-
щиты эксперта. Механизм преодоления основан на выявлении его личностных
конструктов. Каждый конструкт описывается некоторой совокупностью шкал, а
каждая шкала образуется оппозицией свойств.

Наиболее эффективный способ выявления противоположных свойств — предъяв-
ление эксперту триад семантически связанных событий с предложением назвать
свойство, отличающее одно событие от двух других [Kelly, 19553I- На следующем
шаге эксперту предлагается назвать противоположное свойство. Таким способом
выявляются элементы множества личностных психологических конструктов кон-
кретного эксперта.

С другой стороны, свойства, различающие события, — это те свойства, которые
влияют на формирование решения. Так как при этом не ставите я задача выявле-
ния когнитивной организации индивидуального сознания эксперта, то описан-
ная процедура используется для формирования базиса свойств области, а не для
построения личностных конструктов. Пополнение базиса cbohzctb области осу-
ществляется путем повторения этой процедуры с другими триадами.

Пример 4.9

Например, эксперту в области представления знаний предъявляется триада понятий,
описывающих способы представления: семантические сети, фреймь?!, системы продук-
ций. Эксперту предлагается ответить па следующие вопросы:

Какой из указанных способов представления отличается от 'двух дрэугих?

156

Глава 4 • Технологии инженерии знаний

4.6. Примеры методов и систем приобретения знаний

157

входящих стрелок одного объекта, другой — в список входящих стрелок другого
объекта.

Процедурная компонента системы содержит функции создания структур дан-
ных, поддержки корректности базы знаний, наследования свойств и ряд других
функций. Для обеспечения поиска по именам элементов типа «вершина» и «ат-
рибут» в системе реализовано В-дерево. Доступ ко всем элементам базы осуще-
ствляется через виртуальную память. Каждый элемент имеет внутренний иден-
тификатор, по значению которого однозначно определяется его размещение в
оперативной или внешней памяти. Для работы с объектами, отсутствующими в
оперативной памяти, осуществляется их динамический перенос из внешней па-
мяти в оперативную. Это позволяет системе работать на компьютере с ограничен-
ным объемом оперативной памяти.

Прямое приобретение знаний в системе SIMER

Для выявления структурных знаний о предметной области используются страте-
гии разбиения на ступени и репертуарных решеток. Подробнее о репертуарных
решетках см. параграф 5.2.

Стратегия разбиения на ступени направлена на выявление структурных и клас-
сификационных свойств событий (понятий, объектов) области и таксонометри-
ческой структуры событий предметной области.

Стратегия разбиения на ступени реализуется в одном из двух сценариев, который
выбирается экспертом

«Имя — свойство».

«Множество имен — свойство».

11. Вопрос системы о единице измерения свойства.
12. Сообщение эксперта о единице измерения.
13. Вопрос системы о множестве значений свойства.
14. Сообщения эксперта о множестве значений свойства.

15. В процессе выполнения шагов 2—6 создается глобальный о—бъект «имя
свойства» и область его значений. Совокупность таких объ-ектов будем
называть базисом свойств области.

16. Вопрос системы о подмножестве значений свойства, характерного для
описываемого события.

17. Сообщение эксперта о подмножестве значений свойства.

В результате выполнения шага 7 один из элементов базиса свойст~в связывается с
описываемым событием (с указанием подмножества области зна*ений элемента
базиса, характеризующего описываемое событие).

Сценарий «Множество имен — свойство»

При работе сценария шаг 1 многократно повторяется, а затем в ыполняются
шаги 2—7 для каждого имени события.

Стратегия репертуарных решеток направлена на преодоление когнитивной за-
щиты эксперта. Механизм преодоления основан на выявлении его личностных
конструктов. Каждый конструкт описывается некоторой совокупностью шкал, а
каждая шкала образуется оппозицией свойств.

Наиболее эффективный способ выявления противоположных свойств — предъяв-
ление эксперту триад семантически связанных событий с предло жением назвать
свойство, отличающее одно событие от двух других [Kelly, 1955]_ На следующем
шаге эксперту предлагается назвать противоположное свойство. 1Таким способом
выявляются элементы множества личностных психологических ко нструктов кон-
кретного эксперта.

С другой стороны, свойства, различающие события, — это те свойства, которые
влияют на формирование решения. Так как при этом не ставится задача выявле-
ния когнитивной организации индивидуального сознания эксперта, то описан-
ная процедура используется для формирования базиса свойств о-бласти, а не для
построения личностных конструктов. Пополнение базиса свойс=тв области осу-
ществляется путем повторения этой процедуры с другими триалдами.

Пример 4.9

Например, эксперту в области представления знаний предъявляется триада понятий
описывающих способы представления: семантические сети, фреймы_ системы продук-
ций. Эксперту предлагается ответить на следующие вопросы:

Какой из указанных способов представления отличается от двух дру—гих?

158

Глава 4 * Технологии инженерии знаний

4 б. Примеры методов и систем приобретения знаний

159

системы продукций;

Какое свойство отличает системы продукций от семантических сетей и фреймов?
легкость описания динамики;

Назовите противоположное свойство свойству -легкость описания динамики»?
трудность описания динамики;

Дайте имя свойству, имеющему значения «легкость описания динамики» и «трудность
описания динамики»?

возможность описания динамики.

В результате формируется шкала с именем «возможность описания динамики» и со
значением -«легкость описания динамики» для объекта «системы продукций»; «труд-
.ность описания динамики» для объектов «семантические сети» и «фреймы».

Предлагая эксперту аналогичные вопросы об отличии семантических сетей от систем
продукций и фреймов, можно выявить и другие свойства базиса области.

Еще один пример — выявление каузальных знаний о предметной области. К кау-
зальным знаниям о предметной области в соответствии с работой [Поспелов,
1986]относятся:

связи между следствиями и необходимыми и достаточными причинами;

связи между следствиями и достаточными причинами;

связи между следствиями и необходимыми со-причинами; связи между след-
ствиями и возможными со-причинами.

Будем понимать каузальные знания несколько шире, включив в рассмотрение,
кроме связей событий настоящего с будущим и событий прошлого с настоящим,
и связи между событиями настоящего. В соответствии с этим отнесем к каузаль-
ным знаниям все типы сообщений из табл. 4.6.

Тогда задача выявления каузальных знаний сведется к установлению соответ-
ствия между множеством типов сообщений и множеством отношений R,—R₁₇, то
есть к поиску отображения Т в R. Для поиска этого отображения используется
стратегия выявления сходства [Осипов, 1989]. Она основана на выявлении в ин-
терактивном режиме алгебраических свойств сообщений T_s (таких как симмет-
ричность — ассимметричность, рефлексивность — иррефлексивность и'других)
и появлении на основании этого гипотез о принадлежности сообщений тем или
иным отношениям R_k (именно эти свойства оказываются нужными при работе
механизма рассуждений).

Пример 4.10

Например, относительно двух событий: «рост заработной платы» и «повышение уров-
ня жизни» эксперт сообщил, что «рост заработной платы» обычно сопровождается
«повышением уровня жизни». Тогда возникают вопросы:

а) повышение уровня жизни всегда сопровождается ростом заработной платы?

б) повышение уровня жизни обычно сопровождается ростом заработной платы?

в) повышение уровня жизни может сопровождаться ростом заработной платы?

Ответ эксперта а) будет свидетельствовать о том, что исходное сообщение относится к
типу Т₂табл. 4.6; ответ в) — исходное сообщение относится к типу Т, „том же таблицы.
Далее появляются гипотезы о том, что сообщение эксперта и нтерпре—тируется отноше-
нием R₂ ил" rio ^в зависимости от ответа а) или в). Повышение степеиш достоверности
такой гипотезы возможно при использовании стратегии подтиергэкдснмя сходства
[Осипов, 1989|.

Стратегия подтверждения сходства является комбинированной., основанной на
взаимодействии стратегий разбиения на ступени и выявления очодства, а также
на анализе свойств событий (если они определены).

Например, в результате работы стратегии выявления сходства установлена при-
надлежность предыдущего примера отношению R;,. На оспованшш определения
отношения R₂ для всякого свойства первого события найдете я единственное
свойство второго события, и наоборот, так что область значения свойства перво-
го события является подобластью области значений соответству ющего свойства
второго события. В случае выполнения этого условия гипотеза о принадлежнос-
ти предыдущего примера отношению R₂ считается достоверным утверждением,
в противном случае запускается стратегия разбиения на ступени в: целью выявле-
ния новых свойств событий, для которых было бы верно это ус_ловие. Если, не-
смотря на это, условие достоверности не выполняется, то статус гипотезы сохра-
няется, однако в базе знаний системы появляется информация о некорректности
соответствующей связи между событиями. Эта информация ограничивает воз-
можность использования построенной связи, например, с точки прения механиз-
ма наследования свойств. При работе стратегий выявления и подтверждения
сходства сценарий работы называется системой.

Моделирование рассуждений в системе MIR

Введем следующие обозначения:

О — опрос признаков из множества S;

П — порождение множества гипотез Г;

И — сключение множества гипотез Г.

Элементы данных типа «стрелка», соответствующие отношению R₁₂, будем назы-
вать отрицательными связями, остальные — положительными.
Работа системы MIR начинается с работы модуля О, затем модуль П строит мно-
жество гипотез Г на основе анализа положительных связен S с Г,Ц—пя подтвержден-
ных признаков S. Множество гипотез Г используется модулем О для порождения
нового множества признаков S_r связанных с гипотезами из Г гмоложнтсльными
связями, и осуществления их тестирования. К подтвержденным признакам из S,
применяется модуль П для порождения нового множества гипо—тез Г,. Выполня-
ются операции Г: = Г и Г,, S: = S и S,. Этот процесс продолжается итеративно до
стабилизации множества S и Г. Затем выполняется модуль И иск_лючения гипотез
из Г на основе анализа отрицательных связей для нодтвержде!— шя симптомов и
анализа положительных связей для обусловленных признаков, -то есть таких не-

160

Глава 4 • Технологии инженерии знаний

подтвержденных признаков, отсутствие которых имеет большее значение для
принятия решения, чем их присутствие.

Если в результате выполнения модуля И во множестве гипотез осталось более
одной гипотезы, то выполняется поиск дифференциальных признаков для под-
множеств множества гипотез (дифференциальным признаком для некоторого
множества гипотез называется значение свойства, характерное для одной гипо-
тезы из множества и нехарактерное для других, или событие, связанное положи-
тельной связью с одной гипотезой из множества и не связанное таковой с други-
ми). В результате этого процесса происходит исключение соответствующих
гипотез. При необходимости процедура повторяется для оставшегося множества
гипотез до его стабилизации.

После выполнения еще нескольких модулей осуществляется анализ полученного
множества гипотез с целью поиска его минимального подмножества, связанного
положительными связями со всеми подтвержденными признаками и тем самым
объясняющего их. Это последнее множество и считается окончательным резуль-
татом.

Н

овые тенденции
и прикладные
аспекты инженерии
знаний

а Латентные структуры знаний и психосемантика

п Метод репертуарных решеток

с Управление знаниями

п Визуальное проектирование баз знаний как инстругу

d Проектирование гипермедиа БД и адаптивных обучающих сисзтем

5.1. Латентные структуры знаний
и психосемантика

Большинство систем приобретения знаний (обзор в п. 4.5) облегчают сложный и
трудоемкий процесс формирования баз знаний и реализуют прямой диалог с эк-
спертом. Однако выявляемые таким образом структуры знаний частсэ отражают
лишь поверхностную составляющую знаний эксперта, не затрагивая их глубин-
ной структуры. Этим же недостатком обладает большинство методов непосред-
ственного извлечения знаний (параграфы 4.1.-4.3).

Для извлечения глубинных пластов экспертного знания можно воспользоваться
методами психосемантики — науки, возникшей на стыке когнитивноий психоло-
гии, психолингвистики, психологии восприятия и исследований индивидуаль-
ного сознания. Психосемантика исследует структуры сознания через— моделиро-
вание индивидуальной системы знаний [Петренко, 1988] и выявление тех
категориальных структур сознания, которые могут не осознаваться (патентные,
имплицитные или скрытые) [Петренко, 1983; Терехина, 1988; Шмелев, 1983].

Т. А. Гаврилова, В. Ф. Хорошевский

БАЗЫ ЗНАНИЙ

ИНТЕЛЛЕКТУАЛЬНЫХ
СИСТЕМ

Базовый курс для студентов высших
учебных заведений

Эта книга предназначена для студентов

технических университетов и их преподавателей,

для аспирантов и магистров, бакалавров

и практиков-разработчиков. Она написана для всех

тех, кто хочет вступить в мир науки с интригующим

названием — ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ.

Необычность ее — в подчеркнутой

междисци пли парности выбранного подхода, отказе

от «плановости» отдельных научных школ

и направлений, поэтому этот учебник могут читать

инженеры и математики, экономисты и биологи,

программисты и медики. Он практически не требует

предварительной подготовки в данной области

знаний и рассчитан на широкий круг читателей,

заинтересованных разработкой интеллектуальных

систем, основанных на знаниях.

Освоив изложенный материал, заинтересованный

читатель сможет самостоятельно приступить

к разработке интеллектуальной системы

в роли инженера по знаниям.

ISBN 5-272-00071-4

9 785272 000712

Blog

Т. А. Гаврилова В. Ф. Хорошевский

Содержание