Это процесс передачи знаний и опыта по решению определенного класса задач от источника информации в базу знаний эс

Вид материалаЛекция

Содержание


Прямые методы
Свободное интервью
Активный опрос
Пассивный опрос
Косвенные методы
Подобный материал:

Базы данных, базы знаний и экспертные системы 2 Лекция 14

МЕТОДЫ ПРИБРЕТЕНИЯ ЗНАНИЙ


Приобретение знаний - это процесс передачи знаний и опыта по решению определенного класса задач от источника информации в базу знаний ЭС. В настоящее время существует абсолютное большинство баз знаний (БЗн) основывается на опыте экспертов.


Процесс структуризации знаний (т.е. представления их в виде, приемлемом для загрузки в БЗн экспертной системы (ЭС)) эксперта и передачи результатов этого процесса в БЗн в большинстве случаев достаточно сложен, поэтому на практике с экспертом работает посредник, называемый инженером знаний. Фактически инженер знаний служит интерфейсом в цепочке эксперт - база знаний ЭС. Это избавляет эксперта от изучения довольно сложных правил и языков структуризации знаний. В настоящее время делаются попытки заменить эксперта специальными программами, позволяющими эксперту напрямую загружать базу знаний. Хотя такие программы трудоемки и сложны для реализации, для ряда задач они более эффективны , чем использование инженера знаний.

Приобретение знаний является одним из узких мест процесса разработки ЭС. Так как инженер знаний имеет гораздо меньше знаний о предметной области (ПО), чем эксперт, то возникают проблемы взаимодействия, препятствующие процессу переноса опыта эксперта в ЭС. Терминология предметной области (ПО) часто оказывается неприемлемой для загрузки в БЗн, поэтому эксперт и инженер знаний должны совместно работать, чтобы расширить и уточнить ее. Одним из наиболее трудных аспектов работы инженера знаний является оказание помощи эксперту при попытках структурировать предметные знания, определить и формализовать предметные концепции.


Знания могут приобретаться несколькими способами:
  1. Инженер знаний получает знания эксперта в процессе интенсивного интервью и механически переносит их в базу знаний;
  2. Инженер знаний сам становится экспертом, полагаясь на собственный анализ фраз эксперта, выполняемый им в процессе общения с экспертом; он кодирует знаний на выбранном им языке описания;
  3. Эксперт самостоятельно загружает базу знаний с помощью специальной программы, в какой-то мере исполняющей функции инженера знаний;
  4. Специальная программа анализирует источник знаний (например, базу знаний) и сама преобразует их в форму, пригодную для хранения знаний в БЗн.;
  5. Специальная программа, способная воспринимать и анализировать текстовый источник, структурирует полученную информацию и помещает ее в БЗн.


В мировой практике используются все пять способов, однако два последних требуют наличия специальной дорогостоящей аппаратуры, поэтому все-таки большее распространение получили первые три способа.

Можно выделить два класса приобретения знаний: «прямые» и «косвенные». Прямые методы представляют собой методики, согласно которым инженер знаний задает прямые вопросы эксперту и записывает все, что тот отвечает. Эта группа методов включает: интервьюирование, анкетирование, простое наблюдение, анализ с прерыванием, магнитные записи разговора эксперта о проблемах области, черчение кривых и анализ с постепенным логическим выводом. В основе косвенных методов лежит недоверие в способности эксперта изложить собственные знания о предметной области с достаточной степенью достоверности. С помощью этих методов собирается информация о предметной области в форме некоторой совокупности свойств. Косвенные методы включают: многомерное шкалирование, упорядоченные деревья из воспоминаний, анализ репертуарных решеток, иерархическую кластеризацию и общие весовые сети.

Классификация ручных методов приведена на рис.1.




Планируя работу с экспертом, необходимо учитывать некоторые психологические аспекты, мешающие или помогающие процессу получения знаний и относящиеся ко всем методам приобретения знаний.


ПРЯМЫЕ МЕТОДЫ


Интервью.

Это наиболее общий метод получения знаний эксперта. В процессе интервью эксперт высказывает свое мнение об объектах анализа, о том, как объекты связаны между собой. Достоверность и непротиворечивость этих сведений определяется здравым смыслом эксперта, его умением четко описывать этапы решения проблемной задачи и подходы к выбору конкретного решения. Рассмотрим основные виды интервью, которые применяются на практике в зависимости от конкретных исходных условий.

Свободное интервью предполагает получение информации от экспертов, которые не расположены обсуждать спорные моменты и недостатки своих методов решения проблемных задач. Работа инженера знаний носит пассивный характер, он только фиксирует сказанное и структурирует полученную информацию.

Активный опрос предполагает определенную активность со стороны инженера знаний. Рассуждения эксперта могут прерываться, если инженеру знаний кажется, что эксперт уклонился от главной темы. В начальной фазе опрос проводится в свободной форме, по мере продолжения интервью широта спектра опроса сужается до детально выявления отдельных узких мест проблемной области. Во время опроса инженер знаний должен фиксировать порядок, в каком эксперт адресуется к субъектам решаемой задачи, а также определять коэффициенты уверенности нечетких рассуждений. В данном типе опроса возможно навязывание инженером знаний своего мнения эксперту, поэтому активный опрос выполняют более опытные аналитики.

Пассивный опрос отличается от активного тем, что инженер знаний не навязывает эксперту своего понимания проблемы. Эта разновидность интервью позволит эксперту продолжить разговор, даже если тема разговора стала отклоняться от вопросов решаемой задачи.

Этот вид опроса может использоваться в том случае, если на интервью выделено мало времени или когда эксперт проявляет признаки усталости и дальнейшее получение информации становится проблематичным. Временные ограничения позволяют получить только ключевую информацию, достаточную для решения конкретной задачи, с возможной детализаций ее в будущем.


Анкетирование.

Анкетирование предполагает заполнение экспертом бланков с предварительно сформулированными и определенным образом сгруппированными вопросами. Этот способ является наиболее эффективным, т.к. дает возможность эксперту не спеша отвечать на все поставленные вопросы.

Анкетирование особенно полезно, если инженеру знаний необходимыми открыть новые, неизвестные до этого объекты ПО и при этом обнаружить взаимодействие объектов между собой, а также получить численные значения степени уверенности полученных логических заключений. Ответы шкалируются. Извлекая оценки и вероятности для каждого ответа, можно собрать наиболее точные оценки.


Наблюдение за решением задачи.

В ряде случаев лучшим способом извлечения знаний является наблюдение за тем, как эксперт выполняет реальную работу. В этой ситуации инженер знаний имееет несколько способов определения имен объектов, их взаимоотношений и правил логического вывода, которые использует эксперт для решения своей задачи. Он должен четко представлять, каким образом зафиксировать рассуждения и связанные с ними действия эксперта. Первая возможность - наблюдение и ручная запись на бланк порядка действий эксперта с необходимыми комментариями. Главный недостаток этого - нехватка времени на фиксацию процесса и высокая вероятность влияния инженера знаний на эксперта. Вторая возможность - запись на видеомагнитофон процесса выполнения задачи с последующим его анализом совместно с экспертом.


Анализ протоколов.

Этот метод похож на предыдущий. Инженер знаний наблюдает за поведением эксперта в процесса выполнения им задачи, но дополнительно к видеозаписи и описанию действий эксперта он просит эксперта произносить вслух все рассуждения, сопровождающие процесс решения.

Эксперт должен отвечать на все вопросы, возникающие у инженера знаний в течение всего процесса решения задачи.

При последующей расшифровке полученных записей инженер знаний получает имена объектов, взаимосвязи объектов между собой, правила логического вывода. Он может соотнести полученные знания строго определенным интервалам и получить временную диаграмму последовательности действий, привязанную к возникновению промежуточных ситуаций.


Анализ с прерыванием.

Это один из способов фиксирования естественного процесса размышления эксперта, позволяющий продолжить работу без необходимости размышления вслух. В этом случае инженер знаний сам определяет момент, когда он перестает понимать логику действий эксперта и начинает подробно расспрашивать его с целью выявления подробностей метода решения задачи на этом временном интервале. Следует помнить, что если процесс прерван, вероятность его точного повторения мала.

Процедура анализа с прерыванием дает максимальный эффект в ситуации, когда в ЭС уже закодирован формальный процесс решения задачи и остается лишь сравнить ее работу с протоколом процесса решения, полученного от эксперта.


Черчение замкнутых линий.

Это процедура используется для выявления отношений среди таких объектов, которые могут быть представлены и закодированы в физическом пространстве (например, в декартовой системе координат).

Метод замкнутых кривых предполагает опрос экспертов с целью выявления некоторого подмножества связанных между собой объектов предметной области. Если вокруг такого подмножества объектов, определенных в физическом пространстве, провести линию, то получится замкнутая кривая. Эта технология применима для некоторого пространственного представления, когда признаки изменены и представлены в некотором метрическом пространстве (рис.2).





Анализ с плавным логическим выводом.

Метод представляет вариант интервью. В этом методе основным являются вопросы, связанные с выявлением причинных отношений между объектами. На основе выявленных причинных отношений строится причинная сеть между этими объектами.

Реализация этого метода начинается с определения списка имен некоторых ключевых объектов ПО. Например, если экспертиза проводится в экономике, то список может содержать следующие ключевые слова: «оценка экономии» и «продуктивность».

После того как список составлен, необходимо задать серию упорядоченных вопросов о наличии взаимозависимости между двумя объектами. Например, можно спросить: «Какая зависимость существует между «оценкой экономии» и «продуктивностью».Ответы на такие вопросы выявляют наличие отношений между этими двумя ключевыми понятиями, а также направление взаимосвязи между ними. Например, ответ может быть такой: «Если цена экономии идет вниз, то продуктивность идет вверх». Ответы на группу вопросов должны выявить некоторое пространство в отношениях между представленными переменными. Каждый раз имя объекта, упомянутое в ответе, соединяется с именами других объектов, содержащихся в ответе эксперта, соединяясь между собой и устанавливая над связями отрицательные или положительные метки, которые служат индикаторами.

Таким образом, соединенные между собой имена объектов будут прогрессивность усложняться во всеобъемлющую сеть отношений. При первом упоминании двух имен объектов между ними устанавливается связь с меткой, имеющей первоначальный вес, равный 0.50. С каждым положительным упоминанием отношение, изображенное дугой, увеличивает свою значимость в некоторой пропорции. В случае положительного упоминания, численное значение будет колебаться от 0.5 до 1.0, в противном случае от 0.5 до 0.0.

Хотя алгоритм этого метода кажется в значительной мере развитым, результирующие плавные сети будут устойчивыми. Метод прост в реализации и удобен для отображения аспектов поведения эксперта в процессе экспертизы. Качественно составленная сеть может служить хорошей основой для выявления более фундаментальных отношений.


КОСВЕННЫЕ МЕТОДЫ


В процессе решения проблемной задачи эксперт не может дать полную картину диагностики, т.к. некоторые моменты последней выполняются на уровне диагностики. Этот факт показывает, что эксперт иногда не понимает комплексных отношений между выявленными объектами, а также не всегда может объяснить происхождение логических правил, которые сам же использует в заключениях. Часть действий он может выполнять интуитивно, прием эти действия будут и правильными и полезными для решения задачи, но выразить словами их эксперт не в состоянии. Именно в таких случаях рекомендуется применять косвенные методы извлечения знаний.

Согласно технике косвенных методов инженер знаний не должен задавать вопросы эксперту для «прямого» выявления знаний эксперта о проблемной задаче. Вместо этого экспертам дают решать несколько задач, например, оценить отношение двух объектов или вспомнить имена всех объектов по результатам анализа из нескольких стартовых точек. Затем по результатам анализа делают логические заключения о том, какая формальная организация лежит в основе процесса решения задачи экспертами. Все косвенные методы, рассмотренные ниже, имеют силу на экспериментальной стадии разработки экспертной системы, причем они уже продемонстрировали свою психологическую самостоятельность.

В основу каждого косвенного метода закладывается та или иная форма представления знаний: физическое пространство, список, сеть или таблица. Поэтому в конкретных приложениях важно использовать только те косвенные методы извлечения знаний, в которых заложенная форма представления наиболее адекватна предметной области решаемой задачи.


Многомерное шкалирование.

С помощью этого метода определяется степень сходства (или различия) для каждой пары объектов или понятий, выделенных в рассматриваемой предметной области с целью выявления групп с похожими характеристиками. Он используется в основном для тех типов данных и знаний, которые могут быть представлены n-мерной системе координат.


Рассматриваемый метод предполагает выполнение следующих шагов:
  1. выявление всех объектов ПО;
  2. построение полуматрицы сходства (различия) каждой поры объектов; для этого используются вопросы типа: «Какое отношение сходства вы видите между объектами А и В?»;
  3. графическая интерпретация (объекты обычно отображаются в виде точек);
  4. выявление групп объектов со схожими характеристиками (т.е определение групп точек с наибольшей плотностью).



Рассмотрим использование этого метода на следующем примере:


Метод многомерного шкалирования рекомендуется использовать на этапе предварительного анализа методов логического решения проблемных задач для одного или группы экспертов с последующим более подробным анализом. Многомерное шкалирование помогает выявить «интересные» кластеры объектов, а также отношения с близлежащими и удаленными объектами.

Сложность метода заключается в том, что процесс сбора пар мнений в больших количествах трудоемок и утомителен. Так, для n объектов требуется n(n-1)/2 мнений. Этот метод трудоемок для ручного анализа, когда необходимо найти наиболее плотную группу измерений, определить, как наилучшим образом расположить оси измерений.


Иерархическая кластеризация.

Процедура иерархической кластеризации начинается с заполнения матрицы расстояний и заканчивается представлением объектов ПО. В общем случае алгоритм процесса является итерактивным и предполагает выполнение следующих шагов:
  1. выявление всех объектов ПО;
  2. построение полуматрицы сходства пары объектов;
  3. объединение ближайшей в матрице пары объектов в единый кластер.


Этот кластер вписывается в новую матрицу, выступающую в этом случае как новый предмет. Новая матрица подвергается той же обработке. Из нее выбирается пара объектов, которые наиболее близки между собой. Они опять сводятся вместе , заносятся в новую матрицу, которая образует следующий объект. Таким обоазом, на каждой итерации строится новая матрица с включенными новыми объектами. Межобъектные расстояния для не включенных в кластер элементов при этом копируются из исходной матрицы в новую. Расстояние между объектами подсчитывается как минимум расстояния от всех объектов в кластере дол текущего объекта , либо как минимум, либо как среднее.


Универсальные весовые сети.

Основная идея метода состоит в том, что занесенные в матрицу расстояния порождаются пересекающейся сетью ассоциаций между объектами ПО. Построив сеть, можно представить дугами с указаниями весов отношения между каждыми двумя объектами ПО и на этом основывать дальнейшие рассуждения.

Формирование сети может осуществляться двумя методами. В первом случае формирование происходит из полуматрицы сходства мнений с использованием процедуры минимально соединенной сети (МCN). Сеть этого типа формируется с помощью соединений наиболее близко расположенных объектов. Вторая процедура формирования присоединяет дополнительные дуги к полученной по вышеописанному методу сети. правило добавления дуг к сети MCN состоит в том, что дуга добавляется в том случае, если она «короче», чем существующие дуги в сети между этими объектами. На рис. эти дополнительные дуги показаны тонкими линиями. Полученную сеть принято называть MEN (cеть, полученная по критерию минимального расстояния между объектами).


Метод упорядоченных деревьев.

В отличие от косвенных методов извлечения знаний, описанных ранее, реализация этого метода начинается с произвольной последовательности пробных воспоминаний эксперта, отражающих различные аспекты ПО. В основу этого метода закладывается предположение, что имена объектов, которые вспоминает эксперт с определенной регулярностью, могут или принадлежать кластеру, или нет; предполагается, что регулярности, обнаруженные в процессе воспоминаний эксперта, отражают организацию знаний ПО.

Инженер знаний просит эксперта вспомнить порядок имен объектов, используемых им при решении проблемной задачи. Процедура воспоминаний повторяется от 10 до 20 раз. при этом поощряется разнообразие как начальных моментов, с которых начинает эксперт вспоминать имена, так и начальных имен объектов.

Опыты с воспоминаниями имен объектов фиксируются инженером знаний, а затем анализируются с целью выявления регулярностей. Выделенные регулярные группы имен объектов идентифицируются как последовательные отрезки. Затем инженер знаний интерпретирует эти выделенные регулярности в форме упорядоченного дерева.

Такой анализ можно выполнять вручную, однако при наличии большого количества данных он становится чрезвычайно трудоемким и поэтому его желательно запрограммировать.

КЛАССИФИИКАЦИЯ МЕТОДОВ ИЗВЛЕЧЕНИЯ ЗНАНИЙ




-наблюдение

- протокол «мыслей вслух» - «мозговой штурм» - анкетирование - анализ литературы

- лекции - круглый стол - интервью - анализ учебников

- ролевые игры - диалог - анализ документов

- экспертные игры






 Н.Алтухова, 2004 www.inf-man.ru