То особое внимание, уделяемое проблеме интеграции и структурировании разнородной информации, часть которой составляют бесценный опыт и знания специалистов фирмы

Вид материалаЛекция

Содержание


О выборе метода
Пассивные методы
Пассивные методы извлечения знаний
Характерис-тики предметной области
Анализ протоколов «мыслей вслух»
Методы приобретения знаний.
Рис 2.Классификация методов приобретения знаний
Приобретение знаний на метауровне
Языки представления.
Способы описания объектов.
Правила обобщения.
Управление обучением.
Подобный материал:

Базы данных, базы знаний и экспертные системы 2 Лекция 16

Процедуры извлечения знаний


Одна из ведущих тенденций на рынке корпоративных информационных систем - это особое внимание, уделяемое проблеме интеграции и структурировании разнородной информации, часть которой составляют бесценный опыт и знания специалистов фирмы.

Управление знаниями (knowledge management, KM) - это совокупность процессов, которые управляют созданием, распространением, обработкой и использованием информации предприятия.

Рассмотрев ранее основные теоретические аспекты инженерии знаний - науки, изучающей закономерности работы со знаниями, мы, однако, в явном виде не определили, каким образом эти знания получены. Предполагалось, что происходит некоторое взаимодействие аналитиков-разработчиков ИС и экспертов-специалистов в форме непосредственного живого общения.

Основной принцип классификации методов извлечения знаний - по источнику знаний. Палитра методов, описанная в данной классификации, позволит аналитикам в зависимости от конкретной задачи и ситуации выбрать подходящий метод.


Коммуникативные методы охватывают способы и процедуры контактов аналитика с непосредственным источником знаний - специалистами и экспертами предприятия, а текстологические включают методы извлечения знаний из документов (методик, регламентов, служебных руководств) и специальной литературы (статей, монографий, учебников). Разделение методов на верхнем уровне классификации не означает их антагонистичности; обычно аналитик комбинирует различные методы.

Коммуникативные методы, в свою очередь, можно разделить на две группы. Пассивные методы подразумевают, что ведущая роль в процедуре извлечения передается эксперту, а аналитик только протоколирует рассуждения эксперта во время его реальной работы по принятию решений или записывает то, что эксперт считает нужным самостоятельно рассказать в форме лекции.

В активных методах, напротив, инициатива переходит к аналитику, который активно контактирует с экспертом - в играх, диалогах, беседах "за круглым столом" и т. д.

Следует подчеркнуть, что и активные, и пассивные методы могут чередоваться даже в рамках одного сеанса извлечения знаний. Например, если аналитик застенчив и не имеет большого опыта, то вначале он может использовать пассивные методы, а постепенно, ближе знакомясь с экспертом, захватывать инициативу и переходить в «наступление».

Пассивные методы на первый взгляд просты, но на самом деле требуют от аналитика умения четко анализировать «поток сознания» эксперта и выявлять в нем значимые фрагменты знаний. Отсутствие обратной связи (пассивность аналитика) значительно ослабляет эффективность этих методов, чем и объясняется то, что обычно они играют вспомогательную роль.

Активные методы можно разделить на две группы в зависимости от числа экспертов-специалистов. Если экспертов больше одного, то целесообразно, помимо серии индивидуальных контактов с каждым, применять и методы групповой работы. Такие групповые методы обычно активизируют мышление участников дискуссий и позволяют выявлять весьма нетривиальные аспекты их знаний. В свою очередь, индивидуальные методы на сегодняшний день остаются ведущими, поскольку столь деликатная процедура, как «отъем знаний», не терпит лишних свидетелей.

Игровые методы сейчас используются в социологии, экономике, менеджменте, педагогике, для подготовки руководителей и политиков. Игра - это особая форма деятельности и творчества, где человек раскрепощается и чувствует себя свободнее, чем в обычной трудовой деятельности.


О выборе метода

На выбор метода влияют три фактора: личностные особенности аналитика и эксперта и характеристика предметной области.

Одна из возможных классификаций людей по психологическим характеристикам выделяет три их типа:
  • мыслитель (познавательный тип);
  • собеседник (эмоционально-коммуникативный тип);
  • практик (практический тип).


Мыслители ориентированы на интеллектуальную работу, учебу, теоретические обобщения и обладают аналитическим способностями. Собеседники - это общительные, открытые люди, готовые к сотрудничеству. Практики предпочитают действие разговорам, хорошо реализуют замыслы других, направлены на результативность работы. В соответствии с этой классификацией практикующий аналитик может подобрать для себя наиболее подходящие методы.

Для характеристики моделируемых знаний можно предложить следующую классификацию:
  • хорошо документированные;
  • среднедокументированные;
  • слабодокументированные.


Эта классификация связана с соотношением двух видов знаний Z1 и Z2, где Z1 - это экспертное "личное" знание, a Z2 - материализованное в документах «общее» знание в данной конкретной области.

Кроме этого, бизнес-процессы, характеризующие деятельность предприятия, можно разделить по критерию структурированности знаний. Под структурированностью будем понимать степень выявленности основных закономерностей и принципов, действующих в данной предметной области.


По степени структурированности знаний предметные области могут быть:
  • хорошо структурированными - с четкими определениями, устоявшейся технологией и терминологией;
  • среднеструктурированными - с определившейся терминологией, развивающейся технологией, явными взаимосвязями между процессами;
  • слабоструктурированными - с размытыми определениями, часто меняющейся структурой, скрытыми взаимосвязями, с большим количеством «белых пятен».


Приведенные классификации методов и предметных областей помогут разработчикам ИС, четко определив свою предметную область, соотнести ее с предложенными типами и наметить подходящий метод или группу методов извлечения знаний. Заметим, однако, скорее всего, реальная работа полностью зачеркнет его выбор, и окажется, что хорошо документированная область на самом деле - слабо документированная, а метод наблюдений надо срочно заменять играми!

Такова реальная сложность процедур извлечения знаний.


Пассивные методы

В соответствии с классификацией рассмотрим подробнее одну из разновидностей коммуникативных методов: пассивные методы. Термин «пассивные» не должен вызывать иллюзий, поскольку он введен в противовес «активным» методам. В реальности же пассивные методы требуют от аналитика не меньшей отдачи, чем такие активные методы, как игры и диалог.

Согласно классификации, к этой группе относятся наблюдения; анализ протоколов «мыслей вслух»; лекции.

Сравнительная характеристика пассивных методов извлечения знаний представлена в таблице.


Пассивные методы извлечения знаний

Метод

Достоинства

Недостатки

Желаемые
качества эксперта


Требования к аналитику

Характерис-тики предметной области

Наблю-дения

Отсутствие субъективного влияния аналитика
Приближение аналитика к процессу

Нет обратной связи
Фрагментар-ность

«Мыслитель»/ «практик»

«Мыслитель»

Слабо- и средне-структуриро-ванные; слабо- и средне-документиро-ванные

«Мысли вслух»

Обнаженность структур знаний
Свобода самовыражения для специалиста

Нет обратной связи
«Зашумленность» лишней информацией

«Собеседник»/ «мыслитель»

«Мыслитель»/ «собеседник»

То же

Лекции

Высокая концентрация знаний
Отсутствие субъективного влияния аналитика

Мало хороших лекторов
Слабая обратная связь

«Мыслитель» с лекторскими способностями

«Мыслитель»

Слабо-документиро-ванные и слабо-структуриро-ванные


Наблюдения

В процессе наблюдений аналитик находится непосредственно рядом с экспертом во время его профессиональной деятельности. При подготовке к сеансу извлечения знаний эксперту-специалисту необходимо объяснить цель наблюдений и попросить комментировать свои действия.

Во время сеанса аналитик записывает действия эксперта, его реплики и объяснения. Можно сделать и видеозапись. Непременное условие этого метода - невмешательство аналитика в работу эксперта. Именно метод наблюдений - единственный «чистый» метод, исключающий вмешательство аналитика и навязывание им своих представлений эксперту.

Существуют две разновидности проведения наблюдений: наблюдение за реальным процессом и наблюдение за имитацией процесса (обычно используются обе). Сначала аналитику полезно понаблюдать за реальным процессом, чтобы глубже понять специфику бизнес-процесса. Это необходимо для проектирования эффективного интерфейса пользователя. Ведь будущая ИС должна работать именно в контексте такого реального административного или производственного процесса. Кроме того, наблюдение позволит аналитику увидеть процесс, а, как известно, лучше один раз увидеть, чем сто раз услышать.

Наблюдение за имитацией процесса проводят обычно за рабочим местом эксперта, но сам процесс деятельности запускается специально для аналитика. Преимущество этого варианта в том, что эксперт менее напряжен, чем в первом случае, когда он работает на "два фронта": и ведет профессиональную деятельность, и демонстрирует ее. Недостаток совпадает с преимуществом: именно меньшая напряженность влияет на результат - раз работа ненастоящая, то и решение может отличаться от настоящего.

Наблюдения за имитацией проводят также, когда наблюдения за реальным процессом по каким-либо причинам невозможны (например, профессиональная этика юриста может не допускать присутствия постороннего).


Сеансы наблюдений могут потребовать от аналитика:
  • овладения техникой стенографии для фиксации действий эксперта;
  • ознакомления с методиками хронометража для четкого структурирования производственного процесса по времени;
  • развития навыков «чтения по глазам», т.е. наблюдательности по отношению к жестам, мимике и другим невербальным компонентам общения;
  • серьезного предварительного знакомства с предметной областью, так как из-за отсутствия "обратной связи" иногда в действиях экспертов многое непонятно.


Протоколы наблюдений после сеансов в ходе "домашней работы" расшифровываются, а затем обсуждаются с экспертом.

Таким образом, наблюдения - один из наиболее распространенных методов извлечения знаний на начальных этапах разработки. Обычно он применяется не самостоятельно, а в совокупности с другими методами.


Анализ протоколов «мыслей вслух»

Протоколирование «мыслей вслух» отличается от наблюдений тем, что эксперта-специалиста просят не просто прокомментировать свои действия и решения, но и объяснить, как это решение было найдено, т.е. продемонстрировать всю цепочку рассуждений. Во время рассуждений специалиста все его слова, весь «поток сознания» протоколируется; при этом отмечаются даже паузы и междометия. Иногда этот метод называют «вербальные (словесные) отчеты».

Вопрос об использовании диктофонов является спорным, поскольку запись иногда действует на специалиста парализующе, разрушая атмосферу доверительности, которая может и должна возникать при непосредственном общении.

Основная трудность при протоколировании «мыслей вслух» состоит в том, что человеку принципиально сложно объяснить, как он думает. Существуют экспериментальные психологические доказательства того факта, что люди не всегда в состоянии достоверно описывать мыслительные процессы. Кроме того, некоторые знания, хранящиеся в невербальной форме (например, различные процедурные знания типа «как завязывать шнурки»), вообще слабо коррелируют с их словесным описанием. Один из пионеров разработки интеллектуальных систем М. Минский (США) считает, что «только как исключение, а не как правило, человек может объяснить то, что он знает».

Расшифровку полученных протоколов аналитик проводит самостоятельно с коррекциями на следующих сеансах извлечения знаний. Удачно проведенное протоколирование «мыслей вслух» - один из наиболее эффективных методов, поскольку в нем эксперт может проявить себя максимально ярко, он ничем не скован, свободен в потоке собственных умозаключений и рассуждений, имея возможность блеснуть эрудицией, продемонстрировать глубину своего опыта. Для многих экспертов это приятный и лестный способ извлечения знаний.

Метод "мысли вслух" требует от аналитика тех же умений, что и метод наблюдений. Обычно "мысли вслух" дополняются потом одним из активных методов для реализации обратной связи.


Лекции

Лекция - очень старый способ передачи знаний. Лекторское искусство издревле высоко ценилось во всех областях. Но нас сейчас интересует не столько способность к подготовке и чтению лекций, сколько способность эту лекцию слушать, конспектировать и усваивать. Если эксперт имеет опыт преподавателя, то можно воспользоваться таким концентрированным фрагментом знаний, как лекция.

В лекции эксперту предоставлено много степеней свободы для самовыражения; однако, аналитик должен сформулировать эксперту тему и задачу лекции. Например, тема цикла лекций может звучать как «Заключение контракта - подготовка документации», тема конкретной лекции «Подготовка соглашения о намерениях», задача - передать знания по преддоговорной деятельности. При такой постановке опытный лектор может заранее структурировать свои знания и ход рассуждений. От аналитика в этой ситуации требуется лишь грамотно законспектировать лекцию и в конце ее задать необходимые вопросы.

Студенты знают, что конспекты лекций в группе существенно различаются. Люди, умело ведущие конспект, - обычно сильные студенты (именно их конспект копируют остальные).

Искусство ведения конспекта заключается в «помехоустойчивости»: записывать главное, опускать второстепенное, выделять фрагменты знаний (параграфы, подпараграфы), записывать только осмысленные предложения, уметь обобщать.

Хороший вопрос по ходу лекции помогает и лектору, и слушателю. Серьезные и глубокие вопросы могут существенно поднять авторитет аналитика в глазах эксперта.

Опытный лектор знает, что вопросы можно условно разбить на три группы:
  • умные вопросы, углубляющие лекцию;
  • глупые вопросы или вопросы не по существу;
  • вопросы «на засыпку», или провокационные.

Если аналитик задает вопросы второго типа, то возможны две реакции. Вежливый эксперт-специалист будет разговаривать с таким аналитиком, как с ребенком, который сейчас ничего не понимает и все равно уже не поймет. Заносчивый эксперт просто выйдет из контакта, не желая терять время. Если же аналитик захочет продемонстрировать свою эрудицию вопросами третьего типа, то ничего, кроме раздражения и отчуждения, он, по-видимому, в ответ не получит.

Продолжительность лекции рекомендуется стандартная - от 40 до 50 мин и через 5-10 мин - еще столько же.

Метод извлечения знаний в форме лекций, как и все пассивные методы, используют в начале разработки как эффективный способ быстрого погружения аналитика в предметную область.


И в заключение шесть советов аналитику, как правильно слушать лекции:
  1. К лекции подготовьтесь, т. е. познакомьтесь с деятельностью предприятия.
  2. Слушайте с максимальным вниманием, для этого устраните мешающие факторы (скрип двери, шорохи) и удобно устройтесь.
  3. Дайте отдохнуть Вашему вниманию - делайте паузы (например, когда лектор приводит незначительные факты).
  4. Слушайте одновременно и лектора, и самого себя (параллельно с мыслями лектора по ассоциации возникают собственные мысли).
  5. Записывайте сокращенно, используя условные значки, и расшифруйте записи в тот же день.
  6. Не спорьте с лектором в процессе лекции.



Методы приобретения знаний.


Под приобретением знаний будем понимать процесс наполнения базы знаний экспертом с использованием специализированных программных средств.1

Приобретение знаний реализуется с помощью двух функций: получения информации извне и ее систематизации. При этом в зависимости от способности системы обучения к логическим выводам возможны различные формы приобретения знаний, а также различные формы получаемой информации. Форма представления знаний для их использования определяется внутри системы, поэтому форма информации, которую она может принимать, зависит от того, какие способности имеет система для формализации информации до уровня знаний. Если обучающаяся система совсем лишена такой способности, то человек должен заранее подготовить все, вплоть до формализации информации, т. е. чем выше способности машины к логическим выводам, тем меньше нагрузка на человека.

Функции, необходимые обучающейся системе для приобретения знаний, различаются в зависимости от конфигурации системы. В дальнейшем при рассмотрении систем инженерии знаний предполагается, что существует система с конфигурацией, которая включает базу знаний и механизм логических выводов, использующий эти знания при решении задач. Если база знаний пополняется знаниями о стандартной форме их представления, то этими знаниями также можно воспользоваться. Следовательно, от функций обучения требуется преобразование полученной извне информации в знания и пополнение ими базы знаний.

Можно предложить следующую классификацию систем приобретения знаний, которая будет опираться на способность системы к восприятию знаний в разных форматах, качественно различающихся между собой и способностью к формализации (рис 2).





Рис 2.Классификация методов приобретения знаний


Обучение без выводов.


Категорию А можно назвать обучением без выводов или механическим запоминанием, это простой процесс получения информации, при котором необязательны функции выводов, а полученная информация в виде программ или данных используется для решения задач в неизменном виде. Другими словами, это способ получения информации, характерный для существующих компьютеров.

Категория Б -это получение информации извне, представленной в форме знаний, т. е. в форме, которую можно использовать для выводов. Обучающейся системе необходимо иметь функцию преобразования входной информации в формат, удобный для дальнейшего использования и включения в базу знании.

Приобретение знаний на этом этапе происходит в наиболее простой форме: это знания, предварительно подготовленные человеком во внутреннем формате, какими являются большинство специальных знаний, изначально заданных в экспертных системах. В случае прикладных систем инженерии знаний необходимо преобразовать специальные знания из какой-либо области в машинный формат, но для этого нужен посредник – инженер по знаниям, хорошо знающий как проблемную область, так и инженерию знаний. В общем случае для замены функции посредника можно использовать и специальные подпрограммы, т.е. необходимо иметь функции выводов достаточно высокого уровня, но можно ограничиться и выводами на сравнительно низком уровне, а остальное доверить человеку - в этом и состоит приобретение знаний в диалоге.

Примером служит хорошо известная система TEIRESIAS. Это система-консультант в области медицины, разработанная на базе системы MYCIN. Специалисты в проблемной области являются преподавателями обучающейся системы, а ученик - система инженерии знаний - изучает ответы на поставленные задачи и корректирует те правила в базе знаний, которые ранее приводили к ошибкам.

Для подготовки знаний в экспертной системе необходимы вспомогательные средства типа редактора знаний, причем в процессе приобретения знаний в диалоге не только редактируются отдельные правила и факты, но и восполняются недостатки существующих правил, т. е. ведется редактирование базы знаний.

Если знания заданы во внешнем формате, например на естественном языке, то следует преобразовать их во внутренний формат. Для этого необходимо понимать внешнее представление, т. е. естественный язык, графические данные и т. п. Фактически приобретение знаний и их понимание тесно связаны. Проблема понимания сводится не только к преобразованию структуры предложений - необходимо получить формат, удобный для применения. Аналогичная проблема - преобразование во внутренний формат советов, подсказок по решению задач, что называется «операционализацией» знаний. В этом заключается центральная проблема искусственного интеллекта; она, в частности, изучает преобразование советов, подсказок, представленных в терминах проблемной области, в процедуры. Например, система UNDERSTAND выполняет операционализацию представления задачи о ханойской башне на английском языке путем построения соответствующих состояний и операций, приводящих к этим состояниям.


Приобретение знаний на метауровне

Выше было рассмотрено обучение на объектном уровне, а еще более сложная проблема - приобретение знаний на метауровне, т. е. знаний, основой которых является информация по управлению решением задач с использованием знаний на объектном уровне. Для знаний на метауровне пока не установлены ни формы представления и использования, ни связь со знаниями на объектном уровне, ни другая техника их систематизации. Поскольку не определена форма их представления с точки зрения использования, то трудно говорить о приобретении знаний на метауровне. Тем не менее с этой проблемой связаны многие надежды в инженерии знаний.


Приобретение знаний из примеров.

Метод приобретение знаний из примеров отличается от предыдущего метода, тем, что здесь выполняется сбор отдельных фактов, их преобразование и обобщение, а только затем они будут использованы в качестве знаний. И соответственно от уровня сложности системы вывода в системе будут возникать разные по степени общности и сложности знания. Необходимо также упомянуть о том, что этот метод приобретения знаний почти не нашёл практического применения, это может быть связано с тем, что входная информация представляет собой не систематизированный набор данных и для их обработки требуется наличие в системе обширных знаний по конкретной области.

По сравнению с предыдущим методом приобретения знаний, этот метод имеет большую степень свободы и соответственно необходимо описать общие положения этого принципа.
  1. Языки представления. Обучение по примерам - это процесс сбора отдельных фактов, их обобщение и систематизация, поэтому необходим унифицированный язык представления примеров и общих правил. Эти правила, будучи результатом обучения, должны стать объектами для использования знаний, поэтому и образуют язык представления знаний. И наоборот, язык представления знаний должен учитывать и определять указанные выше условия приобретения знаний.



  1. Способы описания объектов. В случае обучения по примерам из описаний отдельных объектов создаются еще более общие описания объектов некоторого класса, при этом возникает важная проблема: как описать данный класс объектов. В полном классе некоторых объектов следует определить меньший класс объектов, обладающих общим свойством (объекты только в этом классе обладают заданным свойством), но в действительности проще определить список объектов и убедиться, что все объекты в нем обладают общим свойством. Для некоторого типа задач можно эффективно использовать ложные примеры или контрпримеры, убедительно показывающие, что данные объекты не входят в этот класс. Иллюстрацией применения контрпримеров может служить понятие «почти то».



  1. Правила обобщения. Для сбора отдельных примеров и создания общих правил необходимы правила обобщения. Предложено несколько способов их описания: замена постоянных атрибутов языка на переменные, исключение описаний с ограниченным применением и т. п. Очевидно, что эти способы тесно связаны с языком представления знаний.



  1. Управление обучением. В процессе обучения по примерам можно применять различные стратегии структуризации информации и необходимо управлять этим процессом в ответ на входные данные. Существуют два классических метода: метод «снизу-вверх», при .котором, последовательно выбираются и структурируются отдельные сообщения, и метод «сверху-вниз», при котором сначала выдвигается гипотеза, а затем она корректируется по мере поступления информации. На практике эти методы комбинируются, хотя управление обучением с максимальным эффектом не такая уж простая проблема.


При изучении метода приобретения знаний по примерам можно выделить следующий ряд методов:
    1. Параметрическое обучение
    2. Обучение по аналогии
    3. Обучение по индукции.


Параметрическое обучение.

Наиболее простая форма обучения по примерам или наблюдениям состоит в определении общего вида правила, которое должно стать результатом вывода, и последующей корректировки входящих в это правило параметров в зависимости от данных. При этом используют психологические модели обучения, системы управления обучением и другие методы.

Примером обучающейся системы этой категории в области искусственного интеллекта является система Meta-Dentral. Эта система выводит новые правила путем коррекции правил продукций в процессе обучения или на основе исходных массспектральных данных параметрическое обучение в ней представлено в несколько специфичном виде, но все же она относятся к указанной выше категории, поскольку в системе задана основная структура знаний, которая корректируется последовательно по отдельным данным.

Ярким примером применения этого метода приобретения знаний могут также служить системы распознавания образов. В них ясно просматривается основной принцип этого метода - в ходе обучения нейронная сеть автоматически по определенным заранее законам корректирует веса связей между элементами и значения самих элементов.


Метод обучения по индукции.

Среди всех форм обучения необходимо особо выделить обучение на основе выводов по индукции - это обучение с использованием выводов высокого уровня, как и при обучении по аналогии. В процессе этого обучения путем обобщения совокупности имеющихся данных выводятся общие правила. Возможно обучение с преподавателем, когда входные данные задает человек, наблюдающий за состоянием обучающейся системы, и обучение без преподавателя, когда данные поступают в систему случайно. И в том, и в другом случае выводы могут быть различными, они имеют и различную степень сложности в зависимости от того, задаются ли только корректные данные или, в том числе, и некорректные данные и т. п. Так или иначе, обучение этой категории включает открытие новых правил, построение теорий, создание структур и другие действия, причем модель теории или структуры, которые следует создать, заранее не задаются, поэтому их необходимо разработать так, чтобы можно было объяснить все правильные данные и контрпримеры.

Индуктивные выводы возможны в случае, когда представление результата вывода частично определяется из представления входной информации. В последнее время обращают на себя внимание программы генерации программ по образцу с использованием индуктивных выводов.

Как уже было сказано, индуктивный вывод - это вывод из заданных данных объясняющего их общего правила. При выводе в каждый момент времени объясняются все данные, полученные до этого момента. Разумеется, данные, полученные позже, уже могут и не удовлетворять этому выводу. В таких случаях приходится менять вывод. Следовательно, в общем случае индуктивный вывод-это неограниченно долгий процесс. И это не удивительно, если вспомнить процесс освоения человеком языков, процесс совершенствования программного обеспечения и т. п.


Для точного определения индуктивного вывода необходимо уточнить:
  1. множество правил-объектов вывода,
  2. метод представления правил,
  3. способ показа примеров,
  4. метод вывода и
  5. критерий правильности вывода.


В качестве правил-объектов вывода - можно рассматривать главным образом индуктивные функции, формальные языки, программы и т. п. Кроме того, эти правила могут быть представлены в виде машины Тьюринга для вычисления функций, грамматики языков, операторов Пролога и другим способом. Машина Тьюринга-это математическая модель компьютера, ее в принципе можно считать программой. В случае, когда объектом вывода является формальный язык, он сам определяет правила, а его грамматика - метод представления правил, поэтому говорят о грамматическом выводе.

Для показа примеров функции f можно использовать последовательность пар (х,f(х)) входных и выходных значений так, как указано выше, последовательность действий машины Тьюринга, вычисляющей и другие данные. Задание машине выводов пары входных и выходных значений (х, f(х)) функции f соответствует заданию системе автоматического синтеза программ входных значений х и выходных значений f(х), которые должны быть получены программой вычисления f в ответ на х. В этом смысле автоматический синтез программ по примерам также можно считать индуктивным выводом функции f. Формальные языки - это множество слов; поэтому, например, для языка L можно рассматривать ва типа слов, принадлежащих и не принадлежащих этому языку. Первые назовем положительными, а вторые - отрицательными данными. Другими словами, есть два способа показа примеров формального языка: с помощью положительных и отрицательных данных. Когда объектом служат сами программы, тогда то же самое можно говорить о функциях языка Лисп, но для Пролога показ примеров осуществляется в виде фактов. Например,   (3>4, истина), (2<=1, ложь). В этом случае положительным данным соответствуют данные с атрибутом "истина", а отрицательным - данные с атрибутом "ложь".

Вывод реализуется благодаря неограниченному повторению основного процесса: запрос входных данных -> предположение -> выходные данные. Другими словами, при выводе последовательно получают примеры как входные данные, вычисляют предположение па данный момент и выдают результат вычислений. Предположение в каждый момент времени основано на ограниченном числе примеров, полученных до сих пор, поэтому обычно в качестве метода вывода используют машину Тьюринга, вычисляющую предположение по ограниченному числу примеров. Такую машину назовем машиной выводов.

Учитывая, что индуктивный вывод, как уже было отмечено, это неограниченно продолжающийся процесс, критерием правильности вывода, как правило, считают понятие идентификации в пределе. Это понятие введено Голдом, оно используется почти всегда в теории индуктивных выводов. Говорят, что машина вывода М идентифицирует в пределе правило R, если при показе примеров К последовательность выходных данных, генерируемых М, сходится к некоторому представлению т, а именно: все выходные данные, начиная с некоторого момента времени, совпадают с т, при этом т называют правильным представлением К.. Кроме того, говорят, что множество правил Г позволяет сделать индуктивный вывод, если существует некоторая машина выводов М, которая идентифицирует в пределе любое правило К из множества Г. Обратите внимание на то, что слова "позволяет сделать индуктивный вывод" не имеют смысла для единственного правила, а относятся только к множеству правил.


Обучение по аналогии.

Приобретение новых понятий возможно путем преобразования существующих знаний, похожих на те, которые собираются получить. Это важная функция, которую называют обучением на основе выводов по аналогии или просто обучением по аналогии. В нашей жизни много примеров, когда новые понятия или технические приемы приобретаются с помощью аналогии.

Выводы по аналогии - один из важных объектов исследования искусственного интеллекта, наиболее интересные результаты здесь получены П. Уинстоном. Он использует выводы по аналогии, основываясь на следующей гипотезе: «Если две ситуации подобны по нескольким признакам, то они подобны и еще по одному признаку». Подобие двух ситуаций распознается путем обнаружения наилучших совпадений по наиболее важным признакам.

Аналогия-это метод выводов, при которых обнаруживается подобие между несколькими заданными объектами; благодаря переносу фактов и знаний, справедливых для одних объектов, на основе этого подобия на совсем другие объекты либо определяется. способ решения задач, либо предсказываются неизвестные факты и знания. Следовательно, когда человек сталкивается с неизвестной задачей, он на первых порах использует этот естественный метод вывода.


Направления исследования аналогии

Одна из важнейших проблем инженерии знаний - приобретение знаний - машинное обучение, включает приобретение новых декларативных знаний, систематизацию и хранение новых знаний, а также обнаружение новых фактов. Среди указанных форм обучения аналогия, о которой будет идти далее речь, связана, и частности, с проблемой машинного обнаружения новых фактов.

Под новыми фактами мы будем понимать факты, которые дедуктивно не выводятся из некоторых существующих знаний. Получение новых знаний также рассматривалось выше в отношении к индуктивному выводу . В общем случае при индуктивных выводах по заданным данным создается гипотеза, их объясняющая, а с помощью дедукции из этой гипотезы можно вывести новые факты. С другой стороны, при аналогии новые факты предсказываются путем использования некоторых преобразований уже известных знаний.

Индукция и аналогия крайне необходимы при обработке интеллектуальной информации, и поэтому желательно изложить основы их совместного применения. Шапиро ввел строгую формализацию индуктивных выводов в части вывода моделей с использованием логики предикатов первого порядка; в теории индуктивных выводов есть заметные успехи.

С целью обзора исследований аналогии, проведенных до настоящего времени, выделим два типа аналогии: для решения задач и для предсказаний. Аналогия первого типа применяется главным образом для повышения эффективности решения задач, которые, вообще говоря, можно решить и без аналогии. Например, благодаря использованию решений аналогичных задач в областях программирования и доказательства теорем можно прийти к выводам о программах или доказательствах. С другой стороны, используя аналогию для предсказаний, благодаря преобразованию знаний на основе подобия между объектами можно сделать заключение о том, что, возможно, справедливы новые факты. Например, если объектами аналогии является некая система аксиом, то знаниями могут быть теоремы, справедливые в этой системе. При этом, используя схожесть между системами аксиом, можно преобразовать теорему в одной из систем в логическую формулу для другой системы и сделать вывод о том, что эта формула есть теорема. Другими словами, аналогия используется и для решения некоторых строго сформулированных задач и для предсказаний, а также для приобретения не заданной ранее информации.


Заключение

Современный интерес к системам управления знаниями со стороны разработчиков корпоративных ИС справедливо обусловлен следующими причинами:
  • работники предприятия тратят слишком много времени на поиск необходимой информации;
  • опыт ведущих и наиболее квалифицированных сотрудников используется только ими самими;
  • ценная информация захоронена в огромном количестве документов и данных, доступ к которым затруднен;
  • дорогостоящие ошибки повторяются из-за недостаточной информированности и игнорирования предыдущего опыта.


Изучение же и овладение практическими методами и приемами инженерии знаний может существенно повысить качество проектируемых информационных систем.



1 Т.Гаврилова, Ф. Хорошевский Базы знаний интеллектуальных систем. - СПб, ПИТЕР, 2001



 Н.Алтухова, 2004 www.inf-man.ru