Т. А. Гаврилова В. Ф. Хорошевский
Вид материала | Реферат |
- Исследование в 11 классе учителей 1 категории моу «Янгличская сош имени Героя, 80.18kb.
- О. Я. Чекановой заместителя директора Департамента образования атмр, 2067.1kb.
- Н. В. Гаврилова, А. Л. Гусев*, В. И. Кудряш**,, 438.44kb.
- О. Т. Гаврилова, 132.3kb.
- Автор: Гаврилова Ольга Викторовна, 14.56kb.
- Возможные альтернативы, 3457.5kb.
- Семенова Марія Іванівна диплом, 75.73kb.
- Интеграция wiki-технологии и онтологического моделирования в задаче управления знаниями, 110.21kb.
- Липецка Игнатова Елена Юрьевна. Тема реферат, 27.71kb.
- К. В. Самсонова, ст гр. Фк-08-1, Н. В. Гаврилова, викл, 156.11kb.
Т. А. Гаврилова
В. Ф. Хорошевский
БАЗЫ ЗНАНИЙ
ИНТЕЛЛЕКТУАЛЬНЫХ
СИСТЕМ
- студентам вузов,
изучающим вопросы
искусственного
интеллекта в рамках
соответствующих
дисциплин
- разработчикам
интеллектуальных
систем
- всем интересующимся
вопросами инженерии
знаний
Содержание
Предисловие 6
Об авторах 8
От издательства 8
1. Введение в интеллектуальные системы 9
- Краткая история искусственного интеллекта 9
- Основные направления исследований в области
искусственного интеллекта 15
1.3. Представление знаний и вывод
на знаниях 19
1.4. Нечеткие знания 31
2. Разработка систем, основанных на знаниях 39
- Введение в экспертные системы. Определение и структура 39
- Классификация систем, основанных на знаниях 41
- Коллектив разработчиков 45
- Технология проектирования и разработки 49
3. Теоретические аспекты инженерии знаний 59
- Поле знаний 59
- Стратегии получения знаний 67
- Теоретические аспекты извлечения знаний 71
- Теоретические аспекты структурирования знаний 90
4. Технологии инженерии знаний 99
- Классификация методов практического извлечения знаний 99
- Коммуникативные методы 102
- Текстологические методы 124
- Простейшие методы структурирования 131
- Состояние и перспективы автоматизированного приобретения
знаний 137
4.6. Примеры методов и систем приобретения знаний 145
5. Новые тенденции и прикладные аспекты
инженерии знаний 161
- Латентные структуры знаний и психосемантика 161
- Метод репертуарных решеток 176
- Управление знаниями 183
- Визуальное проектирование баз знаний как инструмент познания 190
- Проектирование гипермедиа БД и адаптивных обучающих систем 195
6. Программный инструментарий разработки систем,
основанных на знаниях 203
6.1. Технологии разработки программного обеспечения — цели,
принципы, парадигмы 203
- Методологии создания и модели жизненного цикла
интеллектуальных систем 214
- Языки программирования для ИИ и языки представления знаний 218
- Инструментальные пакеты для ИИ 224
- WorkBench-системы 231
7. Пример разработки системы, основанной на знаниях .... 237
- Продукционно-фреймовый ЯПЗ PILOT/2 237
- Психодиагностика — пример предметной области для построения
экспертных систем 252
- Разработка и реализация психодиагностической ЭС «Cattell» 256
8. Представление данных и знаний в Интернете 271
- Язык HTML и представление знаний 271
- Онтологии и онтологические системы 284
- Системы и средства представления онтологических знаний 301
9. Интеллектуальные Интернет-технологии 317
s
- Программные агенты и мультиагентные системы 317
- Проектирование и реализация агентов и мультиагентных систем 323
- Информационный поиск в среде Интернет 335
|
Заключение 356
Литература 358
С любовью, учителю Д. А. Поспелову, друзьям и близким,
всем, кто помог созданию этой версии учебника,
и, надеемся, будет сотрудничать с нами дальше
Предисловие
Вы открываете необычный учебник — учебник, предназначенный для студентов
технических университетов и их преподавателей, для аспирантов, магистров, ба-
калавров и практиков-разработчиков. Этот учебник написан для тех, кто хочет
вступить в мир науки с интригующим названием — ИСКУССТВЕННЫЙ ИН-
ТЕЛЛЕКТ.
Несмотря на обилие книг с аналогичным названием (см. список основной лите-
ратуры), на сегодняшний день нет вузовского учебника по предметам «Интеллек-
туальные системы», «Экспертные системы», «Базы знаний» и т. д. Тем не менее
практически все технические университеты совершенно справедливо включили
такого рода дисциплины в свои программы. Поскольку бум в этой науке при-
шелся на конец 70-х и 80-е, большинство книг на русском языке издано в эти
годы. И авторы приносят благодарность создателям первых отечественных мо-
нографий и справочников, а также переводчикам классических книг в этой обла-
сти — Д. А. Поспелову, Э. В. Попову, В. Л. Стефанюку, Г. С. Осипову и другим
пионерам, без работ которых создание этого учебника было бы невозможно.
Необычность этого учебника связана также с подчеркнутой междисциплинарно-
стью выбранного подхода, отказом от «клановости» отдельных научных школ и
направлений. Этот учебник могут читать инженеры и математики, экономисты и
биологи, программисты и медики. Он практически не требует предварительной
подготовки в данной области знаний и рассчитан на широкий круг читателей,
заинтересованных разработкой интеллектуальных систем, основанных на зна-
ниях.
Мы отказались от излишней специализации в пользу широты изложения, нам
хотелось представить горизонты этой науки, а не прокопать в ней глубокий, но
узкий туннель.
Другой особенностью учебника является его практическая направленность. Ос-
воив изложенный материал, студент или другой заинтересованный читатель смо-
жет самостоятельно приступить к разработке интеллектуальной системы в роли
инженера по знаниям. Акцент в учебнике сделан именно на работу со знаниями.
Фактически он ориентирован на подготовку уникальных специалистов, спрос на
которых на современном рынке высоких информационных технологий много-
кратно превышает спрос на программистов. Этих специалистов называют по-раз-
ному — системные аналитики, постановщики задач, инженеры по знаниям, инже-
неры-когнитологи. По английски это — knowledge engineers.
Рассмотренные в учебнике вопросы представляют лишь вершину айсберга срав-
нительно молодой науки — ИНЖЕНЕРИИ ЗНАНИЙ. И, надеемся, показывают
ее новые горизонты в мире информационных технологий.
Учитывая значительное число достижений и публикаций в этой области за рубе-
жом, авторы сознательно будут приводить терминологию, используемую в ориги-
налах, что существенно облегчит изучение проблемы желающим повысить свою
квалификацию через Интернет и другие источники англоязычной информации.
Материал учебника основан на курсах лекций, прочитанных авторами для сту-
дентов Санкт-Петербургского государственного технического университета (быв-
ший Политех) и Московского физико-технического института (Технического
университета). Объем курса от 32 до 64 лекционных часов плюс столько же
практических занятий. По сути дела здесь в одном учебнике собрано несколько
курсов лекций, ориентированных на разные специализации и разную базовую
подготовку. В целом же данный учебник, по опыту авторов, содержит материал
для двухгодовых курсов с общим названием «Искусственный интеллект».
Разные категории читателей могут читать учебник по различным «сценариям».
- Сценарий 1 — для студентов-•«сачков» технических вузов перед сессией. По-
метить в оглавлении параграфы, вошедшие в список вопросов для экзамена, и
читать на максимальной скорости.
- Сценарий 2 — для студентов-отличников. Внимательно прочесть весь учебник
последовательно, затем перейти к сценарию 1.
- Сценарий 3 — для студентов-непрограммистов и всех, кто просто интересует-
ся проблемой для расширения кругозора. Главы 1, 2, 4, 9.
- Сценарий 4 — для преподавателей вузов и тех, кто хочет овладеть инженерией
знаний. Использовать учебник как готовый конспект, расширив или сократив
материал по своему усмотрению. Варианты:
» минимальный курс: параграфы 1.1-1.4, 2.1-2.4, 3.2, 3.4, 4.1-4.3, 4.4, 6.3,
8.2, 9.1;
- главы 1-2 могут составить основу вводного курса в проблематику искус-
ственного интеллекта и систем, основанных на знаниях;
- аналогичный вводный курс по тематике программных средств искусствен-
ного интеллекта может дать материал главы 6, параграфа 7.1 и, при нали-
чии времени, 9.1, 9.2;
- семестровый курс по базам знаний экспертных систем может быть прочи-
тан на основе глав 2-4, 7;
- базовый курс по инженерии знаний составляют главы 3,4;
» наконец, главы 8, 9 дают основу для курса по тематике интеллектуальных
Интернет-технологий.
• Сценарий 5 — для системных аналитиков. Главы 3-6.
• Сценарий 6 — для программистов и разработчиков. Главы 2-4, 6-9.
Материал, набранный более мелким шрифтом, носит иллюстративный характер.
В заключение авторы благодарят заведующую редакцией технической литера-
туры издательства «Питер» Екатерину Строганову за энергию и энтузиазм при
убеждении авторов принять решение о начале работы над учебником и поддерж-
ку в ее завершении.
В параграфе 4.6 четвертой главы использованы материалы монографии «При-
обретение знаний интеллектуальными системами», любезно предоставленные
ее автором Г. С. Осиновым.
Глубокую признательность авторы выражают Александру Волкову. Он является
разработчиком программных систем, описанных в пятой главе. Параграф 5.1 на-
писан совместно с А. В. Волковым, работа с которым существенно повлияла на
формирование взглядов одного из авторов.
На подготовку материалов, представленных в параграфах 8.2 и 8.3 восьмой гла-
вы, а также в параграфах 9.1 и 9.3 девятой главы, в значительной мере повлияла
работа по мультиагентным системам и интеллектуальным Интернет-ориентиро-
ванным системам поиска информации, проведенная Н. В. Майкевич. По сути
дела именно ей один из авторов данной книги обязан своей «миграцией» в эту
новую область интеллектуальных информационных технологий из проблемати-
ки программного обеспечения систем искусственного интеллекта.
Отдельная благодарность должна быть высказана Е. Васильевой, Н. Нумеровой
и Н. Сташ, сотрудницам Института высокопроизводительных вычислений и баз
данных Миннауки РФ, за техническую помощь при работе над рукописью, без
которой книга могла бы так и не дойти до читателей.
Главы 1-5 написаны д. т. н., проф. Т. А. Гавриловен, главы 6-9 — д. т. н., проф.
В. Ф. Хорошевским. Предисловие и заключение — результат совместной работы
авторов, которые с надеждой на дальнейшее сотрудничество выражают глубо-
кую признательность всем, кто помог выходу этой книги.
Об авторах
Т. А. Гаврилова — д. т. н., профессор кафедры компьютерных интеллектуальных
технологий Санкт-Петербургского государственного технического университета,
председатель Петербургского отделения Ассоциации искусственного интеллекта.
В. Ф. Хорошевский — д. т. н., профессор МФТИ, заведующий сектором вычис-
лительного центра РАН, член Научного Совета Российской Ассоциации искусст-
венного интеллекта.
От издательства
Ваши замечания, предложения, вопросы отправляйте по адресу электронной по-
чты comp@piter.com (издательство «Питер», компьютерная редакция).
Мы будем рады узнать ваше мнение!
Подробную информацию о наших книгах вы найдете на Web-сайте издательства
.com.
Введение
в интеллектуальные
системы
о Краткая история искусственного интеллекта
d Основные направления исследований в области искусственного
интеллекта
п Представление знаний и вывод на знаниях
d Нечеткие знания
d Прикладные интеллектуальные системы
1.1. Краткая история искусственного
интеллекта
1.1.1. Предыстория
Идея создания искусственного подобия человека для решения сложных задач и
моделирования человеческого разума витала в воздухе еще в древнейшие време-
на. Так, в древнем Египте была создана «оживающая» механическая статуя бога
Амона. У Гомера в «Илиаде» бог Гефест ковал человекоподобные существа-авто-
маты. В литературе эта идея обыгрывалась многократно: от Галатеи Пигмалиона
до Буратино папы Карло. Однако родоначальником искусственного интеллекта
считается средневековый испанский философ, математик и поэт Раймонд Луллий,
который еще в XIII веке попытался создать механическую машину для решения
различных задач, на основе разработанной им всеобщей классификации понятий.
В XVIII веке Лейбниц и Декарт независимо друг от друга продолжили эту идею,
предложив универсальные языки классификации всех наук. Эти работы можно
считать первыми теоретическими работами в области искусственного интеллекта.
Окончательное рождение искусственного интеллекта как научного направления
произошло только после создания ЭВМ в 40-х годах XX века. В это же время Нор-
берт Винер создал свои основополагающие работы по новой науке — киберне-
тике.
Термин «искусственный интеллект» — ИИ — (AI — artificial intelligence) был
предложен в 1956 г. на семинаре с аналогичным названием в Дартсмутском
колледже (США). Семинар был посвящен разработке методов решения логи-
ческих, а не вычислительных задач. В английском языке данное словосочетание
не имеет той слегка фантастической антропоморфной окраски, которую оно при-
обрело в довольно неудачном русском переводе. Слово intelligence означает «уме-
ние рассуждать разумно», а вовсе не «интеллект», для которого есть термин intel-
lect.
Вскоре после признания искусственного интеллекта отдельной областью науки
произошло разделение его на два направления: нейрокибернетика и «кибернети-
ка черного ящика». Эти направления развиваются практически независимо, су-
щественно различаясь как в методологии, так и в технологии. И только в настоя-
щее время стали заметны тенденции к объединению этих частей вновь в единое
целое.
1.1.2. Зарождение нейрокибернетики
Основную идею этого направления можно сформулировать следующим образом:
Единственный объект, способный мыслить, — это человеческий мозг. Поэтому лю-
бое «мыслящее» устройство должно каким-то образом воспроизводить его струк-
туру.
Таким образом, нейрокибернетика ориентирована на программно-аппаратное
моделирование структур, подобных структуре мозга. Физиологами давно уста-
новлено, что основой человеческого мозга является большое количество (до 1021)
связанных между собой и взаимодействующих нервных клеток — нейронов. По-
этому усилия нейрокибернетики были сосредоточены на создании элементов,
аналогичных нейронам, и их объединении в функционирующие системы. Эти си-
стемы принято называть нейронными сетями, или нейросетями.
Первые нейросети были созданы Розенблаттом и Мак-Каллоком в 1956-1965 гг.
Это были попытки создать системы, моделирующие человеческий глаз и его взаи-
модействие с мозгом. Устройство, созданное ими тогда, получило название пер-
септрона (perceptron). Оно умело различать буквы алфавита, но было чувстви-
тельно к их написанию. Например, буквы А, А и А для этого устройства были
тремя разными знаками. Постепенно в 70-80 годах количество работ по этому
направлению искусственного интеллекта стало снижаться. Слишком неутеши-
тельны были первые результаты. Авторы объясняли неудачи малой памятью и
низким быстродействием существующих в то время компьютеров.
Однако в 1980-х в Японии в рамках проекта «ЭВМ V поколения» был создан
первый нейрокомпьютер, или компьютер VI поколения. К этому времени ограни-
чения по памяти и быстродействию были практически сняты. Появились транс-
пьютеры — параллельные компьютеры с большим количеством процессоров.
Транспьютерная технология — это только один из десятка новых подходов к ап-
паратной реализации нейросетей, которые моделируют иерархическую структу-
ру мозга человека. Основная область применения нейрокомпьютеров сегодня —
это задачи распознавания образов, например идентификация объектов по резуль-
татам аэрофотосъемки из космоса.
Можно выделить 3 подхода к созданию нейросетей:
- Аппаратный — создание специальных компьютеров, нейрочипов, плат рас-
ширения, наборов микросхем, реализующих все необходимые алгоритмы.
- Программный — создание программ и инструментариев, рассчитанных на
высокопроизводительные компьютеры. Сети создаются в памяти компьюте-
ра, всю работу выполняют его собственные процессоры.
- Гибридный — комбинация первых двух. Часть вычислений выполняют спе-
циальные платы расширения (сопроцессоры), часть — программные сред-
ства.
Более глубокое рассмотрение этого чрезвычайно перспективного и интересного
направления исследований искусственного интеллекта выходит за рамки данной
книги. Подробнее см. работы [Соколов, Вейткявичус, 1989; Амамия, Танака, 1993].
1.1.3. От кибернетики «черного ящика» к ИИ
В основу этого подхода был положен принцип, противоположный нейрокиберне-
тике.
Не имеет значения, как устроено «мыслящее» устройство. Главное, чтобы на за-
данные входные воздействия оно реагировало так же, как человеческий мозг. Сто-
ронники этого направления мотивировали свой подход тем, что человек не дол-
жен слепо следовать природе в своих научных и технологических поисках. Так,
например, очевиден успех колеса, которого не существует в природе, или самоле-
та, не машущего крыльями, подражая птице. К тому же пограничные науки о че-
ловеке не смогли внести существенного теоретического вклада, объясняющего хо-
тя бы приблизительно, как протекают интеллектуальные процессы у человека,
как устроена память и как человек познает окружающий мир.
Это направление искусственного интеллекта было ориентировано на поиски ал-
горитмов решения интеллектуальных задач на существующих моделях компью-
теров. Существенный вклад в становление новой науки внесли ее «пионеры»:
Маккартни (автор первого языка программирования для задач ИИ — ЛИСПа),
Минский (автор идеи фрейма и фреймовой модели представления знаний), Нъю-
элл, Саймон, Шоу, Хант и другие.
В 1956-1963 гг. велись интенсивные поиски моделей и алгоритмов человеческо-
го мышления и разработка первых программ на их основе. Представители сущес-
твующих гуманитарных наук — философы, психологи, лингвисты — ни тогда, ни
сейчас не в состоянии были предложить таких алгоритмов. Тогда кибернетики
начали создавать собственные модели. Так последовательно были созданы и оп-
робованы различные подходы.
1. В конце 50-х годов родилась модель лабиринтного поиска. Этот подход представ-
ляет задачу как некоторое пространство состояний в форме графа, и в этом
графе проводится поиск оптимального пути от входных данных к результиру-
ющим. Была проделана большая работа по разработке этой модели, но для ре-
шения практических задач эта идея не нашла широкого п-рименения. В первых
учебниках по искусственному интеллекту [Хаит, 1986; Эндрю, 1985] описаны
эти программы — они играют в игру «15», собирают «Ханойскую башню», иг-
рают в шашки и шахматы.
- Начало 60-х — это эпоха эвристического программирования. Эвристика — пра-
вило, теоретически не обоснованное, которое позволяет сократить количество
переборов в пространстве поиска. Эвристическое программирование — разра-
ботка стратегии действий на основе известных, заранее заданных эвристик
[Александров, 1975].
- В 1963-1970 гг. к решению задач стали подключать методы математической
логики. Робинсон разработал метод резолюций, который позволяет автомати-
чески доказывать теоремы при наличии наббра исходных аксиом. Примерно в
это же время выдающийся отечественный математик Ю. С. Маслов предложил
так называемый обратный вывод, впоследствии названный его именем, реша-
ющий аналогичную задачу другим способом [Маслов, 1983]. На основе метода
резолюций француз Алъбер Кольмероэ в 1973 г. создает язык логического про-
граммирования Пролог. Большой резонанс имела программа «Логик-теоре-
тик», созданная Ньюэлом, Саймоном и Шоу, которая доказывала школьные
теоремы. Однако большинство реальных задач не сводится к набору аксиом, и
человек, решая производственные задачи, не использует классическую логику,
поэтому логические модели при всех своих преимуществах имеют существен-
ные ограничения по классам решаемых задач.
- История искусственного интеллекта полна драматических событий, одним из
которых стал в 1973 г. так называемый «доклад Лайтхилла», который был под-
готовлен в Великобритании по заказу Британского совета научных исследова-
ний. Известный математик Д. Лайтхилл, никак с ИИ профессионально не свя-
занный, подготовил обзор состояния дел в области ИИ. В докладе были
признаны определенные достижения в области ИИ, однако уровень их опре-
делялся как разочаровывающий, и общая оценка была отрицательная с пози-
ций практической значимости. Этот отчет отбросил европейских исследова-
телей примерно на 5 лет назад, так как финансирование ИИ существенно
сократилось.
- Примерно в это же время существенный прорыв в развитии практических при-
ложений искусственного интеллекта произошел в США, когда к середине
1970-х на смену поискам универсального алгоритма мышления пришла идея
моделировать конкретные знания специалистов-экспертов. В США появились
первые коммерческие системы, основанные на знаниях, или экспертные систе-
мы (ЭС). Стал применяться новый подход к решению задач искусственного
интеллекта — представление знаний. Созданы MYCIN и DENDRAL [Shortliffe,
1976; Buchanan, Feigenbaum, 1978], ставшие уже классическими, две первые
экспертные системы для медицины и химии. Существенный финансовый вклад
вносит Пентагон, предлагая базировать новую программу министерства обо-
роны США (Strategic Computer Initiative — SCI) на принципах ИИ. Уже вдо-
гонку упущенных возможностей в начале 80-х объявлена глобальная програм-
ма развития новых технологий ESPRIT (Европейский Союз), в которую вклю-
чена проблематика искусственного интеллекта.
6. В ответ на успехи США в конце 70-х в гонку включается Япония, объявив о
начале проекта машин V поколения, основанных на знаниях. Проект был рас-
считан на 10 лет и объединял лучших молодых специалистов (в возрасте
до 35 лет) крупнейших японских компьютерных корпораций. Для этих специ-
алистов был создан специально новый институт ICOT, и они получили пол-
ную свободу действий, правда, без права публикации предварительных резуль-
татов. В результате они создали достаточно громоздкий и дорогой символьный
процессор, программно реализующий ПРОЛОГо-подобный язык, не получив-
ший широкого признания. Однако положительный эффект этого проекта был
очевиден. В Японии появилась значительная группа высококвалифицирован-
ных специалистов в области ИИ, которая добилась существенных результатов
в различных прикладных задачах. К середине 90-х японская ассоциация ИИ
насчитывает 40 тыс. человек.
Начиная с середины 1980-х годов, повсеместно происходит коммерциализация
искусственного интеллекта. Растут ежегодные капиталовложения, создаются
промышленные экспертные системы. Растет интерес к самообучающимся систе-
мам. Издаются десятки научных журналов, ежегодно собираются международ-
ные и национальные конференции по различным направлениям ИИ.
Искусственный интеллект становится одной из наиболее перспективных и пре-
стижных областей информатики (computer science).