Р. С. Гиляревский основы информатики курс лекций

Вид материалаКурс лекций

Содержание


Информационные системы Информационно-поисковые системы
Интеллектуальные информационные системы
Подобный материал:
1   ...   28   29   30   31   32   33   34   35   ...   55

Информационные системы

Информационно-поисковые системы


За последние десятилетия в области информационного поиска произошли важные изменения, которые требуют принципиально новых подходов и решений. В крупных банках данных накоплено огромное количество источников информации. Насчитываются десятки тысяч общедоступных базы данных, в которых содержатся миллиарды записей. В них ежегодно проводятся десятки миллионов информационных поисков. Почти на каждый из них информационно-поисковые системы теперь быстро выдают сотни и тысячи источников, т. е. слишком много, чтобы потребитель был в состоянии все прочитать или хотя бы просмотреть. Поэтому потребитель вынужден ужесточать свои требования к выдаваемым источникам. Возникла возрастающая потребность в значительном усилении критериев выдачи релевантных документов, более строгом их отборе, для чего необходима разработка и применение других принципов, переход на моделирование – пусть вначале даже самое грубое – процессов информационного поиска в памяти человека. Ясно, что поиск информации в памяти человека осуществляется совершенно иначе, чем посредством современных информацион­но по­иско­вых систем.

Другой важный фактор, все сильнее воздействующий на сферу информационного поиска, заключается в появлении и росте численности полнотекстовых БД, представляющих собой электронные аналоги печатных изданий и документов – энциклопедий, словарей, справочников, книг, журналов и т. п. Это обусловлено расширяющимся внедрением современных средств вычислительной техники в издательское дело и полиграфию.

Опыт информационного поиска в полнотекстовых БД, когда поиск проводится не по поисковым образам документов, а по их полным текстам, показывает, что использование ключевых слов, встречающихся в полных текстах, не дает тех результатов, которые получаются в первом случае. Хотя использование полных текстов документов создает новые, дополнительные возможности для повышения эффективности поиска (например, благодаря использованию библиографических ссылок как поисковых признаков), стало ясно, что необходима разработка существенно новых принципов информационного поиска по полным текстам документов, основанных на результатах исследования механизмов человеческого мышления и на использовании баз знаний и опыта, накопленного при разработке и эксплуатации экспертных систем, систем машинного перевода и других интеллектуальных информационных систем.

Проблема информационного поиска весьма существенно усложнилась еще в одном отношении. Если раньше объектом поиска были источники информации, то теперь возрастает потребность в поиске самой информации, которая при этом не всегда имеется в поисковом массиве в явном виде. Для получения такой информации необходимо выполнять над текстами источников или записями фактов те или иные логические операции, требующие привлечения определенных знаний о мире, которые непосредственно не содержатся в этих текстах и записях. Такого рода знания отображаются в базах знаний, простейшими примерами которых могут служить информационно-поисковые тезаурусы и таблицы классификации. Кроме того, необходимо учить компьютеры «понимать» тексты и факты, оценивать их, рассуждать, делать логические выводы, формулировать гипотезы, т. е. выполнять многие интеллектуальные операции, при­сущие чело­веческому мозгу. А это становится все более возможным по мере того, как мы узнаем все больше о механизмах человеческого мышления и учимся их моделировать. Таким образом, возрастает потреб­ность в глубоком изучении процессов языкового и логического мышления, в создании и использовании информационно-логических, или интеллектуальных систем, которые сами становятся мощнейшим инструментом исследования этих процессов.


Интеллектуальные информационные системы


В настоящее время зрелость информатики как науки характеризуется тем, что в ней взаимодействуют теория вычислений, алгоритми­ческих языков и архитектуры компьютеров, а также искусственный интеллект, пони­маемый как дисциплина об имитации и усилении рассуждений, и о восприятии и переработке информации посредством компьютера.

В результате развития этих разделов информатики стало возможно создание нового информационного продукта – интеллектуальных систем1. Интеллектуальные системы реализуют взаимодействие «человек – компьютерная система» таким образом, что они, являясь человеко-машинными системами, образуют симбиоз (человек, компьютерная система). Компьютер в диалоговом режиме усиливает комбинаторное мышление и логические возможности человека. С этим фактом связано возникновение новой информационной технологии, реализующей функционирование интеллектуальных систем по следующей схеме:

Интеллектуальная система =

рассуждающая система + поисковая система + интеллектуаль­ный интерфейс.

Интеллектуальная система – открытая система, принимающая решение с использованием новой поступающей информации, если она релевант­на цели рассуждения. Таким образом, поисковая система оказывается средством принятия решения в интеллектуальной системе. Очевидно, что поисковая система может использоваться в двух режимах: в автоматическом – для подбора информации, близкой решаемой задаче, в диалоговом – для отбора информации, релевантной цели рассуж­дения, которая задана пользователем на некотором этапе работы системы.

Информационно-поисковая система как подсистема интеллекту­альной системы должна обладать как механизмом поиска фактов, так и механизмом поиска документов. Высокоразвитая информационно-поисковая система (ее можно назвать интеллектуаль­ной информа­ционно-поисковой системой) должна обладать процедурами извлечения фактов, пополняющих базы данных из текстов на естественных языках. Это делает возможным полуавтоматическое (с использованием диалога пользователя и системы) расширение базы знаний, которая пополняется индуктивными обобщениями. Интеллектуальные системы являются средством компьютерной обработки и анализа данных и знаний высокого уровня: они не только имитируют рассуждения квалифицированного эксперта, но и усиливают их.

Из сказанного следует, что охарактеризованные нами интеллектуальные системы являются системами поддержки и усиления интеллектуальной активности человека в том смысле, который декларировался авторами известного японского проекта компьютерных систем пятого поколения2. Для отечественных условий, в которых создаются интеллектуальные системы, разумеется, специфичны трудности реализации конструктивных идей, воплощенных в современных по замыслам, логическим и программным средствам системах, так как для задач большой комбинаторной сложности требуется применение суперкомпьютеров и рабочих станций. В настоящее же время многие отечественные интеллектуальные системы созданы для персональных компьютеров. В связи с этим актуальной является задача создания сетей с использованием больших ЭВМ.

Интеллектуальные системы как инструмент новой информационной технологии обладают некоторыми новыми (по сравнению с информационными системами предшествующих поколений) возможностями. Например, при прогнозировании биологических активностей химических соединений интеллектуальные системы могут содержать как информацию о химических соединениях (физико-хими­ческие и стереохимические данные), так и информацию о путях их воздействия на организм (биохимические данные) и о противопоказаниях лекарст­венных соединений (медицинские и экологические данные).

В ВИНИТИ разрабатываются интеллектуальные системы типа ДСМ, названные так по имени английского философа Джона Стюарта Миля. Эти системы применяются для прогнозирования свойств структурированных объектов в базах данных с неполной информацией для задач фармакологии, медицины и технической диагностики. Они могут быть применены и в других областях науки (например, в социологии), где знания слабо формализованы, данные хорошо структурированы, а в базах данных содержатся как положительные, так и отрицательные примеры некоторых эффектов.