Методы автоматического порождения поисковых эвристик
Курсовой проект - Компьютеры, программирование
Другие курсовые по предмету Компьютеры, программирование
Методы автоматического порождения поисковых эвристик
Оглавление
Оглавление
Введение
Постановка задачи
. Анализ существующих поисковых систем
.1 Критерии оценки поисковых систем
.2 Поисковая система с большим количеством проиндексированных документов
.3 Поисковый каталог
.4 Преимущества и недостатки существующих подходов
.Виртуальный каталог
.1 Принцип работы виртуального каталога
.2 Поиск информации в виртуальном каталоге
. Экспертная система по автоматическому подбору эвристик
.1 Требования к экспертной системе по автоматическому порождению поисковых эвристик
.2 Принцип работы экспертной системы
.3 Обучение экспертной системы
.4 Логические методы автоматического подбора эвристик
. Оценка полученных результатов
. Сравнение результатов поиска с другими поисковыми системами
Заключение
Список литературы
Введение
В век, когда информация с каждым годом приобретает все большее и большее значение, разработка эффективных систем поиска информации является одной из самых важных, но в тоже время далеко не тривиальных задач.
Информация окружает нас повсюду: средства массовой информации, журналы, книжные издания, газеты и наконец Интернет.
Именно о методах поиска информации в Интернете пойдет речь в данной работе.
Как известно, в настоящее время Интернет представляет собой один из самых больших и постоянно развивающихся источников разнообразных сведений. В нем содержатся миллиарды документов, количество которых с каждым годом постоянно возрастает. И, возможно, через несколько десятилетий или столетий во всемирной паутине будет сосредоточена абсолютно вся информация, которую смогло собрать человечество.
На первый взгляд, кажется, что человек, имея доступ в Интернет, может легко и быстро найти в нем нужную информацию практически из любой области знаний. Но, зачастую, это оказывается не так. Человек тратит много времени и сил на поиск необходимых сведений и иногда их даже не находит.
Конечно же, сейчас во всемирной паутине существует огромное количество разнообразных поисковых систем, которые в той или иной степени решают задачу поиска. Самыми известными и популярными в России являются поисковые системы Google и Яндекс [1,2,3]. Но они помогают человеку в поиске лишь частично, потому что предоставляют ему не ту информацию, которую он желал найти, а ту, которая соответствует поисковому запросу.
Совсем недавно был разработан принципиально новый подход к поиску информации, основанный на технологии виртуального каталога [4]. Виртуальный каталог - это мета-поисковая система, представляющая собой синтез Интернет-каталога предметной области и поисковой системы с большим количеством проиндексированных документов.
В данной статье рассматриваются инструменты, необходимые для эффективной работы виртуального каталога, основанные на применении логических методов.
Постановка задачи
Использование виртуального каталога в задаче поиска информации в Интернете невозможно без создания специальных средств - поисковых эвристик.
Поэтому цель моей магистерской диссертации - разработка логических методов, необходимых для улучшения поиска в метапоисковой системе Виртуальный каталог.
Работа над диссертацией включает в себя следующий список задач:
.Анализ информационно-поисковых систем на основании формальных критериев оценки качества поиска
.Исследование основных принципов работы виртуального каталога
.Формулирование требований к экспертной системе по автоматическому порождению эвристик
.Разработка процесса обучения экспертной системы
.Разработка логических методов автоматического порождения поисковых эвристик
.Создание алгоритма поиска информации в виртуальном каталоге на основании полученного набора эвристик
.Реализация разработанной модели экспертной системы
.Оценка полученных результатов
1.Анализ существующих поисковых систем
1.1Критерии оценки поисковых систем
Для того чтобы объективно оценить качество работы различных типов поисковых систем, представленных в Интернете, введем следующие формальные критерии оценки поисковых систем:
Актуальность - это степень соответствия результатов поиска актуальному состоянию информации в выбранной предметной области в данный момент времени.
Пертинентность - это степень соответствия результатов поиска и информационной потребности пользователя, выраженной в формальном запросе к поисковой системе. Пертинентность определяется субъективным восприятием человека и может быть выражена в формальном запросе с той или иной степенью точности [5,6].
Адекватность - это мера соответствия информационной потребности пользователя и формального запроса к поисковой системе.
Релевантность - это степень соответствия формального запроса и полученных в результате поиска документов [5,6].
Таким образом, пертинентность - это композиция адекватности и релевантности работы информационно-поисковой системы.
Полнота - это доля релевантных ресурсов, присутствующих в выдаче поисковой системы, к общему числу всех релевантных ресурсов в Интернете [5,6].
Очевидно, что главными критериями оценки результатов поиска информации человеком являются ее актуальность, полнота и