Методы автоматического порождения поисковых эвристик
Курсовой проект - Компьютеры, программирование
Другие курсовые по предмету Компьютеры, программирование
ласть поиска до выбранной рубрики и вида ресурса [6]. Таким образом, каждой паре (рубрика, вид ресурса) соответствует определенный, заранее подобранный набор эвристик. (см. рис. 1).
рис. 1 Составляющие виртуального каталога
2.2Поиск информации в виртуальном каталоге
Исходя из выше изложенного, рассмотрим, как происходит поиск информации в виртуальном каталоге:
Виртуальный каталог отправляет набор эвристик выбранной пары (рубрика, вид ресурса) в виде запросов информационно-поисковой системе (Google, Яндекс)
Затем получает ответ, отсортировывает его в определенном порядке и отображает пользователю.
Следовательно, при правильно определенном наборе эвристик, пользователь действительно может получить именно ту информацию, которая ему была необходима.
Таким образом, виртуальный каталог отвечает всем критериям оценки эффективности работы поисковых систем:
Актуальность, полнота и релевантность достигается за счет использования информационно-поисковой системы (Google, Яндекс)
Адекватность за счет выбора пользователем вручную интересующей его тематики и специально подобранных для этой тематики эвристик.
Таким образом, виртуальный каталог в состоянии обеспечить не только актуальность, полноту и релевантность поиска, но и один из самых важных критериев - пертинентность.
Для того чтобы разработать полноценный виртуальный каталог для предметной области, который бы в полной мере удовлетворял информационную потребность пользователя в данной предметной области необходимы три компонента:
Рубрикатор предметной области
Список ресурсов
Набор эвристик
В данной работе мы не будем подробно останавливаться на построении рубрикатора предметной области и списка ресурсов.
Рассмотрим тему, представляющую наибольший интерес - методы порождения эвристик. Поскольку именно от правильно подобранных эвристик в наибольшей степени зависит пертинентность ответа виртуального каталога.
3.Экспертная система по автоматическому подбору эвристик
Поскольку именно от правильно подобранных эвристик в наибольшей степени зависит пертинентность результатов поиска в виртуальном каталоге, рассмотрим методы их автоматического порождения.
Понятие пертинентности поиска - это достаточно субъективный критерий, поэтому пока еще не создан искусственный интеллект, только человек в состоянии определить удовлетворяют ли результаты поиска его информационную потребность. Следовательно, процесс построения эвристик должен происходить с участием эксперта в предметной области. Но при этом необходимо учитывать, что количество пар (рубрика, вид ресурса) в виртуальном каталоге может быть достаточно велико и для того чтобы полностью подобрать качественный набор эвристик, эксперт потратит огромное количество времени. Также следует учитывать, что эксперт помимо знаний в предметной области должен обладать специальными знаниями в сфере поиска информации в Интернете. Поэтому, эксперту необходимо предоставить эффективный программный инструмент, осуществляющий помощь в подборе эвристик. Таким инструментом является экспертная система по автоматическому подбору поисковых эвристик [13].
Принцип работы экспертной системы состоит в следующем: первоначально происходит обучение экспертной системы, после которого система на основании логических методов автоматически строит искомый набор эвристик.
эвристика поисковый система каталог
3.1Требования к экспертной системе по автоматическому порождению поисковых эвристик
Для того чтобы разработать экспертную систему, которая действительно будет приносить ощутимый эффект в процессе построения эвристик, необходимо тщательно продумать требования, предъявляемые к системе.
Сформулируем требования к экспертной системе:
Автоматическое порождение эвристик для любой предметной области
Экспертная система должна предоставлять средства, позволяющие эксперту загружать в систему рубрикатор любой предметной области в заранее установленном формате, а также список ресурсов.
Подбор эвристики для пары (рубрика, ресурс)
Экспертная система должна предоставлять возможность подбирать эвристики для каждой пары (рубрика, ресурс) предметной области.
Быстрое и качественное построение эвристики
Процесс построения эвристики для одной пары (рубрика, ресурс) не должен отнимать слишком много времени у эксперта, но в тоже время он должен быть достаточно качественным. Эвристика, порожденная экспертной системой, должна максимально отвечать информационной потребности пользователя в области, соответствующей выбранной рубрике и ресурсу.
Минимальное взаимодействие экспертной системы и человека
Эксперт должен лишь вести процесс порождения эвристик, большую часть работы экспертная система должна проделывать автоматически.
Информационный обмен с виртуальным каталогом
Экспертная система должна обладать средствами, позволяющими осуществлять экспорт и импорт данных (рубрикатора и эвристик) в виртуальный каталог.
Простой и удобный графический интерфейс
Интерфейс экспертной системы должен быть удобен и прост в использовании. Эксперт должен иметь возможность обучиться работе в системе в короткие сроки.
В соответствии с вышеизложенными требованиями, было решено реализовать экспертную систему в виде WEB-приложения на языке PHP с использованием СУБД M