Общая характеристика работы

Вид материалаЗакон
4.2.3 Alta Vista и его поисковые сервисы
Подобный материал:
1   2   3   4   5   6   7   8   9

4.2.2 Яндекс и его поисковые сервисы


Яндекс — популярнейшая в России поисковая система, функционирующая с осени 1997 года. Поиск Яндекса позволяет искать по Рунету документы на русском, украинском, белорусском, английском, немецком и французском языках с учетом морфологии (Если вам необходимо искать без морфологии, можно заставить Яндекс не учитывать формы слов из запроса при поиске. Помимо Web-страниц в формате HTML, Яндекс индексирует документы в форматах PDF (Adobe Acrobat), RTF (Rich Text Format), DOC (Microsoft Word), XLS (Microsoft Excel), PPT (Microsoft Power Point), SWF (Macromedia Flash), а также многие блоги и форумы. ПС поддерживает шесть языков: русский, английский, украинский, белорусский, французский и немецкий.

Яндекс позволяет задать запрос по любому из источников информации («Каталог», «Новости», «Товары», «Адреса», «Словари», «Картинки». Также возможны поиск похожего документа и, если найденный сайт описан в каталоге, переход в рубрику каталога. В конце списка ссылок выдается «Колдунщик запросов», в котором даются советы и предложения по уточнению запроса пользователя. Данный раздел позволяет сузить поиск по рубрике каталога или по региону, а также дает возможность поискать в других русскоязычных поисковых машинах и блогах.

Как и в Google, в Яндексе есть служба расширенного поиска . Она позволяет задать словарный фильтр, то есть указать, какие слова обязательно должны встретиться в документе, каких быть не должно, а какие — желательны. Несмотря на то что расширенный поиск предлагает массу возможностей, более точный запрос можно сделать с помощью языка запросов.

Основными отличительными чертами ПС Яндекс были и остаются:
  • проверка уникальности документов (исключение копий в разных кодировках),
  • учет морфологии русского языка,
  • поиск с учетом расстояния,
  • оценка релевантности (соответствия ответа запросу).

4.2.3 Alta Vista и его поисковые сервисы


Электронный адрес: .com/

Является одним из самых старых и популярных поисковых сервисов. Alta Vista появилась в 1995 году и стала первой системой с полнотекстовой поисковой базой данных в World Wide Web. Alta Vista содержит сведения о 30 миллионах Web-страниц и статьях из 14 тысяч телеконференций.

На счету данной поисковой системы 61 патент в области информационных технологий. Alta Vista была первой в области многоязычного поиска, а еще — первой поисковой технологией, которая поддерживала японский, китайский и корейский языки. Она может по праву гордиться своей системой машинного перевода AltaVista Babel Fish translation, которая способна осуществлять перевод не только фраз или слов, но и целых электронных страниц на 12 языков, в том числе и русский. Число стран, языки которых поддерживает Alta Vista, на текущий момент составляет 26.

Также данная система была первой, которая предоставила пользователю возможность поиска картинок, аудио и видео файлов.

Изначально AltaVista была просто поисковой системой с собственным пауком (scooter), автоматически собирающим информацию, обходя сайты по ссылкам. В настоящее время в нее включен еще и каталог ресурсов от Yahoo. Попадая на главную страницу AltaVista, пользователь может выбрать следующие возможности: провести поиск по базе поисковой системы ( Web Page Search); ограничить область поиска, перейдя в один из разделов специализированного поиска: картинки, аудио, видео, новости, или же искать по базе каталога ресурсов ( AltaVista Directory). Каталог ресурсов предоставляется одним из крупнейших представителем этой отрасли — Yahoo (ранее для AltaVista свой каталог предоставляла система LookSmart).

Данная поисковая система предоставляет обширные возможности для расширенного поиска. Помимо стандартных логических операторов AND (&), OR (|), NOT (!), поддерживается NEAR (). Данный оператор дает возможность осуществления контекстного поиска, то есть поиска терминов, которые располагаются рядом в тексте документа. Кроме этого при поиске в AltaViste можно использовать операторы «+», «-», «;» (если слова в запросе указанны через точку с запятой, то при поиске данные слова объединяются во фразу), «*» — это критерий поиска для всех слов, которые начинаются (заканчиваются) с указанных перед звездочкой (после звездочки) символов и заканчиваются (начинаются) любыми символами. Располагаться звездочка может в любой части слова.. Еще поддерживаются операторы ограничения области поиска, такие как title, url, link, host, domain.

При помощи настроек на форме расширенного поиска область поиска можно ограничить датой последнего обновления искомой страницы или же периодом, в который прошло обновление, доменом или определенным URL, а также определенным типом файла.

На странице Settings пользователь может настроить для себя необходимый вид полученных при поиске результатов. Так, помимо стандартного URL и описания страницы, можно получать размер страницы и ее язык. Можно выбрать количество показываемых на одной странице результатов, настроить язык или же выбрать опцию перевода важных ссылок на выбранный язык.

Результаты поиска выводятся отсортированными по релевантности, другой вид сортировки пользователю не предоставляется.

При расчете релевантности учитывается популярность URL документа и / или его родительского сайта. Ссылки с разных сайтов имеют разный вес. Кроме того, при расчете релевантности учитываются медиафайлы и картинки, которые есть на данной странице.

Количество проиндексированных AltaVistа страниц перевалило за 500 миллионов.