Общая характеристика работы

Вид материалаЗакон
4 Поисковые системы
4.2 Обзор основных поисковых систем
Подобный материал:
1   2   3   4   5   6   7   8   9

4 Поисковые системы


Поисковые системы (ПС) стали применяться уже с середины 60-х годов прошлого века. Они появились практически одновременно с внедрением компьютерных систем в разнообразные сферы человеческой деятельности, открывая все более широкие возможности эффективного использования различных видов информации.

Главное требование к любой поисковой системе – быстрое формирование точного и полного ответа, адекватного запросу пользователя.

4.1 Какая из поисковых машин лучше?


Чтобы ответить на этот вопрос, обратимся к исследованию компании Nielsen NetRatings согласно которому популярность поисковиков в мире в конце 2005 года распределилась следующим образом: в 47,7% случаев пользователи обращались к Google, в 21,8% — к Yahoo! и в 11,3% — к MSN. Однако их лидерство условно — аналитики свидетельствуют, что даже постоянные пользователи Google не всегда удовлетворены результатами поиска, 58% из них регулярно прибегают к помощи Yahoo Search и MSN Search, а 71% тех, кто ищет при помощи Yahoo!, посещают Google или MSN Search. Аналогично 70% пользователей, предпочитающих MSN, пользуются дополнительно одной-двумя другими поисковыми системами.

Активная борьба между основными поисковыми службами — Google, Yahoo! и MSN — заставляет генерировать все новые сервисы. Большее количество поисковиков, ранжируя их по популярности, приводит аналитическая служба SearchEngine.com (см. рис.4.1.1)



Рис.4.1.1 Популярность поисковых систем (доля каждой системы в общем поисковом трафике) (источник: SearchEngine.com, 2005 год)

Для оценки популярности русскоязычных поисковых систем можно обратиться к исследованию специалистов агентства «Артон Консалтинг», проведенному в 2005 году. Анализ популярности поисковых систем осуществлялся на базе 110 тыс. обращений на исследуемые сайты риелторских агентств и автосалонов. На рис.5.1.2 показаны результаты исследования, согласно которым первые два места в списке популярных поисковых систем занимают Яндекс и Рамблер, причем перевес в пользу Яндекса составляет 3:1. MSN опережает Aport, а Google занимает третье место.



Рис. 4.1.2 Популярность поисковых систем (доля каждой системы в общем поисковом трафике) (источник — «Артон Консалтинг»)

4.2 Обзор основных поисковых систем


Поисковые системы предназначены для поиска информации в глобальной сети Интернет. Информации сегодня в Сети существует огромное количество, и без поисковых систем практически невозможно было бы найти что-либо в этой самой сети Интернет. Работа пользователя с ПС основывается на формировании запроса, по которому происходит отбор нужных документов из базы данных. Запрос формируется с помощью ключевых слов (одного или нескольких). Результаты поиска выдаются пользователю в виде списка адресов (гиперссылок) и краткой аннотации к ним.Ключевое слово-Это лексическая единица, являющаяся существительным, прилагательным, глаголом, числительным, наречием или местоимением, которая в наибольшей степени отражает содержание всего искомого документа. При формировании запроса могут использоваться не только отдельные ключевые слова, но и словосочетания, состоящие из нескольких ключевых слов. Запрос - это набор соединенных операторами ключевых слов, с помощью которых поисковая система автоматически ведет поиск и отбор необходимых документов. Другими словами, запрос - это инструкция (команда) для ПС на поиск нужных документов. Запросы бывают двух типов: простые и сложные (или расширенные, advanced).

Простые запросы состоят из отдельных ключевых слов или словосочетаний.

Сложные запросы, кроме ключевых слов, содержат логические и другие операторы.

4.2.1 Google и его поисковые сервисы


Электронный адрес: m;


Google заставил мир поисковых систем перевернуться с ног на голову благодаря своей концепции PageRank, которая оказалась на тот момент прорывом в области информационных технологий. Данная поисковая система была создана в 1998 году выпускниками Стэндфордского университета Сергеем Брином и Ларри Пейджем. Изначально название системы звучало как «Googol», что означало число 10, возведенное в степень 100, но из-за ошибки первого инвестора, который выписал чек на имя компании «Google», название пришлось изменить.

На сегодняшний день поисковик Google проиндексировал наибольшее число web-страниц – свыше 8 млрд. Это значит, что вероятность найти нужный документ с помощью Google выше. При этом, как правило, Google обеспечивает более высокую релевантность поиска, чем другие ПС. Фирменная кнопка Google — «I’m Feeling Lucky», или, в русской версии, «Мне повезет», отправляет пользователя на единственную страничку, которую Google выбрала на ваш запрос. Однако в этом случае других результатов поиска он не увидит. Кнопка «Мне повезет» помогает сэкономить время и действительно полезна, если вы уверены в том, что система легко может дать однозначный прогнозируемый вариант.

Две особенности Google:использование морфологического анализа слов;отсутствие разницы между прописными и строчными буквами в запросе. Работая с Google, полезно знать несколько операторов, которые упрощают поиск.

По умолчанию Google ставит вместо пробела между всеми словами в запросе логическое «И». Если общее слово является необходимым для получения результатов, можно включить его в запрос, помещая знак «+» перед ним без пробела.Наоборот, если необходимо исключить слово из результатов поиска, поместите знак «-» перед ним без пробела.Чтобы находить страницы с тем или иным ключевым словом, используется оператор OR.Если необходимо искать не только слово, указанное в запросе, но также и все его синонимы, поместите знак тильды («~») перед вашим словом без пробела. Для поиска определений слов в словарях используйте оператор define:

При поиске информации, содержащей диапазон чисел, используйте многоточие …

Для ограничения поиска документов по дате, укажите оператор date:

Иногда необходимо, чтобы в результаты поиска не попадали сайты «для взрослых». Для этого используйте оператор safesearch:

Для поиска информации на конкретном сайте используйте оператор site: в таком виде: слово site:адрес

Оператор, который позволяет искать первое слово в заголовке, а второе – или в заголовке, или в тексте: intitle:слово1 слово2

Google позволяет производить несложные математические расчеты с помощью специальных операторов:

сложение, вычитание, умножение, деление,доля в процентах, возведение в степень.

Google первой из поисковых машин начала индексацию документов в форматах PDF, PS, DOC, XLS, PPT, RTF и WP5. В последнее время Google расширила число не-HTML-файлов до 12 форматов, включив основные форматы Microsoft Office. Сейчас Google обеспечивает интерфейс на многих языках мира (более 100 языков), в том числе и на русском. Хотелось бы отметить одну из возможностей при выводе результатов — это опция Cached. Если по каким то причинам данная страница не загружается, то, кликнув по ссылке с таким названием, вы можете увидеть содержимое страницы на тот момент, когда Google в последний раз индексировал ее.

Google предоставляет не только поиск, но и множество сервисов — например, поиск картинок, книг, аудио и видео файлов, поиск товаров при помощи сервиса Froogle, калькулятор, а также сервис, аналогичный AltaVista Babel Fish translation, который называется Web Page Translation. При поиске в Google внизу окна появляется ссылка Language Tools, при открытии ее помимо выбора языка появляется форма Web Page Translation.