Методические указания по выполнению лабораторной работы Уфа 2009

Вид материалаМетодические указания

Содержание


Yandex и AltaVista
Yandex и Aport
Yandex и AltaVista
Google не поддерживает этот знак. Пример использования: [«+
Яндекс – поисковая машина, способная по вашему запросу найти наиболее подходящие Web-страницы в русской части сети Интернет. Янд
Яндекс умеет определять язык документа. Вы можете задать язык документа, где надо провести поиск: русский (кириллица) или не рус
Подобный материал:
1   2   3   4   5   6   7

Правила составления запросов


Что такое запросы к поисковым машинам? Упрощенно говоря это тот текст, который вы должны написать в поле ввода специальной формы на любой поисковой машине.

Предположим, что в поле ввода текста поисковой машины Yandex вы написали фразу [Любовь зла полюбишь и]. Это и есть запрос к поисковой машине. По этому запросу она будет искать документы, в которых встречаются слова, перечисленные в этом запросе. Если говорить о приведенном примере, то будут найдены документы, содержащие следующие слова: любовь, зла, полюбишь. Причем именно слова, а не точную фразу [Любовь зла полюбишь и] как можно было бы предположить. Конечно, среди всех найденных документов будут и те, которые содержат эту фразу, но будет много и других.

Но как быть, если нужны документы именно с такой фразой и больше никакие? Как добиться, чтобы поисковые машины находили документы в наибольшей степени, отвечающие вашим потребностям?

На эти вопросы отвечают правила составления запросов или, иначе говоря, синтаксис запросов. Синтаксис запросов – это набор правил, по которым поисковая машин трактует все, что вы пишите в поле ввода текста. Безусловно, также как в каждом человеческом языке существуют свои правила так же и у каждой поисковой системы свой синтаксис запросов. Сначала рассмотрим некоторые общие правила на примере нескольких поисковых систем: Yandex, Rambler, AltaVista, Google, Aport, затем более подробно одну из них – Yandex.

Как поисковые машины трактуют слова в запросе?


Все эти пять машин ищут документы, содержащие все слова, которые вы определили в запросе. Но Yandex и AltaVista также находят документы, содержащие часть слов или даже одно слово из запроса. Правда документы, содержащие не все слова, размещаются в конце списка результатов, а в начале списка те, в которых есть все слова.

Yandex и Aport ищут документы, в которых слова запроса встречаются в любой словоформе. Например, по запросу [Любовь зла полюбишь и] будут найдены документы со словами: любви, любовью и т.п. Если нужно найти слово в определенной форме и только в этой, то перед словом (в запросе) нужно поставить знак ! Например: [!Любовь!зла полюбишь и].

Все описываемые машины игнорируют союзы, предлоги и т.п. слова. Например по запросу [Любовь и голуби] союз И будет проигнорирован.

Как поисковые машины трактуют некоторые специальные символы в запросе?

Кавычки «…»


Если группа слов ограничена кавычками ([«Любовь зла полюбишь и»]), то Yandex и AltaVista будут искать точно такую же фразу, в тех же словоформах;

Aport будет искать эту фразу, но также и близкую к ней (с другими союзами, с другими словоформами).

Знак +.


Yandex, AltaVista и Aport трактуют этот знак перед словом как указание на необходимость поиска этого слова. Google в принципе действует также, но по замыслу его разработчиков знак + должен использоваться для включения в запрос союзов предлогов и т.п. (которые по умолчанию игнорируются). Пример использования: [«+Любовь зла+полюбишь и»].

Знак -


Имеет обратное действие (исключает слово из результатов поиска). Google не поддерживает этот знак. Пример использования: [«+Любовь­зла +полюбишь и»].

Знак |


Указывает на необходимость выбора одного из двух вариантов. Запрос [любовь|ненависть] означает «или любовь или ненависть». Google не поддерживает этот знак.

Скобки (…)


Отделяют одну часть запроса от другой. Например, запрос [(любовь|ненависть)+чувство] в переводе на «русский» звучит как «найти документы со словами чувство и одно из двух: ненависть или любовь».

Теперь более подробно остановимся на поисковой машине Yandex.

Поисковая машина Yandex?


Яндекс – поисковая машина, способная по вашему запросу найти наиболее подходящие Web-страницы в русской части сети Интернет. Яндекс ежедневно просматривает сотни тысяч Web-страниц в поисках изменений или новых ссылок. Коллекция ссылок постоянно растет.

Яндекс не требует от вас знания специальных команд для поиска. Достаточно набрать вопрос («где найти дешевые компьютеры» или «нужны телефоны Москвы и московской области»), и вы получите результат – список страниц, где встречаются эти слова.

Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка. Например, если задан запрос идти, то в результате поиска будут найдены ссылки на документы, содержащие слова идти, идет, шел, шла и т.д. На запрос окно будет выдана информация, содержащая и слово окон, а на запрос отзывали – документы, содержащие слово отозвали.

При этом поиск не ограничен лишь словами или фразами. Яндекс отыщет всех, кто сослался на вашу страницу, файлы с нужной картинкой, последние новости или товары в электронных магазинах.

Как известно, в хорошем вопросе содержится половина ответа. Мы считаем, что искать и находить нужное в ворохе текстов в сети Интернет – умение не только поисковой системы, но и пользователя, задающего запрос.

Варианты поиска

Тонкий поиск


Яндекс обладает развитым языком запросов, позволяющим осуществлять тонкий поиск. Для того чтобы воспользоваться широким спектром возможностей, используйте страницу ссылка скрыта», где большая часть настроек Яндекса задается простым образом. Обратите внимание, что, при заполнении нескольких полей, запрос будут составлен таким образом, чтобы все условия выполнялись одновременно (через документное «И» – &&). Если вас интересуют операторы языка запросов, обратитесь к странице ссылка скрыта.

Расширенный поиск


В этом виде поиска указываются дополнительные условия в специальных полях страницы ссылка скрыта (подробнее см. в ссылке на первой странице поисковой машины Yandex.ru).

Словарный фильтр


Здесь вы можете указать, какие слова обязательно должны встретиться в документе, каких быть не должно, а какие желательны (то есть могут быть, а могут не быть). Поле «все формы» или «точная форма» указывает Яндексу, надо ли учитывать при запросе все словоформы. «Точная форма» обычно требуется только для поиска цитат.

Зоной поиска слова может быть как текст документа (слова находятся в одном предложении или всем документе), так и его заголовок, аннотация (тэг description), ссылка (подпись URL) или адрес (сам URL). Вариант «во фразе» означает необходимость искать слова в том порядке, в котором они введены. Вы можете задать несколько слов через запятую.

Дата


Ограничение выдачи документов по дате. Документы с неизвестной датой в этот список не включаются.

Сайт/вершина


Запрос идет только по страницам указанного сайта или поддиректории (вершины) сайта. Поиск будет проведен среди всех поддиректорий. Здесь же (в соседнем поле) вы можете исключить из поиска страницы определенного сайта. Вы можете внести несколько адресов, перечислив их через пробел.

Таким образом, вы можете сделать поиск по своему личному сайту через Яндекс – то есть ссылка скрыта.

Ссылка


Как узнать, кто ссылается на ваш ресурс? Введите в этом поле адрес вашей страницы, и вы это узнаете. Если адрес вашего сайта начинается с www, то впишите его целиком, включая www. Здесь же вы можете исключить из поиска страницы, где стоит ссылка на определенный адрес.

На основе этой возможности рассчитывается ссылка скрыта. Чтобы исключить все внутренние ссылки (то есть с одних страниц вашего ресурса на другие его страницы), используйте поле сайт/вершина и исключите ресурс из поиска ссылок.

Изображение


Поиск документов, содержащих картинку с определенным названием или подписью. Файл картинки может называться, например, applegreen.jpg. Тогда найти такие файлы можно запросом: apple. Запрос аналогичен apple*.*. Для поиска в подписи к изображению (тэг alt) впишите запрос в соседнее поле.

Специальные объекты


Поиск страницы, содержащих файлы объектов: скрипт, объект, апплет, java. В поле указывается имя объекта.

Язык


Яндекс умеет определять язык документа. Вы можете задать язык документа, где надо провести поиск: русский (кириллица) или не русский. В базе Яндекса находятся только документы русскоязычного Интернета (по умолчанию в поисковую машину вносятся сервера в доменах su, ru, am, az, by, ge, kg, kz, md, tj, ua, uz), а также зарубежные сайты, представляющие интерес для русскоязычного поиска.

Формат выдачи


«Краткая выдача» показывает только список заголовков документов. «Только URL» – только адреса найденных страниц.

Общие советы при поиске


Вы не хотите углубляться в детали техники поиска? Просто задайте Яндексу вопрос так же, как бы вы его задали библиотекарю или всезнающему эрудиту. Например, «где раки зимуют», «ярчайшая звезда северного полушария» или «как выбрать компьютер».