Учебное пособие Самара 2008 ббк 32. 973. 26-018. 2 Удк 004

Вид материалаУчебное пособие

Содержание


Контрольные вопросы
9. ОРГАНИЗАЦИЯ ПОИСКА В INTERNET 9.1. Общие сведения о поисковых системах
Поисковые системы общего назначения
Специализированные поисковые системы
9.2. Организация запросов
НЕ Запрос слово1 NOT ( ~ ) слово2
Высшее, образование, Россия
Искать в найденном
Компьютеры/Компьютерные сети/ Территориальные и локальные сети/…
Подобный материал:
1   ...   23   24   25   26   27   28   29   30   ...   34

Контрольные вопросы




  1. Что такое URL, и из каких частей состоит?
  2. Каков порядок загрузки Web-страницы?
  3. Что можно изменять для хорошего просмотра Web-страниц?
  4. Где хранятся временные файлы Интернета, и каков порядок их обновления?
  5. Что следует изменить для быстрой загрузки Web-страниц?
  6. Где отображается загрузка Web-страницы?
  7. В каких форматах можно сохранять Web-страницы?
  8. С какой целью используется работа с Web-страницами в автономном режиме?

9. ОРГАНИЗАЦИЯ ПОИСКА В INTERNET

9.1. Общие сведения о поисковых системах


Для поиска информации в Интернете используются специальные поисковые сервера, которые содержат постоянно обновляемую информацию о Web-сайтах, файлах, e-mail адресах и других информационных ресурсах Интернета. Различные поисковые сервера могут использовать различные механизмы поиска, хранения и предоставления пользователю информации. Поисковые сервера Интернета можно разделить на две группы: поисковые системы общего назначения и специализированные поисковые системы.

Поисковые системы общего назначения позволяют находить документы во Всемирной паутине по ключевым словам, которые вводятся в поле поиска или с помощью иерархической системы каталогов. При поиске по ключевым словам в поле поиска вводится одно или несколько ключевых слов, которые являются главными для искомого документа. Можно также использовать сложные запросы, использующие логические операции, шаблоны и т.д.

Интерфейс каталогов содержит список разделов, в которые сгруппированы ссылки на URL-адреса наиболее важных документов. Каждая ссылка обычно аннотирована, т.е. содержит короткий комментарий содержания документа.

Поисковыми системами общего назначения являются:
  • Google (ссылка скрыта) одна из самых поздних поисковых служб. Благодаря особым принципам поиска, индексации и складирования информации считается в настоящее время лучшей поисковой системой.
  • Yahoo! (.com) предоставляет возможность использования расширенного поиска с использованием языка запросов.

Для поиска в российской части Интернета (Рунете) популярны следующие системы:
  • Rambler (ссылка скрыта) предоставляет возможность использования расширенного поиска с использованием языка запросов. Отслеживает популярность сайтов с помощью счетчика посещений Rambler и выстраивает их в системе каталогов по количеству посещений.
  • Яндекс (ссылка скрыта) обладает развернутой системой формирования запроса. Яндекс - единственная российская поисковая система, индексирующая документы в форматах PDF, DOC и RTF. Обновление базы осуществляется еженедельно.
  • Апорт (ссылка скрыта) имеет специальные режимы для поиска иллюстраций и аудио файлов, в его базе большое число документов с зарубежных серверов. В "Апорт!" включен справочник ресурсов Интернет, являющийся на данное время лучшим в России.

Специализированные поисковые системы позволяют искать информацию в других информационных “слоях” Интернета. Существуют специализированные поисковые системы предназначенные для поиска файлов на FTP-серверах, а также системы поиска адресов электронной почты. Специализированными поисковыми системами являются:
  • FileSearch.ru (earch.ru) предназначена для поиска файлов. Для организации поиска в строку поиска необходимо ввести имя файла, после чего система осуществит его поиск на российских FTP-серверах.
  • WhoWhere? (ссылка скрыта) позволяет искать адрес электронной почты по имени человека или, наоборот, имя человека, хозяина определенного адреса электронной почты. В окно поиска необходимо ввести имя и фамилию, после чего система осуществит поиск e-mail адреса.
  • InfoSpace является интегрированной поисковой системой, позволяющей искать различные информационные ресурсы: адреса электронной почты, телефоны и адреса, географические карты и т.д.



9.2. Организация запросов


Для поиска информации следует сначала выбрать поисковую систему, затем в адресной строке обозревателя Internet Explorer ввести ее адрес. Выбор поисковой системы играет немаловажную роль, так как каждая из них имеет разные возможности и язык запросов. Можно вводить не полный URL адрес (например: ссылка скрыта), а только его часть (ссылка скрыта), остальное браузер допишет сам.

!! Выберете поисковую систему общего назначения, введите ее адрес в адресную строку и откройте.

В любой поисковой системе общего назначения для организации запроса в строке Поиск следует ввести ключевые слова. Для получения хорошего результата поиска запрос следует правильно организовывать.

Все поисковые машины используют свой язык запросов. Синтаксис наиболее популярных русскоязычных поисковых систем приведен в табл. 9.1.

Таблица 9.1

Операторы

Апорт

Rambler

Яndex

Логическое И

AND, &, +

AND, & (в пределах предложения)

&& (в пределах док-та)

&, пробел (в пределах предложения)

&&(в пределах док-та)

Логическое ИЛИ

OR, |

OR, | (в пределах предложения)

|| (в пределах док-та)

|

Логическое НЕ

NOT, ~

NOT

~ (в пределах предложения)

~~ (в пределах док-та)

Группировка слов

( )

( )

( )



Продолжение табл. 9.1


Ограничение расстояния между словами (поиск по близости)

слn(),сn(), wn(), [n], где n – количество слов, в пределах которых встречаются искомые слова

(n,), где n – количество слов, в пределах которых встречаются искомые слова (по умолчанию-40)

/(n m), где n и m расстояние в словах (вперед, назад), &&/(n m), где n и m расстояние в предложениях (вперед, назад)

Обязательное присутствие слова







+

Обязательное отсутствие слова







-

Шаблоны




* любое слово, знак препинания

! Ставится перед словом и указывает точную его форму для поиска

Поиск фразы

Фраза заключается в кавычки или апострофы

Фраза заключается в кавычки

Фраза заключается в кавычки

Поиск в зонах:

в заголовке

в тексте

в ключевых словах

в описании


в тексте ссылок

в подписях к изображен.

по дате


title=(выражение)

text=(выражение)

keywords=(выражение)

description=(выражение)

anchor=(выражение)

alt=(выражение)

date=выражение

дата: выражение





$title (выражение)

#keywords=выражение

#abstrakt=(выражение)

$anchor (выражение)

#hint=(выражение)


Учет регистра


Не учитывается

Не учитывается

Не учитывается


Простые запросы

Обычно запрос представляет собой одно или несколько слов, например:

микропроцессоры компании Intel 

По такому запросу находятся документы, в которых встречаются все слова запроса. Cоюзы, предлоги и т.п. в запросе игнорируются, так как не несут сами по себе смысловой нагрузки. Например, по запросу:

информатика и образование

будут найдены все документы, в которых встречаются одновременно два слова: "информатика" и "образование", независимо в какой грамматической форме они находятся.

Слова, содержащиеся в запросах, отыскиваются в документах во всех своих формах. Например, по запросу:

человек шел 

будут найдены среди прочих и документы, содержащие текст "люди идут". Распознавание всех форм работает для обычных слов русского языка. Для экзотических слов, неологизмов и т.п. оно не подходит.

!! Организуйте простой запрос, состоящий из слов Научное мировоззрение, в разных поисковых системах (Rambler, Yandex, Апорт ). Сравните количество найденных сайтов. Результаты сведите в таблицу.

При составлении запроса рекомендуется придерживаться следующих правил:
  1. Осуществляя поиск, целесообразно постепенно сужать область поиска, добавляя в запрос дополнительные ограничения (ставить галочку Искать в найденном);
  2. Без особой необходимости не использовать строчные буквы;
  3. Не рекомендуется применять следующие символы: &, %, /, #, _, ~;
  4. В зарубежных поисковых системах рекомендуется составлять запрос на латинице;
  5. Для поиска использовать несколько поисковых систем.


Поиск с использованием различных операторов
  • Логическое И

Запрос слово1 AND слово2 - задает поиск документов, в кото­рых встречаются одновременно оба слова: слово1 и слово2.

Например, по запросу

компьютерная&графика

большинство поисковых систем выдаст список документов, в которых содержатся и слово компьютерная, и слово графика.
  • Логическое ИЛИ

Запрос слово1 OR слово2 - позволяет искать документы, со­держащие хотя бы одно из этих слов (слово1 или слово2) либо оба слова вместе. Логическое ИЛИ удобно использовать при поиске синонимов.

Например, запрос вида

видео|видеоснимок|видеоизображение

прак­тически во всех поисковых системах задает поиск документов, содержащих любое из перечисленных слов или все слова одновременно.
  • Логическое НЕ

Запрос слово1 NOT ( ~ ) слово2 — задает поиск документов, со­держащих слово1, но не содержащих слово2.

Например, запрос вида сети NOT локальные (сети~локальные) будут найдены доку­менты, содержащие слово сети, но не содержащие слово локальные.
  • Круглые скобки

Практически во всех поисковых системах (за исключением Google) скобки задают порядок действия логических операторов. Допускается многократная вложенность скобок.

Например, по запросу

(локальные OR глобальные) AND сети

будут выданы документы, где встречаются одновременно слова локальные и сети либо глобальные и сети.

По запросу

локальные OR глобальные AND сети

были бы выданы документы, содержащие либо слово локальные, либо одновременно глобальные и сети (оператор AND действует первым).
  • Знаки + и -

Применяется если требуется, чтобы указанное в запросе слово обязательно присутствовало (+) или отсутствовало (-) в найденных документах (знак ставится перед словом, причем между знаком и последующим словом не должно быть пробела).

Например, по запросу

образование +дистанционное

будут найдены документы, где упомина­ется только образование дистанционное, а по запросу

образование дистанционное

будут найдены документы, в которых встре­чается и образование дистанционное, и образование заочное и т. д.
  • Поиск слов на заданном расстоянии

Некоторые поисковые системы умеют искать слова, находящи­еся на заданном расстоянии друг от друга.

Например, запрос, организованный в Яндексе

высшее /(-2 3) образование

означает, что слово высшее должно находиться от слова образование в интервале от 2 слов слева до 3 слов справа.

Запрос

список /2 абонентов

позволяет найти документы, ко­торые содержат и слова список, и слово абонентов, причем эти слова должны находиться в одном предложении и расстояние между ними должно быть не более двух слов. В итоге будут найдены список почтовых абонентов, список абонентов электронной почты и т. д.

!! Используя таблицу 9.1 организуйте запрос из слов Высшее, образование, Россия, соединяя их различными операторами и определяя количество найденных Web-страниц в различных поисковых системах. Результаты поиска сведите в таблицу и проанализируйте.


Поиск по адресам (по URL)

При помощи поисковой системы Апорт документы можно искать не только по всему русскоязычному Интернету, но и по его части. Самый простой случай — поиск по определенному серверу. Например:

url=www.intel.ru собака

По данному запросу будут найдены все документы на сервере www.intel.ru, содержащие слово "собака". Если написать просто:

url=www.intel.ru


!! Организуйте запрос ссылка скрыта книга. Выйдите на пустую страницу.

Для поиска более конкретной информации можно после выполнения запроса уточнить поиск. Для этого следует отметить надпись Искать в найденном и ввести слова для конкретизации поиска.

!! Найдите реферат по информатике о компьютерных сетях, постепенно уточняя поиск. Сохраните понравившиеся адреса в Избранном в папке под своей фамилией.

Во всех поисковых системах можно выбрать область поиска информации.

В поисковой системе Апорт можно искать среди сайтов, рефератов, знакомств, mp3, новостей, в энциклопедии, среди работы и товаров.

В системе Яндекс – в каталогах, новостях, маркетинге, энциклопедии, картинках.

В системе Rambler – в Интернете, новостях, товарах.

Для такого поиска следует в выбранной поисковой системе отметить нужный пункт.

!! Найдите документы, содержащие слово наука в разделе Новости в различных поисковых системах. Сравните результаты поиска.

Поиск по каталогам

Во всех поисковых системах есть тематические каталоги (Бизнес и экономика, Новости, Интернет, Развлечения и отдых, Медицина и здоровье, Наука и образование и т.д.). Выбрав необходимую тематику, следует выходить на более низкий уровень каталогов, постепенно уточняя поиск информации.

Например: Компьютеры/Компьютерные сети/ Территориальные и локальные сети/…

!! Найдите в каталоге Интернет информацию о программе Соло на клавиатуре в поисковой системе Апорт.