Урок Что изучает информатика?

Вид материалаУрок

Содержание


Урок 74. Типы поисковых серверов и их особенности
Урок 75. Основные понятия и характеристики результатов поиска
Урок 76. Понятие языка запросов
Подобный материал:
1   ...   14   15   16   17   18   19   20   21   22


<иЧ1е>Поисковые системы: сравнительные характеристики <ЛШе> <1ит1>Определение поисковых систем, основные характери­стики поисковых систем

Теперь релевантность по поисковому запросу «поисковая система» будет очень высока, этот документ будет находиться iB top Ю» пока его не сместят более новые сайты с такими же ключевыми словами- Да> только не забудьте, что и в теле странички должны в разных местах повторяться эти слова.

IV. Выполнение практического задания

1. Войти в документ, стоящий первым в списке результатов поиска по ключевому слову «Поисковая система» и1 определить, сколько раз в теле программы встречается слово поисковая система.

2. Подберите ключевые слова для поиска информации на тему «Воз­можности сетевых технологий». Определите релевантность найден­ных документов.

V. Подведение итогов урока

Урок 74. Типы поисковых серверов и их особенности

Цели: иметь представление о поисковых серверах и их отличительных характеристиках; научиться пользоваться поисковыми системами для удовлетворения собственных информационных потребностей.

Ход урока

I. Организационный момент

II. Актуализация знаний

- Какие возможности предоставляет поисковая система сети Интер­нет? (Поисковая система обладает мощными возможностями: по­исковой машиной и базой данных. Поисковая машина сканирует сеть и сохраняет образы документов в своей базе. Если документ

был удален или перемещен его можно просмотреть в режиме со­храненного документа.)

- Что отражает релевантность запроса? (Релевантность - это харак­теристика, которая отражает соответствие найденных доку­ментов запросу.)

Щ. Теоретический материал урока

Отсутствие в сети Интернет четкой централизованной структуры по­влияло на то, что ее развитие в целом имеет хаотичный характер. Появля­ются все новые и новые сервера, где хранятся огромные массивы инфор­мации. Осуществлять поиск информации с помощью ввода только готово­го адреса в адресную строку не представляется возможным. Поэтому во­просы поиска информации становятся очень актуальными, и с годами про­блема будет только увеличиваться.

Для осуществления поиска в сети используются поисковые системы, основное назначение которых - облегчение пользователю процесса поиска информации, причем не только на серверах WWW, но и FTP, Usenet и других ресурсах Интернет. Во всемирной паутине Интернет находится несколько тысяч поисковых систем, среди которых есть как уже хорошо зарекомендовавшие себя, так и менее известные. Из наиболее известных поисковых машин можно назвать среди зарубежных: AltaVista, Google, HotBot, InfoSeek, Lycos, WebCrawler, Yahoo и др.; среди российских: Rambler, АПОРТ, Яndех и др. У каждой поисковой системы есть как дос­тоинства, так и недостатки. Критериями выбора поисковой системы могут служить такие характеристики как:

принцип работы поисковой машины; удобство использования; внешнее оформление; сложность языка запросов;

наличием различных расширенных функций (управления форматом и ранжированием выводимой информации, переводом вводимых ключевых слов на другой язык и т.д.); скоростью работы;

уровнем загруженности в конкретные моменты времени и надежно­стью и пр.

Выбор поисковой системы для конкретного применения определяйся целью поиска, характером искомой информации, желаемым форматом выводимых данных и шириной охвата отслеживаемых адресов серверов в сети Интернет. Наиболее популярными поисковыми серверами на рус­скоязычной территории (в порядке убывания количества результатов по­иска) являются Яndeх, Rambler, Google, АПОРТ, Yahoo и т.д.

Существует 2 основных типа поисковых систем Интернет: индексные и классификационные (каталоговые). Индексные поисковые системы (на­пример, AltaVista, Google, HotPot, АПОРТ, Яndех и др.), работая в авто­матическом режиме обновления своей информации, просматривают в сети Интернет содержимое серверов, индексируют всю информацию, содержа­щуюся в них, и вносят информацию о расположении слов на страницах сайтов в свои базы данных.

Каталоговые системы поиска (например, Rambler, Yahoo! и др.) содержат тематически структурированный каталог серверов, и чаще всего пополняются вручную. Обычно на WWW-странице классификационной поисковой системы содержится и поле для ввода ключевых слов для ло-иска в собственной базе данных. В каталоговой системе поиска мождао,

начав с более крупной тематической рубрики, постепенно спускаясь дальше по рубрикам, прийти к ссылке на нужный сервер. В одних случа­ях бывает удобней воспользоваться первым типом поисковых систем, в других - вторым.

Есть поисковые системы, сочетающие в себе оба принципа работы. В частности, большинство индексных поисковых систем имеют и каталоговую систему поиска. Также поисковые машины могут использовать и ка­кие-то другие принципы методов поиска. Многие поисковые системы пре­образовались в Интернет-порталы, объединяющие в себе большое количе­ство ресурсов и сервисов. На страницах таких порталов можно прочитать новости, программу телепередач, узнать о погоде, курсах валют и многое другое.

Для поиска информации на русскоязычных сайтах рекомендуется поль­зоваться российскими поисковыми системами, ввиду наличия русскоязыч­ного интерфейса, возможности поиска по русским словам, учета особенно­стей (морфологии) русского языка, близости расположения серверов и т.д. Для поиска одновременно в нескольких поисковых системах можно вос­пользоваться так называемыми поисковыми метамашинами, которые не имеют своих систем поиска, а используют возможности других поисковых систем.

Как известно, поисковых систем в Интернете много и найти нужную информацию крайне непросто. Отсутствие единого стандарта на специфи­кацию задачи поиска в Сети приводит к тому, что на каждом узле предла­гается собственный способ решения поставленной задачи. В результате пользователь, не имеющий необходимых навыков в создании синтаксиче­ских конструкций запросов к поисковой системе, либо не полностью ис­пользует возможности каждого портала, либо, изучив функции конкретно­го узла, постоянно обращается лишь к одному.

Метапоисковая система имеет и другое преимущество, такое как ис­пользование единого языка запросов, в некоторых системах даже зало­жена возможность перевода ключевых слов на другие языки. Такие по­исковые системы, получая результаты запросов от других поисковых систем, фильтруют полученные материалы, убирают дублирующиеся ссылки, и сортируют их по релевантности. Для поиска зарубежных ресурсов можно пользоваться и российскими поисковыми метамашинами, обращающимися к другим поисковым средствам (в том числе зарубеж­ным), потому что имеющего в большинстве случаев доступ к скоростно­му каналу за рубеж и т. д.

Существуют также поисковые системы, специализирующиеся на поис­ке по конкретной тематике (например, по информационным технологиям, по музыке, по ресурсам, посвященным природе и т. д.). А самый простой способ поиска - это ввод в адресную строку названия фирмы, т. к. все крупные формы в названии адреса используют собственное имя.

В качестве итоговых слов можем сказать, что для получения качест­венного результата поиска, необходимо использовать возможности раз­личных поисковых систем. Регулярное использование только одной из систем может плохо отразиться на результатах поиска.

IV. Выполнение практического задания

Оценить возможности трех поисковых систем по определенному за­просу, по каким-либо критериям, выбранным на свой вкус.

V. Подведение итогов урока

Урок 75. Основные понятия и характеристики результатов поиска

Цели урока:

знать основные характеристики результатов поиска;

иметь представление о способах увеличения релевантности резуль­татов поиска.

Ход урока

I. Организационный момент

II. Актуализация знаний

- Назовите характеристики поисковых систем. (При выборе поиско­вых систем необходимо обращать внимание на: принцип работы поисковой машины, удобство использования, внешнее оформление, сложность языка запросов, наличие различных расширенных функ­ций (управления форматом и ранжированием выводимой информа­ции, переводом вводимых ключевых слов на другой язык и т.д.), ско­рость работы, уровень загруженности в конкретные моменты времени и надежность и пр.)

- Назовите типы поисковых машин. (Различают два типа поисковых машин: индексные и классификационные. В первом случае, поиско­вик автоматически просматривает содержимое сети и индекси­руют всю информацию. Во втором - структурированный каталог формируется практически вручную.)

- Какие возможности предоставляет метапоисковая система? (Метапоисковая система предоставляет возможность использования единого языка запросов для нескольких поисковиков.)

III. Теоретический материал урока

Совокупность сведений и данных, необходимых пользователю в данный момент времени, называют информационной потребностью. Если человек способен понимать чужую речь, исходя из контекста, то технические системы предпочитают работать с формализованными данными. Возникает необходи­мость представления информационной потребности в виде набора определен­ных понятий, которые должны выступить в качестве ключевых понятий. При составлении данного набора значение имеют не только слова, но и отношения между ними. Данную совокупность принято называть запросом.

После ввода запроса поисковая система осуществляет выборку доку­ментов, с последующим формированием результата по определенным кри­териям, которые внесены в параметры поиска. Совокупность документов, которая соответствует запросу (выдача, отклик), характеризуется свойст­вом релевантности, т. е. показателем уровня соответствия отклика запро­су. Различают смысловую и формальную релевантность, когда соответствие рассматривается либо относительно информационной потребности потребителя, либо относительно запроса.

При сканировании страниц поисковая машина определяет:

• количество слов;

• частоту вхождений запроса в текст;

• ключевые слова;

• текст, расположенный в начале;

• заголовок страницы;

• тему страницы

Поисковая систему в состоянии определять лишь формальную релевантность документа, когда наличие или отсутствие ключевых слов в до­кументе в заданном а) отношении является основным параметром поиска. Другими важными характеристиками результату поиска являются полно та и точность. Полнота отражает отношение релевантных откликов к количеству всех возможных документов, удовлетворяющих информационную потребность потребителя. Точность выражает отношение совокупно ста релевантных откликов к количеству всех выданных документов.

Особенности осуществления поиска информации обусловлены особенностями самой сети. Сетевое информационное пространство является гибкой, динамической и постоянно изменяющей системой. Поисковики, проводящие анализ данных в заданном пространстве (например, в рус­скоязычном Интернете), формируют собственную базу, где отражают со­держание всех документов. Причем поисковая машина на какой-либо сайт может выйти только в случае, если какие-то другие сайты имеют ссылки на данную страницу. При отсутствии перекрестных ссылок машина не в состоянии обнаружить имеющийся в сети документ

Любая поисковая система включает в себя специальную базу данных, в которой хранится описание документов на определенный момент времени. Получается, что поиск фактически осуществляется не во всей сети а имеющейся базе данных. Интересны результаты поиска по одному запросу, но с использованием paзличныx поисковых служб. Каждая служба вы дает собственный набор данных. Что выявляет негативные тенденции, ко­торые необходимо учитывать при осуществлении поиска. Это:

• база данных поисковой системы может содержать не все имеющиеся в сети документы;

• сохраненные документы могут отсутствовать в сети.

Поиск можно организовать по-разному. Наивнее простым способом является составление запроса в виде простого набора слов. Например, пе­дагогическая система технология. Поисковая машина выдаст адреса доку­ментов, где содержатся три слова; но не надокдать, что во всех доку­ментах будут встречаться все три слова, т. е. могу быть предложены стра­ницы, где встречаются слова либо «педагогическая система», либо «техно­логия», либо просто «педагогическая». То есть автор может быть боль­шой, до тысячи страниц более.

К золотым правилам поиска информации в сети можно отнести сле­дующие требования:

1. Учитывать особенности естественного языка

2. Не допускать орфографических ошибок.

3. Избегать поиска по одному слову, использовать необходимый и достаточный набор слов.

4. Не писать большими буквами.

5. Исключать из поиска ненужные слова.

6. Использовать возможности расширенного поиска.

Два фактора влияют на результаты поиска, такие как: учет возможно­стей естественного языка и использование средств, предоставляемых поис­ковыми системами. К особенностям естественного языка можно отнести:

• Полисемию (смысловое многообразие слова или сочетания слов);

• Омонимию (разных по смыслу, но одинаково пишущихся слов;

. Синонимы (различающихся по написанию и произношению слов, но тождественных по смыслу).

IV. Проведение лабораторной работы

Лабораторная работа

«Поиск информации в сети Интернет»

Задание: найти информацию с описанием возможности сети интернет.

1 шаг. Выделить ключевое слово для поиска.

2 шаг. Определить наиболее удачное словосочетание с ключевым словом.

3 шаг. Выбрать поисковую систему.

4 шаг. Подключиться к сети.

5 шаг. Запустить головную страницу портала с поисковой системой

6 шаг. Внести словосочетание в поисковую строку-

7 шаг. Проанализировать уровень соответствия страниц поставленной

задаче.

8 шаг. Открыть ссылки на заданные страницы-

9 шаг. Сохраните страницы для детального знакомства в рабочей папке.

V. Выполнение практического задания

1. Создать папку «Результаты поиска» в собственной папке,

л ч л гтпянитт г к-оТОРЫМИ ПОЛЬ-

2. Определить с помощью журнала адреса ь границ, ки я. зователи данного компьютера работали за последнее врем » менте

3. Перечислить пять последних адресов в текстовом Д У «Блокнот»;

4. Выполнить поиск документов с ключевым словом «Поисковая сис­тема». Определить количество найденных документов - Загрузить первый из найденных документов. Опишите уровень соответствия найденного документа вашим запросам.

Урок 76. Понятие языка запросов

Цели: освоить методы оптимального поиска информации Интернет; иметь представление о возможностям поиска с использованием языка запросов.

Ход урока

I. Организационный момент

И. Актуализация знаний

/Панель По-

- Для чего предназначена панель Поиск, pdK сс вьиыиь • \ ием _ иск включает возможность поиска datHHblx с исполъ ,,„„М1ЛУ „п„_ личных поисковых систем встроенных ё браузеР по,к

ву, введенному в строку поиска. По умолчанию браузер рс встроенной метапоисковой страницы фирмы Microsoft адресная

- Для чего предназначена адресная строка обозревателя строка обозревателя позволяет выйти на саит по аРё у

формате URL или IP-адресу.) >овисные службы Интернет?

- Какие средства поиска предоставляют сервисные w у ™ ,т .п*™м (Можно воспользоваться поисковыми м1аштами> структурирован­ными каталогами и системами метапоиска-)

Перечислите англоязычные и русскоязычные поисковые системы? Среди англоязычных поисковых систем можно отметить: Google, Yahoo, AltaVista, Lycos и др. Наиболее популярными русскоязычными системами являются: Яndex, Rambler, Апорт и др.)

- Какими свойствами должен обладать запрос для учета информаци­онных потребностей пользователя? Основными свойствами ре­зультатов поиска являются релевантность, точность и полнота. Они характеризуют уровень соответствия отклика на запрос, от­ношение совокупности релевантных откликов к количеству всех выданных документов и отношение релевантных откликов к коли­честву всех возможных документов.

III. Теоретический материал урока

К средствам поисковых систем относится язык запросов, он различен для разных систем, но имеет определенные характерные особенности. Рас­смотрим язык запросов одной из популярных систем Яndeх. Характер и особенностью этой поисковой машины является учет морфологии языка, т> е. поиск осуществляется по всем формам слова или слов в запросе. Например, если задано слово «лить», то в результате поиска будут предложе­ны документы со словами «льет». Стоит отметить, что не все поисковики обладают такой «способностью».

Синтаксис языка запросов

Синтаксис

Значение

Пример




Запрет перебора всех словоформ

педагогическая система (из поиска будут ис­ключены слова педагогические системы)

-

Обязательное при­сутствие слов в най­денных документах

Педсовет по +пятницам (должны быть выбраны страницы, где встречается слово не только пед­совет, но и обязательное условия наличия слова «пятница»)

(Пишется

слино с искрчае-мьцсло-

Исключение слова из результата поиска

Методическая система -технология (будут ис­ключены документы, где вместе встречаются все три слова)




Обязательное вхож­дение слов в одно предложение

Педагогическая & система




Поиск любого из заданных слов

Методика | технология | методический прием




Требование присут­ствия первого слова в предложении без второго

Педагогическая - система (результаты поиска не будут включать документы где в пределах предложения встречаются оба слова)

&<~~

Поиск в пределах документа

Педагогическая — система (результаты поиска не будут включать страницы где в документе встречаются оба слова)




Поиск устойчивых словосочетаний

«педагогическая система» (учитывается строгая последовательность слов, слово «система педа­гогическая» будет исключено)




Показатель расстоя­ния между словами в предложении

Тема /1 урока (числа после значка показывает на каком расстоянии должно находиться второе сло­во в предложении. Предложения «тема сегодняш­него урока» будут исключены из поиска)




Синтаксис языка

Значение

Пример

/(nm)

Ограничение по рас­стоянию, где п -минимальное, а т -максимальное рас­стояние

Методика /(-4 3) технология (слово «техноло­гия» должно находиться в интервалах от 4 слов слева и до 3 слов справа)

0

Поиск выражений

(методика, технология) /+1 (обучения, изуче­ния) (результатами поиска будут документы, включающие выражения «методика обучения», «методика изучения», «технология обучения», «технология изучения»)

$title

Поиск информации по названиям заго­ловков

$title педагогическая система (результатом бу­дут документы, где в качестве заголовка ис­пользуются эти слова)

$anchor

Поиск информации по названию ссылок

$anchor педагогическая система (если в доку­ментах в качестве гиперссылки используется данный набор)

$Address

Поиск информации по названиям адресов

$Address edu (будут предложены документы, где адреса сайтов включают слово «edu»)

~#UBL="url

Исключение из по­иска определенных страниц, заданных URL

Инфopмaтикa~#URL="wwwлnfoгmika.гu" (по­иск будет осуществлен везде, кроме заданного сайта)

Wink="URL

Поиск сайтов, где есть ссылки на за­данный сайт

#link=" www.informika.ru " (результатом поиска будут сайты, где есть ссылки на заданный адрес URL)

#image= «название файла»

Поиск документом по именам графиче­ских файлов

#image= «comp*» (запрос даст ссылки на доку­менты с изображениями компьютеров)

#abstract= «аннота­ция»

Поиск сайтов, где заданная совокуп­ность встречается в meta тегах

#abstract=«KOMnbK>Tep» (будут определены сай­ты, где встречается заданное слово при исполь­зовании meta тег)

#keywords= «ключевое слово»

Поиск сайтов, где заданное слово вы­делено в качестве ключевого понятия

#keywords=«KOMnbK>Tep» (будут определены сайты, где слово выделено каким-либо образом)

#Ып1=«под-пись гра­фического файла»

Поиск по подписи изображения, кото­рое появляется при подведении мышки к активной части эк­рана

#hint=«computen> (будут заданы сайты, где встречаются не просто изображения компьюте­ра, а имеющие заданную подпись)

Различные поисковые системы могут реализовать другой алгоритм поис­ка, но описанные подходы являются универсальными на уровне принципов.

Ранжирование результата поиска

Результаты поиска могут быть выстроены по определенному рангу (по дате, по релевантности). По умолчанию используется величина релевант­ности, т. е. соответствие содержания документа поисковому запросу, и документы выстраиваются в порядке убывания. К факторам, влияющим на релевантность документа, является частота использования исходных слов в документе, близость слов выражения в тексте и т. д.

выражениях можно задать вес слова или выражения, которое будет иметь вид слово: число или (поисковое выражение): число. Число увеличивает ранг тех документов, где слово или выражение встречается чаще. На увеличение релевантности документа влияет и уточняющее выражение. Для этого используются знаки условия, например: компьютерная техника. При использовании заданного выражения будут найдены в первую оче­редь документы, где сначала встречается слово «техника», а лишь затем слово «компьютер».

IV. Подведение итогов урока