Урок Что изучает информатика?
Вид материала | Урок |
СодержаниеУрок 74. Типы поисковых серверов и их особенности Урок 75. Основные понятия и характеристики результатов поиска Урок 76. Понятие языка запросов |
- Первый урок информатики в 7-м классе, 17.4kb.
- Сафонова Н. В. Что изучает математика?, 135.4kb.
- Конкурс «Теоретический» Что изучает морфемика? Из каких значимых частей образуются, 66.32kb.
- Конспекты уроков 6 класс 1 час в неделю Урок №1 Что изучает география, 3866.74kb.
- Рабочая учебная программа по дисциплине «Информатика» Направление №230100 «Информатика, 91.73kb.
- Лекция №1 Научный статус социологии, 108.24kb.
- Гузеева Татьяна Ивановна доктор технических наук Профессор лекция, 351.77kb.
- Кинематика, 366.47kb.
- Уроки с измененными способами организации, 139.22kb.
- Протокол № от Юсупова Л. Я. Председатель ЦК горина, 527.64kb.
<иЧ1е>Поисковые системы: сравнительные характеристики <ЛШе> пеас!><1ит1>Определение поисковых систем, основные характеристики поисковых систем
Теперь релевантность по поисковому запросу «поисковая система» будет очень высока, этот документ будет находиться iB top Ю» пока его не сместят более новые сайты с такими же ключевыми словами- Да> только не забудьте, что и в теле странички должны в разных местах повторяться эти слова.
IV. Выполнение практического задания
1. Войти в документ, стоящий первым в списке результатов поиска по ключевому слову «Поисковая система» и1 определить, сколько раз в теле программы встречается слово поисковая система.
2. Подберите ключевые слова для поиска информации на тему «Возможности сетевых технологий». Определите релевантность найденных документов.
V. Подведение итогов урока
Урок 74. Типы поисковых серверов и их особенности
Цели: иметь представление о поисковых серверах и их отличительных характеристиках; научиться пользоваться поисковыми системами для удовлетворения собственных информационных потребностей.
Ход урока
I. Организационный момент
II. Актуализация знаний
- Какие возможности предоставляет поисковая система сети Интернет? (Поисковая система обладает мощными возможностями: поисковой машиной и базой данных. Поисковая машина сканирует сеть и сохраняет образы документов в своей базе. Если документ
был удален или перемещен его можно просмотреть в режиме сохраненного документа.)
- Что отражает релевантность запроса? (Релевантность - это характеристика, которая отражает соответствие найденных документов запросу.)
Щ. Теоретический материал урока
Отсутствие в сети Интернет четкой централизованной структуры повлияло на то, что ее развитие в целом имеет хаотичный характер. Появляются все новые и новые сервера, где хранятся огромные массивы информации. Осуществлять поиск информации с помощью ввода только готового адреса в адресную строку не представляется возможным. Поэтому вопросы поиска информации становятся очень актуальными, и с годами проблема будет только увеличиваться.
Для осуществления поиска в сети используются поисковые системы, основное назначение которых - облегчение пользователю процесса поиска информации, причем не только на серверах WWW, но и FTP, Usenet и других ресурсах Интернет. Во всемирной паутине Интернет находится несколько тысяч поисковых систем, среди которых есть как уже хорошо зарекомендовавшие себя, так и менее известные. Из наиболее известных поисковых машин можно назвать среди зарубежных: AltaVista, Google, HotBot, InfoSeek, Lycos, WebCrawler, Yahoo и др.; среди российских: Rambler, АПОРТ, Яndех и др. У каждой поисковой системы есть как достоинства, так и недостатки. Критериями выбора поисковой системы могут служить такие характеристики как:
принцип работы поисковой машины; удобство использования; внешнее оформление; сложность языка запросов;
наличием различных расширенных функций (управления форматом и ранжированием выводимой информации, переводом вводимых ключевых слов на другой язык и т.д.); скоростью работы;
уровнем загруженности в конкретные моменты времени и надежностью и пр.
Выбор поисковой системы для конкретного применения определяйся целью поиска, характером искомой информации, желаемым форматом выводимых данных и шириной охвата отслеживаемых адресов серверов в сети Интернет. Наиболее популярными поисковыми серверами на русскоязычной территории (в порядке убывания количества результатов поиска) являются Яndeх, Rambler, Google, АПОРТ, Yahoo и т.д.
Существует 2 основных типа поисковых систем Интернет: индексные и классификационные (каталоговые). Индексные поисковые системы (например, AltaVista, Google, HotPot, АПОРТ, Яndех и др.), работая в автоматическом режиме обновления своей информации, просматривают в сети Интернет содержимое серверов, индексируют всю информацию, содержащуюся в них, и вносят информацию о расположении слов на страницах сайтов в свои базы данных.
Каталоговые системы поиска (например, Rambler, Yahoo! и др.) содержат тематически структурированный каталог серверов, и чаще всего пополняются вручную. Обычно на WWW-странице классификационной поисковой системы содержится и поле для ввода ключевых слов для ло-иска в собственной базе данных. В каталоговой системе поиска мождао,
начав с более крупной тематической рубрики, постепенно спускаясь дальше по рубрикам, прийти к ссылке на нужный сервер. В одних случаях бывает удобней воспользоваться первым типом поисковых систем, в других - вторым.
Есть поисковые системы, сочетающие в себе оба принципа работы. В частности, большинство индексных поисковых систем имеют и каталоговую систему поиска. Также поисковые машины могут использовать и какие-то другие принципы методов поиска. Многие поисковые системы преобразовались в Интернет-порталы, объединяющие в себе большое количество ресурсов и сервисов. На страницах таких порталов можно прочитать новости, программу телепередач, узнать о погоде, курсах валют и многое другое.
Для поиска информации на русскоязычных сайтах рекомендуется пользоваться российскими поисковыми системами, ввиду наличия русскоязычного интерфейса, возможности поиска по русским словам, учета особенностей (морфологии) русского языка, близости расположения серверов и т.д. Для поиска одновременно в нескольких поисковых системах можно воспользоваться так называемыми поисковыми метамашинами, которые не имеют своих систем поиска, а используют возможности других поисковых систем.
Как известно, поисковых систем в Интернете много и найти нужную информацию крайне непросто. Отсутствие единого стандарта на спецификацию задачи поиска в Сети приводит к тому, что на каждом узле предлагается собственный способ решения поставленной задачи. В результате пользователь, не имеющий необходимых навыков в создании синтаксических конструкций запросов к поисковой системе, либо не полностью использует возможности каждого портала, либо, изучив функции конкретного узла, постоянно обращается лишь к одному.
Метапоисковая система имеет и другое преимущество, такое как использование единого языка запросов, в некоторых системах даже заложена возможность перевода ключевых слов на другие языки. Такие поисковые системы, получая результаты запросов от других поисковых систем, фильтруют полученные материалы, убирают дублирующиеся ссылки, и сортируют их по релевантности. Для поиска зарубежных ресурсов можно пользоваться и российскими поисковыми метамашинами, обращающимися к другим поисковым средствам (в том числе зарубежным), потому что имеющего в большинстве случаев доступ к скоростному каналу за рубеж и т. д.
Существуют также поисковые системы, специализирующиеся на поиске по конкретной тематике (например, по информационным технологиям, по музыке, по ресурсам, посвященным природе и т. д.). А самый простой способ поиска - это ввод в адресную строку названия фирмы, т. к. все крупные формы в названии адреса используют собственное имя.
В качестве итоговых слов можем сказать, что для получения качественного результата поиска, необходимо использовать возможности различных поисковых систем. Регулярное использование только одной из систем может плохо отразиться на результатах поиска.
IV. Выполнение практического задания
Оценить возможности трех поисковых систем по определенному запросу, по каким-либо критериям, выбранным на свой вкус.
V. Подведение итогов урока
Урок 75. Основные понятия и характеристики результатов поиска
Цели урока:
• знать основные характеристики результатов поиска;
• иметь представление о способах увеличения релевантности результатов поиска.
Ход урока
I. Организационный момент
II. Актуализация знаний
- Назовите характеристики поисковых систем. (При выборе поисковых систем необходимо обращать внимание на: принцип работы поисковой машины, удобство использования, внешнее оформление, сложность языка запросов, наличие различных расширенных функций (управления форматом и ранжированием выводимой информации, переводом вводимых ключевых слов на другой язык и т.д.), скорость работы, уровень загруженности в конкретные моменты времени и надежность и пр.)
- Назовите типы поисковых машин. (Различают два типа поисковых машин: индексные и классификационные. В первом случае, поисковик автоматически просматривает содержимое сети и индексируют всю информацию. Во втором - структурированный каталог формируется практически вручную.)
- Какие возможности предоставляет метапоисковая система? (Метапоисковая система предоставляет возможность использования единого языка запросов для нескольких поисковиков.)
III. Теоретический материал урока
Совокупность сведений и данных, необходимых пользователю в данный момент времени, называют информационной потребностью. Если человек способен понимать чужую речь, исходя из контекста, то технические системы предпочитают работать с формализованными данными. Возникает необходимость представления информационной потребности в виде набора определенных понятий, которые должны выступить в качестве ключевых понятий. При составлении данного набора значение имеют не только слова, но и отношения между ними. Данную совокупность принято называть запросом.
После ввода запроса поисковая система осуществляет выборку документов, с последующим формированием результата по определенным критериям, которые внесены в параметры поиска. Совокупность документов, которая соответствует запросу (выдача, отклик), характеризуется свойством релевантности, т. е. показателем уровня соответствия отклика запросу. Различают смысловую и формальную релевантность, когда соответствие рассматривается либо относительно информационной потребности потребителя, либо относительно запроса.
При сканировании страниц поисковая машина определяет:
• количество слов;
• частоту вхождений запроса в текст;
• ключевые слова;
• текст, расположенный в начале;
• заголовок страницы;
• тему страницы
Поисковая систему в состоянии определять лишь формальную релевантность документа, когда наличие или отсутствие ключевых слов в документе в заданном а) отношении является основным параметром поиска. Другими важными характеристиками результату поиска являются полно та и точность. Полнота отражает отношение релевантных откликов к количеству всех возможных документов, удовлетворяющих информационную потребность потребителя. Точность выражает отношение совокупно ста релевантных откликов к количеству всех выданных документов.
Особенности осуществления поиска информации обусловлены особенностями самой сети. Сетевое информационное пространство является гибкой, динамической и постоянно изменяющей системой. Поисковики, проводящие анализ данных в заданном пространстве (например, в русскоязычном Интернете), формируют собственную базу, где отражают содержание всех документов. Причем поисковая машина на какой-либо сайт может выйти только в случае, если какие-то другие сайты имеют ссылки на данную страницу. При отсутствии перекрестных ссылок машина не в состоянии обнаружить имеющийся в сети документ
Любая поисковая система включает в себя специальную базу данных, в которой хранится описание документов на определенный момент времени. Получается, что поиск фактически осуществляется не во всей сети а имеющейся базе данных. Интересны результаты поиска по одному запросу, но с использованием paзличныx поисковых служб. Каждая служба вы дает собственный набор данных. Что выявляет негативные тенденции, которые необходимо учитывать при осуществлении поиска. Это:
• база данных поисковой системы может содержать не все имеющиеся в сети документы;
• сохраненные документы могут отсутствовать в сети.
Поиск можно организовать по-разному. Наивнее простым способом является составление запроса в виде простого набора слов. Например, педагогическая система технология. Поисковая машина выдаст адреса документов, где содержатся три слова; но не надокдать, что во всех документах будут встречаться все три слова, т. е. могу быть предложены страницы, где встречаются слова либо «педагогическая система», либо «технология», либо просто «педагогическая». То есть автор может быть большой, до тысячи страниц более.
К золотым правилам поиска информации в сети можно отнести следующие требования:
1. Учитывать особенности естественного языка
2. Не допускать орфографических ошибок.
3. Избегать поиска по одному слову, использовать необходимый и достаточный набор слов.
4. Не писать большими буквами.
5. Исключать из поиска ненужные слова.
6. Использовать возможности расширенного поиска.
Два фактора влияют на результаты поиска, такие как: учет возможностей естественного языка и использование средств, предоставляемых поисковыми системами. К особенностям естественного языка можно отнести:
• Полисемию (смысловое многообразие слова или сочетания слов);
• Омонимию (разных по смыслу, но одинаково пишущихся слов;
. Синонимы (различающихся по написанию и произношению слов, но тождественных по смыслу).
IV. Проведение лабораторной работы
Лабораторная работа
«Поиск информации в сети Интернет»
Задание: найти информацию с описанием возможности сети интернет.
1 шаг. Выделить ключевое слово для поиска.
2 шаг. Определить наиболее удачное словосочетание с ключевым словом.
3 шаг. Выбрать поисковую систему.
4 шаг. Подключиться к сети.
5 шаг. Запустить головную страницу портала с поисковой системой
6 шаг. Внести словосочетание в поисковую строку-
7 шаг. Проанализировать уровень соответствия страниц поставленной
задаче.
8 шаг. Открыть ссылки на заданные страницы-
9 шаг. Сохраните страницы для детального знакомства в рабочей папке.
V. Выполнение практического задания
1. Создать папку «Результаты поиска» в собственной папке,
л ч л гтпянитт г к-оТОРЫМИ ПОЛЬ-
2. Определить с помощью журнала адреса ь границ, ки я. зователи данного компьютера работали за последнее врем » менте
3. Перечислить пять последних адресов в текстовом Д У «Блокнот»;
4. Выполнить поиск документов с ключевым словом «Поисковая система». Определить количество найденных документов - Загрузить первый из найденных документов. Опишите уровень соответствия найденного документа вашим запросам.
Урок 76. Понятие языка запросов
Цели: освоить методы оптимального поиска информации Интернет; иметь представление о возможностям поиска с использованием языка запросов.
Ход урока
I. Организационный момент
И. Актуализация знаний
/Панель По-
- Для чего предназначена панель Поиск, pdK сс вьиыиь • \ ием _ иск включает возможность поиска datHHblx с исполъ ,,„„М1ЛУ „п„_ личных поисковых систем встроенных ё браузеР по,к
ву, введенному в строку поиска. По умолчанию браузер рс встроенной метапоисковой страницы фирмы Microsoft адресная
- Для чего предназначена адресная строка обозревателя строка обозревателя позволяет выйти на саит по аРё у
формате URL или IP-адресу.) >овисные службы Интернет?
- Какие средства поиска предоставляют сервисные w у ™ ,т .п*™м (Можно воспользоваться поисковыми м1аштами> структурированными каталогами и системами метапоиска-)
Перечислите англоязычные и русскоязычные поисковые системы? Среди англоязычных поисковых систем можно отметить: Google, Yahoo, AltaVista, Lycos и др. Наиболее популярными русскоязычными системами являются: Яndex, Rambler, Апорт и др.)
- Какими свойствами должен обладать запрос для учета информационных потребностей пользователя? Основными свойствами результатов поиска являются релевантность, точность и полнота. Они характеризуют уровень соответствия отклика на запрос, отношение совокупности релевантных откликов к количеству всех выданных документов и отношение релевантных откликов к количеству всех возможных документов.
III. Теоретический материал урока
К средствам поисковых систем относится язык запросов, он различен для разных систем, но имеет определенные характерные особенности. Рассмотрим язык запросов одной из популярных систем Яndeх. Характер и особенностью этой поисковой машины является учет морфологии языка, т> е. поиск осуществляется по всем формам слова или слов в запросе. Например, если задано слово «лить», то в результате поиска будут предложены документы со словами «льет». Стоит отметить, что не все поисковики обладают такой «способностью».
Синтаксис языка запросов
Синтаксис | Значение | Пример |
| Запрет перебора всех словоформ | педагогическая система (из поиска будут исключены слова педагогические системы) |
- | Обязательное присутствие слов в найденных документах | Педсовет по +пятницам (должны быть выбраны страницы, где встречается слово не только педсовет, но и обязательное условия наличия слова «пятница») |
(Пишется слино с искрчае-мьцсло- | Исключение слова из результата поиска | Методическая система -технология (будут исключены документы, где вместе встречаются все три слова) |
| Обязательное вхождение слов в одно предложение | Педагогическая & система |
| Поиск любого из заданных слов | Методика | технология | методический прием |
| Требование присутствия первого слова в предложении без второго | Педагогическая - система (результаты поиска не будут включать документы где в пределах предложения встречаются оба слова) |
&<~~ | Поиск в пределах документа | Педагогическая — система (результаты поиска не будут включать страницы где в документе встречаются оба слова) |
| Поиск устойчивых словосочетаний | «педагогическая система» (учитывается строгая последовательность слов, слово «система педагогическая» будет исключено) |
| Показатель расстояния между словами в предложении | Тема /1 урока (числа после значка показывает на каком расстоянии должно находиться второе слово в предложении. Предложения «тема сегодняшнего урока» будут исключены из поиска) |
Синтаксис языка | Значение | Пример |
/(nm) | Ограничение по расстоянию, где п -минимальное, а т -максимальное расстояние | Методика /(-4 3) технология (слово «технология» должно находиться в интервалах от 4 слов слева и до 3 слов справа) |
0 | Поиск выражений | (методика, технология) /+1 (обучения, изучения) (результатами поиска будут документы, включающие выражения «методика обучения», «методика изучения», «технология обучения», «технология изучения») |
$title | Поиск информации по названиям заголовков | $title педагогическая система (результатом будут документы, где в качестве заголовка используются эти слова) |
$anchor | Поиск информации по названию ссылок | $anchor педагогическая система (если в документах в качестве гиперссылки используется данный набор) |
$Address | Поиск информации по названиям адресов | $Address edu (будут предложены документы, где адреса сайтов включают слово «edu») |
~#UBL="url | Исключение из поиска определенных страниц, заданных URL | Инфopмaтикa~#URL="wwwлnfoгmika.гu" (поиск будет осуществлен везде, кроме заданного сайта) |
Wink="URL | Поиск сайтов, где есть ссылки на заданный сайт | #link=" www.informika.ru " (результатом поиска будут сайты, где есть ссылки на заданный адрес URL) |
#image= «название файла» | Поиск документом по именам графических файлов | #image= «comp*» (запрос даст ссылки на документы с изображениями компьютеров) |
#abstract= «аннотация» | Поиск сайтов, где заданная совокупность встречается в meta тегах | #abstract=«KOMnbK>Tep» (будут определены сайты, где встречается заданное слово при использовании meta тег) |
#keywords= «ключевое слово» | Поиск сайтов, где заданное слово выделено в качестве ключевого понятия | #keywords=«KOMnbK>Tep» (будут определены сайты, где слово выделено каким-либо образом) |
#Ып1=«под-пись графического файла» | Поиск по подписи изображения, которое появляется при подведении мышки к активной части экрана | #hint=«computen> (будут заданы сайты, где встречаются не просто изображения компьютера, а имеющие заданную подпись) |
Различные поисковые системы могут реализовать другой алгоритм поиска, но описанные подходы являются универсальными на уровне принципов.
Ранжирование результата поиска
Результаты поиска могут быть выстроены по определенному рангу (по дате, по релевантности). По умолчанию используется величина релевантности, т. е. соответствие содержания документа поисковому запросу, и документы выстраиваются в порядке убывания. К факторам, влияющим на релевантность документа, является частота использования исходных слов в документе, близость слов выражения в тексте и т. д.
выражениях можно задать вес слова или выражения, которое будет иметь вид слово: число или (поисковое выражение): число. Число увеличивает ранг тех документов, где слово или выражение встречается чаще. На увеличение релевантности документа влияет и уточняющее выражение. Для этого используются знаки условия, например: компьютерная техника. При использовании заданного выражения будут найдены в первую очередь документы, где сначала встречается слово «техника», а лишь затем слово «компьютер».
IV. Подведение итогов урока