Пропедевтический курс для интернет-консультантов Под редакцией А. В. Мартынихина

Вид материалаДокументы
Другие поисковые машины
Поиск документов на русском языке
Поисковая система Rambler www.rambler.ru
Простой поиск
Искать в найденном
Расширенный поиск
Поисковая система Яndex www.yandex.ru
Простой поиск
Поиск по категориям
Расширенный поиск
Подобный материал:
1   2   3   4   5   6   7   8

Другие поисковые машины


Существует специальная поисковая система для поиска медицинской информации – Medical World Search (www.msearch.com). Она посылает запросы на другие поисковые системы и затем отбрасывает повторяющиеся ответы, причем делает это очень корректно. Тем не менее, при поиске медицинской информации гораздо удобнее пользоваться каталогами, где есть краткие аннотации. Вот два самых популярных:

Doctor’s Guide to Internet (ссылка скрыта. Сайт содержит два больших раздела – для врачей и пациентов (то, что врачи могут рекомендовать пациентам в качестве информационных ресурсов). Для врачей есть следующие разделы: новости, новые сайты недели, новые лекарственные средства и их описание, расписание медицинских конференций, рецензии на новые книги и ресурсы Интернет. В последнем все ссылки классифицированы очень подробно: клинические и медицинские центры, сайты по различным заболеваниям, ассоциации, журналы, фармацевтические сайты и многое другое. И в каждом разделе – очень большое количество ссылок с кратким описанием. Раздел для клиницистов содержит ссылки, классифицированные по заболеваниям и также снабженные небольшим комментарием.

Medical Matrix (www.medmatrix.org) – см. в разделе «Медицинские профессиональные клубы».

Среди других каталогов можно отметить Galen II Selected Internet resources (galen.library.ucsf.edu/kr), сайт Университета Сан-Франциско, Калифорния. Он предоставляет возможность поиска по своим страницам. Есть детально структурированный каталог тем по медицине. В этом же разделе есть коллекция адресов Web-директорий.

Medweb (ссылка скрыта) – каталог сайтов, связанных со здоровьем. Он создается библиотекой центра исследования здоровья Эмори, чтобы обеспечить доступ к биомедицинской информации для целей образования, исследований и помощи пациентам.

Поиск документов на русском языке


Существует расхожее мнение, что искать русскоязычные документы в англоязычных ИПС нерационально: времени и сил придется затратить много, а полученные результаты, мол, Вас не удовлетворят. В отношении поисковой системы Altavista ЭТО ОШИБОЧНЫЙ СТЕРЕОТИП! Как отмечено выше, Altavista поддерживает поиск на русском языке в режиме простого поиска. Другое дело, что поиск на русском языке будет результативным, если помнить, что при такой работе необходимо выполнить предварительные настройки, заключающиеся в выборе кодовой страницы (Windows-1251, KOI8-R или ISO-8859-5) в разделе Language Settings и согласовании с этим выбором кодовой страницы, на которую настроен броузер (меню Вид/Кодировки).

Необходимо отметить также, что доступен поиск в Altavista с учетом русской морфологии, организованный через интерфес на сервере www.comptek.ru/alta.phpl, действующий на основе поискового механизма Яndex.

В российском сегменте Интернет имеются словарные поисковые системы, специально разработанные для эффективного поиска информации по русскоязычным информационным ресурсам. Наиболее известными из них являются Rambler ссылка скрыта, Яndex ссылка скрыта и Апорт www.aport.ru. Эти системы – двуязычные, то есть они позволяют вводить ключевые слова как на русском языке, так и на английском. Они представляют собой ИПС словарного типа, и хотя количество индексируемых ими серверов меньше, чем обрабатывает Altavista, за счет специальных настроенных на русскоязычный поиск алгоритмов часто более эффективные результаты.

Из классификационных систем российского Интернет выделим рубрикаторы AtRus (www.atrus.ru, старое название «АУ»), а также каталоги ресурсов Созвездие Интернет (www.stars.ru) и List.RU ссылка скрыта.

Медицина в этих системах выделена в качестве отдельного раздела.

Последнее время разработчики многих ИПС, развивая возможности своих систем, реализуют идею информационных порталов, т.е. сайтов, информация на которых представляется в зависимости от настроек, указанных пользователем. Подобно Yahoo такие системы предоставляют пользователю широкий спектр информационных услуг: от бесплатные почтовые ящиков и прогноза погоды в интересующем Вас регионе до списков рассылки по избранным Вами темам. Этими качествами обладают все перечисленные выше системы.

Поисковая система Rambler

www.rambler.ru


Самая "заслуженная" из рассматриваемых русских поисковых систем – Rambler - разработана компанией Стек ссылка скрыта и запущена в эксплуатацию осенью 1996 г. Поисковая система Rambler содержит миллионы документов с более чем 42 тысяч сайтов (имен DNS) России и стран СНГ. Имеет развитый язык запросов и гибкую форму вывода результатов. Поиск Rambler включен в стандартную поставку русской версии Microsoft® Internet Explorer 4.0.

Система поддерживает два режима словарного поиска – простой и расширенный.

Простой поиск


Запрос для простого поиска вводится в предназначенное для этого текстовое поле базовой страницы Rambler. В запросе можно использовать одно или несколько ключевых слов, разделенных пробелами. Могут быть использованы как русские, так и английские словосочетания. Ключевые слова могут соединяться логическими операторами AND (&), OR и NOT.

Любой поисковый термин может содержать в себе как заглавные, так и строчные буквы. Перед осуществлением поиска прописные буквы автоматически заменяются строчными. Написать Сердце или сердце – результат поиска будет одинаковым.

По умолчанию Rambler ищет поисковые слова в том виде (падеж, число и т.д), как их ввели, чтобы уменьшить "шум" в найденных документах.

При простом поиске могут быть использованы следующие дополнительные операторы:
  • символы (*) и (?) для обозначения произвольной части слова и произвольного символа слова, соответственно;
  • (+) и (-) для увеличения / уменьшения весового значения любого слова (то есть меры его релевантности). Так, ключевое слово, находящееся в названии документа, «весит» больше, чем найденное в тексте. Возможно многократное использование данных символов;
  • для поиска части документа Вы можете использовать специальные слова: $All, $URL, $Title, $Header, $Essence, $Address. Специальные слова начинаются с символа '$'.

Поисковые термины можно объединять в логические группы. Термины могут быть сгруппированы посредством использования круглых скобок '(' и ')'. Возможна многократная вложенность скобок в сочетании с логическими операторами.

Вы можете определить, в каких документах искать, с помощью служебных слов $RUSSIAN или $ENGLISH для русского и английского языков соответственно. Регистр слов не важен. По умолчанию считается, что следует производить поиск по всем документам.

Вы можете определить тип сортировки служебными словами $YOUNG и $OLD. В первом случае документы будут отсортированы в обратно-хронологическом порядке (наверху будут показаны самые свежие документы); во втором - порядок расположения документов будет хронологическим (от старых к новым). По умолчанию сортировка документов производится по релевантности, причем первыми даются ссылки на документы с наибольшими «весовыми» значениями.

Замечательной возможностью Rambler’а является Искать в найденном, которая по своей сути является удобной для пользователя формой последовательного формирования запроса с использованием логического оператора AND. Для активизации такого поиска нужно после получения ответа на простой запрос установить соответствующий переключатель в окне ввода контекста для поиска и ввести ключевое слово, уточняющее запрос.

Все перечисленные выше правила могут быть использованы совместно друг с другом в необходимой Вам последовательности.

Расширенный поиск


Для выполнения расширенного поиска достаточно щелкнуть мышью по кнопке Детальный запрос. В этом режиме пользователю предлагается, кроме ввода поискового термина, определить:
  • сферу поиска (в документах, в их названиях, в заголовках, в началах документов, в адресах (URL), в поле адрес);
  • количество выводимых документов на страницу (15, 30, 50);
  • форма вывода (нормальная, краткая, детальная);
  • слова (все, любое);
  • словоформы (используя корень, нет, произвольные окончания);
  • язык документа (любой, русский, английский);
  • минимальное расстояние между словами (да, нет);
  • сортировать по (релевантности, свежести, старости);
  • полное соответствие запросу (да, нет);
  • хронологические рамки (от даты - до даты);
  • исключить документы, содержащие определенные слова;

Поисковая система Яndex

www.yandex.ru


Yandex (Яndex – как написано на логотипе) - русскоязычная поисковая машина последнего поколения. Она запущена в сентябре 1997 года. Разработчик - фирма CompTek. На момент написания настоящего пособия база данных этой словарной поисковой машины охватывала более 120000 серверов и около 20 миллионов документов. Система обладает развернутой и сложной системой формирования запроса. Для нее характерны следующие отличительные особенности:
  • полнотекстовый поиск с полным учетом морфологии русского и английского языков;
  • возможность запросов на естественном языке;
  • возможность поиска с выбором региона из обширного списка;
  • возможность сортировки найденных документов по релевантности или дате, а также уникальная возможность группировки документов по серверам;
  • возможность ограничить поиск, указанием категории из широкого спектра;
  • возможность поиска похожего документа.

Индексируя страницы сети, Яндекс создает копии страниц и запоминает положение слов в документе. Это дает возможность выделить слова, найденные в тексте. И не просто выделить, а переходить с одного слова на другое. Эти слова выделены угловыми скобками. Чтобы увидеть первое найденное слово, нажмите на стрелочку влево, чтобы увидеть последнее - на стрелочку вправо. Переход на следующее слово – стрелочка справа от слова, переход на предыдущее – слева. Первое и последнее слова указывают на верхнюю и нижнюю таблицу соответственно.

Простой поиск


При простом поиске нужно написать в строке запроса ключевые слова или фразу. В результате Вы получите список адресов документов, в которых встречаются эти слова в разных падежах и числах. Система сортирует результаты поиска по степени релевантности (соответствия запросу): в начале списка окажутся документы, где ключевые слова запроса встречаются наибольшее количество раз и стоят как можно ближе друг к другу.

Для тех, кто уже работал в Яndex’е, отметим, что в 2000 году разработчики убрали со стартовой страницы переключатель строгий поиск (с языком запросов). Логические операторы AND, OR и NOT и их эквиваленты можно писать прямо в строке для ввода контекста для поиска. Возможность «дружелюбного» формирования сложного запроса предоставлена пользователям на странице Расширеный поиск, где большая часть настроек Яndex задается простым образом. Подробно поиск с языком управления запросами описан в разделе Помощь, доступном в любой момент в верхней части страницы Яndex’а.

Также, как и на Rambler’е в поисковой системе Яndex можно шаг за шагом сужать область поиска, нажимая после ввода новых ключевых слов кнопку Искать в найденном. Вместе с тем, необходимо отметить, что результаты такого поиска зачастую оказываются «менее понятными», чем при использовании аналогичного механизма в Rambler’е.

Поиск по категориям


Поиск в категории - по сути, комбинация поисковой системы и каталога. В обычном каталоге поиск в разделе идет по описаниям ресурсов, составленными авторами. Разработчики предложили поиск по содержанию страниц, относящихся к тому или иному разделу. С категориями можно работать двумя способами: задавать обычный запрос в Яndex'е и ограничивать результат категориями или ходить собственно по дереву категорий.

Расширенный поиск


Яndex обладает развитым языком запросов, позволяющим осуществлять тонкий поиск. Для того, чтобы воспользоваться широким спектром возможностей языка запросов, используйте страницу Расширенный поиск, где большая часть настроек Яndex задается простым образом. Доступ к этой странице осуществляется по одноименной ссылке над строкой для ввода запроса на стартовой странице системы. Страница расширенного поиска организована таким образом, чтобы настройки Яndex’а задавались простым заполнением необходимых полей и выбором параметров из полей списка. Обратите внимание, что, при заполнении нескольких полей, запрос будут составлен таким образом, чтобы все условия выполнялись одновременно (логический оператор "И"). Если Вас интересуют операторы языка запросов, обратитесь к странице «формального описания», доступной либо через систему Помощи, либо через ссылку Описание над строкой для ввода искомого контекста в режиме «расширенного поиска».

Помимо описанных имеются и другие русскоязычные ИПС, некоторые из которых постепенно набирают силу. Так, на сервере Все лечиться хочут! (www.doktor.ru) есть раздел Обзоры WWW, который представляет еженедельные обзоры медицинских сайтов и предназначен для врачей, студентов и всех людей, заботящихся о своем здоровье. Также представлена база данных из предыдущих выпусков с удобным поиском.

Путем «блужданий» по поисковым машинам Вы накапливаете опыт и определяете для себя перечень информационных ресурсов Сети, соответствующих вашим профессиональным интересам и потребностям. Ресурсы эти разнообразны. Это базы данных, каталоги библиотек, издательства, клубы. Работе с ними посвящены следующие разделы пособия.