Пояснительная записка

Вид материалаПояснительная записка

Содержание


Густота ключевых слов.
Протестируйте ключевые слова
Обязательно используйте мета-теги
Frames и ImageMaps не должны быть помехой!
Если Вы используете Frames
Если Вы используете ImageMaps
Зарегистрируйте Ваши страницы
Submit It!
Сколько страниц надо регистрировать?
Проверьте, проиндексированы ли Ваши страницы.
Особенности размещения рекламы на ресурсах данного типа
Второй способ
Пример: Стоимость размещения баннера 100х100 пикселей на первой странице сервера Aport.ru (
Пример: Размещение баннера 468х60 пикселей в рейтинге Rambler.Ru в категории "Бизнес и финансы" стоит 420 долларов в неделю.
Пример: На поисковом сервере Yandex (
Список наиболее значимых поисковиков и каталогов
Go / InfoSeek
Northern Light
Ask Jeeves
Direct Hit
...
Полное содержание
Подобный материал:
1   ...   4   5   6   7   8   9   10   11   ...   19

, , ).
  • Поисковые системы придают больший "вес" словам, расположенным в начале страницы, нежели тем, что расположены в конце. Постарайтесь сделать так, чтобы ключевые слова встречались в первом параграфе страниц. Имейте в виду, что таблицы и Java-апплеты отодвигают текст, следующий за ними, еще ниже, тем самым уменьшая его значимость для поисковых систем.
  • В Html-документах есть целый ряд служебных полей. Некоторые поисковые системы индексируют их содержание и учитывают при поиске и определении релевантности. К ним можно отнести мета-теги (см. ниже), поле ALT, комментарии к странице. Желательно поместить ключевые слова в эти поля.
  • Густота ключевых слов.

    При определении степени релевантности страниц по заданным ключевым словам большинство поисковых систем учитывают не только количество ключевых слов, а еще и отношение их количества ко всем остальным словам. Таким образом, страница, содержащая только два слова "зимняя рыбалка", будет идти впереди страницы, содержащей помимо сочетания слов "зимняя рыбалка" еще и другие слова.

    Протестируйте ключевые слова

    Посетите все основные поисковые системы. Вводите ключевые слова и смотрите, какие страницы идут первыми. Изучите "source code" этих страниц и посмотрите, где и в каком количестве встречаются вводимые ключевые слова, сделайте соответствующие выводы.

    Обязательно используйте мета-теги

    Большинство поисковых систем учитывают мета-теги. На примере, приведенном ниже, Вы можете видеть два мета-тега, которые предназначены специально для поисковых систем: description и keywords. Эти мета-теги располагаются внутри парного тега и являются невидимыми для браузеров.


    Мир стратегических компьютерных игр




    Тег "keyword". Сюда необходимо поместить ключевые слова. Этот тег позволяет повысить релевантность страницы. Помимо этого, можно использовать слова, которые релевантны тематике сайта, но Вы по каким-либо соображениям не собираетесь включать их непосредственно в текст страницы. Можно использовать не только ключевые слова, но и словосочетания. Пользователь обычно производит поиск не по одному слову, а именно по словосочетанию.
    Так что при прочих равных условиях при запросе "поисковые системы" страница, содержащая в "keywords" сочетание "поисковые системы",



    будет показана выше, чем страница, содержащая два слова отдельно: "поисковые" и "системы":

    .

    Количество разрешенных ключевых слов для этого тега колеблется от системы к системе (длина в среднем составляет 200 символов). Не используйте одни и те же слова в этом теге более семи раз (поисковая система их просто проигнорирует). Рекомендуемое количество - три, причем лучше не помещать их одно за другим, а перемежать с другими ключевыми словами. Если вы используете английские слова, желательно помещать их во множественном числе - "cats" вместо "cat". Пользователь, производя поиск по слову "cat", всегда найдет страницу, содержащую слово "cats", а в противоположном случае страницу отыщет далеко не каждая система.

    Тег "description". При выдаче результатов поисковые системы помимо заголовка показывают первые 100 - 200 символов текста со страницы в качестве аннотации. Но первые слова на странице могут не подходить в качестве аннотации (например, когда в начале стоит текст опции выбора кодировок и т.д.). Используя тег "description", указывайте любое другое описание (желательно уложиться в 200 символов), которое будет привлекательно для пользователя. Помимо всего прочего, включая в это описание ключевые слова, Вы еще больше увеличиваете их процентное соотношение (густоту) на странице и, соответственно, улучшаете ее релевантность. Этот тег также незаменим на странице, целиком состоящей из графических элементов, на которых просто нечего индексировать (без текста вообще).

    Тег "robots". Стоит упомянуть еще об одном важном теге - "robots". Если Вы по каким-либо причинам не хотите, чтобы страница была проиндексирована, поместите туда тег:



    К сожалению, не каждый спайдер понимает данный тег, и более надежным методом является помещение файла robots.txt в корневую директорию сервера со списком страниц, индексации которых Вы не желаете.

    Frames и ImageMaps не должны быть помехой!

    Примерно половина поисковых систем "не понимают" Frames и ImageMaps. Другими словами, "пауки" таких систем просто-напросто игнорируют все, что находится внутри тегов и или, соответственно, в теге .

    Если Вы используете Frames

    Обычно формирование фреймов на экране производится на начальной странице сайта (как правило, index.phpl). Данная страница не несет никакого информационного содержания, и пользователь после ее загрузки видит содержание других Html-страниц, помещенных во фреймы - это заголовок начальной страницы. Причем для пользователя, путешествуюшего по сайту и загружающего различные документы во фреймы, заголовок будет оставаться тем же самым заголовком начальной страницы index.phpl.

    Ввиду того, что в стандартном случае на вышеописанной странице помимо тегов формирования фреймов нет ни текста, ни ссылок на другие страницы сайта, пауку, не понимающему фреймов, нечего будет индексировать и не будет возможности идти по ссылкам дальше, в глубь сайта.

    Решением данной проблемы является использование тега .<br />Поместите внутри парного тега <NOFRAMES> обогащенное ключевыми словами описание страницы и, помимо этого, добавьте туда ссылки на все страницы сайта. Первое поможет пауку выгодно проиндексировать начальную страницу, второе обеспечит доступ паука и ко всем остальным страницам сайта.

    Также необходимо, как и на любой другой странице, использовать мета-теги "description" и "keywords".

    Если Вы применяете фреймы, не следует забывать не только о начальной, но и обо всех остальных страницах. Как я упоминал ранее, пользователь, попавший к Вам через начальную страницу, путешествуя по сайту, будет всегда видеть в заголовке название начальной страницы. Но есть большая вероятность того, что через поисковую систему пользователь найдет не главную, а любую другую страницу ресурса. Поэтому не забывайте указывать заголовок для каждой из страниц. Помимо этого, обеспечьте хорошо различимую ссылку с любой страницы на начальную (формирующую фреймы).

    Используйте примерно следующий код:
    -на главную страницу-
    target="_top"
    - необходимо для того, чтобы пользователи, попавшие на данную страницу "нормальным" образом (для них страница находится во фрейме, а не занимает весь экран), загружали главную страницу во весь экран, а не внутри данного фрейма.

    Не следует помещать тег ранее первого тега <FRAMESET> (это может быть вызвано желанием поместить текст с ключевыми словами как можно раньше, что позволит придать им больше "веса" в глазах поисковых систем). Такой Html код будет работать с Internet Explorer, а вот Netscape Navigator не сможет в этом случае показать фреймы. <br /> <br /><b> Если Вы используете ImageMaps</b> <br /> <br />Здесь все достаточно просто. Создайте возможность альтернативной навигации по сайту. Используйте как альтернативу ImageMaps - текстовые ссылки, которые, разумеется, поймет паук любой поисковой системы. Например, так: <br /> <br />Мировые поисковые системы | Успешная регистрация в каталогах Настройка страниц для поисковых систем | Русские поисковые системы Индексация в поисковых системах <br /> <br />Помимо поисковых систем, Вам скажут спасибо пользователи с отключенной автоматической загрузкой картинок в браузере. <br /> <br /><b> Зарегистрируйте Ваши страницы </b> <br /> <br />Вы можете создать веб-сайт и ждать, пока спайдеры поисковых систем проиндексируют его. Конечно, если на Ваш ресурс будут вести ссылки с других страниц, то рано или поздно это произойдет, но зачастую может пройти довольно долгое время. <br /> <br />Поэтому не ждите и самостоятельно проиндексируйте свой веб-сайт в как можно большем количестве поисковых систем сами. Индексирование можно проводить с помощью специальных бесплатных серверов-регистраторов. Их довольно много, перечисляю некоторые из них: <br /> <br /><b> Submit It! </b>(<u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u>) (платная) <br /> <br /><b>Add Me!</b> (<u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u>) <br /> <br /><b>WWW Broadcaster</b> (<u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u>) <br /> <br /><b>Sputnik ADDER</b> (<u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u>) <br /> <br /><b>@Submit!</b> (<u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u>) <br /> <br /><b>Web Site Submission</b> (<u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u>) <br /> <br /><b>ABS Easy Submit </b>(<u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u>) <br /> <br />В сети есть сервер-регистратор, созданный Артемием Лебедевым для регистрации не только в международных, но и в российских поисковых системах и каталогах - <b>система TAU</b> (<u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u>). Одним из полезных свойств данной системы является опция получения ответов от серверов: сразу становится ясно, где регистрация прошла успешно, а где нет. <br /> <br />Не так давно студией <b>"JS-дизайн"</b> был создан еще один автоматический российский регистратор - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u>. Есть в Рунете и специализированный сайт, посвященный регистрации в поисковиках и каталогах - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u>. <br /> <br /><b>Рис 5-2<br /><br /></b><u><b>увеличить рисунок</b></u><b><br /><br />Бесплатная служба по регистрации в поисковиках и каталогах Рунета, размещенная на специализированном сервере Регистратура.Ру</b> <br /> <br /><img src="images/15588-nomer-348bc49b.png"><br /> <br /><img src="images/15588-nomer-m52f3b950.png"><br /> <br />Однако не стоит до конца доверяться вышеупомянутым серверам-регистраторам. После того, как Вы зарегистрировали свою страницу через них, посетите стратегически важные поисковые системы и зарегистрируйтесь в них вручную. <br /> <br /><b> Сколько страниц надо регистрировать? </b> <br /> <br />В принципе, если ссылки с главной страницы ведут на любую из страниц веб-сайта, то можно зарегистрировать только главную страницу. Робот поисковой системы рано или поздно обойдет весь сайт. Однако следует иметь в виду следующее: <br /> <ul> <li>при регистрации поисковые системы обычно оперативно помещают в индексы указанную страницу и ставят весь остальной сайт в очередь на индексацию, и разница по времени между индексацией указанной страницы и всего остального сайта может составить несколько недель; <br /> <li>некоторые поисковые системы не индексируют автоматически внутренние страницы сервера глубже четвертого уровня (т.е. когда для попадания на страницу надо совершить четыре перехода); <br /> <li>организация навигации с помощью Frames, Imagemaps, Java-скриптов может помешать роботу пройти вглубь веб-сайта для индексации внутренних страниц. <br /> </ul> <br />Принимая во внимание вышеперечисленное, желательно регистрировать не только начальную страницу сайта, но и ряд внутренних ключевых страниц. Конечно, во всем надо знать меру: не стоит регистрировать отдельно каждую страницу, если у Вас их несколько десятков. <br /> <br /><b> Проверьте, проиндексированы ли Ваши страницы.</b> <br /> <br />Через некоторое время после регистрации проверьте, проиндекированы ли страницы в системе, в каком виде выдается результат и т.д. <br /> <br />Время, через которое следует учинить проверку, разнится от системы к системе. Например, InfoSeek поместит страницу в свои индексы в течение нескольких минут после регистрации, AltaVista за 1 день, Excite за три недели. <br /> <br />Многие поисковые системы позволяют проверять наличие страниц в индексах. Например, в AltaVista при следующих запросах вы получите: <br /> <br /><b>url:insurance.com </b>- все проиндексированные страницы в этом домене; <br /> <br /><b>url:insurance.com/firms/</b> - все проиндексированные страницы в этой директории; <br /> <br /><b>url:insurance.com/firms/alco.php</b> - соответсвующую страницу, если она находится в индексах. <br /> <br />Желательно раз в месяц наведываться в стратегически важные для Вас поисковые системы и снова проверять, есть ли Ваши страницы в индексах. Иногда случаются странные вещи, и страницы могут исчезнуть из индексов. <br /> <br />По ряду причин Ваши страницы могут вообще не попасть в индексы: <br /> <ul> <li>Например, AltaVista позволяет индексировать не более чем 600 страниц на один домен. Как следствие, страницы, расположенные в таком, например, обширном домене как geocities.com, имеют большой шанс быть вообще не проиндексированными; <br /> <li>Специализированные поисковые системы, например, российский Апорт, индексируют страницы только доменов ru, su, ua и др., принадлежащих странам ближнего зарубежья. При регистрации страницы, располагающейся в зоне .com, робот проверит корневую страницу ресурса. При отсутствии русского текста индексация не произойдет; <br /> <li>Содержание страницы может быть расценено системой как спам поисковой машины, и, соответственно, она не будет помещена в индекс. <br /> </ul> <br /><br /><br /><b> Особенности размещения рекламы на ресурсах данного типа </b> <br /> <br /><b>Первый способ</b> продвижения сайта с помощью поисковых систем не требует от рекламодателя производить выплаты владельцам поисковых систем и каталогов. (В начале главы мы уже говорили о бесплатной регистрации сервера компании во всех значимых поисковых системах и каталогах и о способах достижения там наилучшего представления информации сервера.) <br /> <br /><b> Второй способ</b> требует вложения определенных материальных средств для покупки и размещения рекламы. Поисковые системы и каталоги обычно предлагают рекламодателям следующие возможности: <br /> <ol> <li>Фиксированное расположение баннера на главной странице сервера. Расчет ведется, как правило, за время размещения - день, неделю, месяц (flat fee). Стоимость зависит от популярности (посещаемости) поисковой системы, ее аудитории, размера и расположения баннера (сверху или снизу страницы). Некоторые системы предлагают размещение текстовых блоков, которые стоят в полтора-два раза дешевле. <br /> </ol> <br /><i> Пример: Стоимость размещения баннера 100х100 пикселей на первой странице сервера Aport.ru (</i><u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u><i>), составляет 4000 долларов в неделю. </i> <br /> <ol start=2> <li>Фиксированное расположение баннера или текстового блока на страницах определенных тематических разделов. Актуально для каталогов или систем рейтинга при поисковых системах (например, <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u>). Аналогично предыдущему, расчет ведется за время размещения - день, неделю, месяц. Стоимость зависит от тематики раздела ("серьезные" - финансы, компьютеры и т.д. - стоят дороже, нежели развлекательные), посещаемости раздела, места размещения рекламы и т.д. <br /> </ol> <br /><i> Пример: Размещение баннера 468х60 пикселей в рейтинге Rambler.Ru в категории "Бизнес и финансы" стоит 420 долларов в неделю.</i> <br /> <ol start=3> <li>Показы баннеров и текстовой рекламы в динамическом блоке не привязаны к определенному месту и идут вперемешку с рекламой других клиентов в результатах поиска. По моему мнению, данный способ размещения наименее эффективный для поисковых систем и каталогов. Стоимость размещения рассчитывается по количеству показов рекламы (в тысячах показов - CPM). Положительным моментом является возможность регулирования количества показов за единицу времени, то есть осуществлять настройку интенсивности. Можно, например, задать, чтобы баннеры показывались точно по 25 000 раз в день. Но в то же время такой вид рекламы остается полностью нефокусированным, хотя его стоимость превышает стоимость целевого воздействия, скажем, через рекламные сети. <br /> </ol> <br /><i> Пример: На поисковом сервере Yandex (</i><u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u><i>) CPM для баннеров в динамическом блоке составляет 10 долларов. </i> <br /> <ol start=4> <li>Контекстный показ рекламы. В этом случае рекламодатель "покупает" в поисковой системе определенные ключевые слова. Туристическая фирма может купить слова "Франция", "курорт", "отель", "тур". При осуществлении поиска, запрос которого содержит одно из этих ключевых слов, пользователь, помимо ссылок на страницы, увидит соответствующий баннер данной турфирмы. Стоимость тысячи показов под ключевые слова составляет обычно от 30 до 50 долларов. Отклик баннеров, как показывает практика, увеличивается в 2-3 раза по сравнению с неконтекстными показами. <br /> </ol> <br /><b>Рис 5-3<br /><br /></b><u><b>увеличить рисунок</b></u><b><br /><br />Система интернет-платежей Cyberplat мы выкупили показы под определенные ключевые словав ведущих российских поисковиках. На скриншоте представлены результаты поиска в системе Yandex. Наряду с результатами поиска на страницу выводится баннер Cyberplat, его показ активирован содержащимся в запросе словом "платежи". Здесь указан старый дизайн сайта.</b> <br /> <br /><img src="images/15588-nomer-348bc49b.png"><br /> <br /><img src="images/15588-nomer-m1641c668.png"><br /> <ol start=5> <li>У ряда моих клиентов возникал вопрос, стоит ли платить за показы в пять раз больше и получать всего в два-три раза больше посетителей. Как правило, ответ на этот вопрос - стоит. И вот почему: пользователя сети в конкретный момент времени можно условно отнести к одному из двух типов - "серферу" или "охотнику". <br /> <li><b>"Серфер"</b> У пользователя небольшой монитор с диагональю 14 дюймов, и он давно подумывает о том, чтобы обзавестись монитором побольше. Однажды при посещении определенного сайта на глаза ему попадается баннер с рекламой 17-ти дюймового монитора. Существует определенная вероятность того, что он вспомнит о своем мониторе и перейдет на сайт рекламодателя, чтобы узнать детали. <br /> <li><b>"Охотник"</b> Пользователь уже принял твердое решение о покупке нового монитора. Он входит в специализированную поисковую систему по компьютерам и периферийным устройствам и производит поиск мониторов с диагональю 17 дюймов. При выдаче результатов появляется баннер, рекламирующий определенный 17-ти дюймовый монитор. Велика вероятность того, что пользователь заинтересуется, нажмет на баннер и перейдет на сайт рекламодателя. <br /> <li>Вероятность того, что покупку совершит "охотник", а не "серфер" в несколько раз выше. Баннеры, показанные под ключевые слова, воздействуют, как правило, именно на "охотников" и, соответственно, привлекают на сайт рекламодателя более "качественных" посетителей. <br /> </ol> <br /><br /><br /><b> Список наиболее значимых поисковиков и каталогов </b> <br /> <br /><b>Основные международные поисковые системы и каталоги</b> <br /> <br /><b>Поисковые системы </b> <br /> <ol> <li><b>Alta Vista</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />AltaVista открыта в декабре 1995, затем куплена компанией Compaq Computer Corporation (до этого была в ведении DEC), а после этого выделилась в самостоятельную компанию, которая сейчас контролируется CMGI. Alta Vista по праву считается самой большой и авторитетной поисковой системой. Для России представляет особый интерес, так как позволяет вести поиск не только на английском, но и на русском, и многих других языках. <br /> <ol start=2> <li><b>Excite </b>- <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Одна из самых крупных поисковых систем в мире. Состоит в партнерстве с Netscape. Запущенная в 1995 году, система быстро развивалась, и в 1996 году Excite купил двух своих конкурентов: Magellan и WebCrawler. Несмотря на смену владельца, эти два поисковых сервера продолжают работать как независимые системы. <br /> <ol start=3> <li><b>Hot Bot -</b> <u>t.com </u> <br /> </ol> <br />Система запущена в мае 1996 года. Является детищем культового журнала Wired. В октябре 1998 года Lycos купил Wired Digital, но продолжал поддерживать HotBot как самостоятельный проект. В большинстве случаев источник первой страницы результатов поиска HotBot - Direct Hit, а дальнейших - Inktomi. Информацию для каталога берется из проекта Open Directory. HotВot находится в постоянной конкурентной борьбе с AltaVista. Мощная поисковая система, одна из тех, которые выдают хорошие результаты поиска <br /> <ol start=4> <li><b> Go / InfoSeek</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Портал, запущенный InfoSeek и Disney. Предлагает как бесплатную почту, так и возможности поисковых машин, заимствованные от InfoSeek (открытая в начале 1995 года, эта система имела весьма солидную репутацию). Осуществляет качественный поиск благодаря используемому алгоритму поиска ESP. Также содержит впечатляющий каталог веб-сайтов, собранный командой специалистов. Официально Go (не путать с GoTo) начал свою работу в 1999. <br /> <ol start=5> <li><b> Northern Light</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u>. <br /> </ol> <br />Система начала работать с августа 1997 года и в данный момент стремительными темпами индексирует Сеть, что ставит ее вровень с ведущими поисковыми системами. Northern Light имеет набор документов "специальной коллекции", которые обычно не доступны спайдерам поисковых машин. Это документы из тысяч источников, включая газеты, журналы, различные базы данных. Поиск таких документов осуществляется бесплатно, однако за их просмотр необходимо заплатить до 4 долларов. Система, кроме обладания огромными ресурсами, имеет возможность классифицировать документы по темам, что является еще одним положительным моментом. <br /> <ol start=6> <li><b>WebCrawler</b> - <u>awler.com </u> <br /> </ol> <br />Существует с апреля 1994 года. Владелец - небезызвестная AOL, и всем пользователям этого сервис-провайдера была рекомендована именно эта поисковая система. В ноябре 1996 WebCrawler был куплен своим конкурентом - Excite, хотя и продолжает работать как независимая поисковая система. Имеет собственную директорию рецензированных страниц. <br /> <ol start=7> <li><b> Ask Jeeves</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Ask Jeeves использует серию вопросов для того, чтобы сузить поле поиска, затем выдает ответ, основанный на материале, подготовленном группой редакторов. Это поисковая система, которая направляет пользователя на ту страницу, которая отвечает на заданный им вопрос. Если системе не удается найти нужную ссылку в собственной базе данных, то она обращается к другим поисковым машинам. Начала работать в июне 1997 года. <br /> <ol start=8> <li><b> Direct Hit</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Direct Hit - компания, которая работает с другими поисковыми машинами для того, чтобы улучшить их результаты. Это осуществляется путем мониторинга того, на какие ссылки из результатов поиска реагируют пользователи. Сайты, ссылки на которые нажимаются чаще, чем на другие, поднимаются выше в рейтинге Direct Hit. Следовательно, Direct Hit позиционируется как "двигатель популярности". Подобная технология хорошо продемонстрирована также на HotBot. <br /> <ol start=9> <li><b> FAST Search</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u>/ <br /> </ol> <br />Раньше назывался All The Web. FAST Search стремится охватить всю "паутину". Стал первой поисковой машиной, которая перешла 200 миллионный рубеж проиндексированных страниц. Norwegian company, владелец FAST Search, также поддерживает поисковую машину Lycos MP3. FAST Search начала работу в мае 1999 года. <br /> <ol start=10> <li><b>GoTo </b>- <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />В отличие от других поисковых машин GoTo продает свои списки. Компании могут заплатить для того, чтобы иметь возможность быть размещенным в начале результатов поиска. Неоплаченные результаты выдает Inktomi. GoTo начала работу в 1997 году. <br /> <ol start=11> <li><b>Google</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Google - поисковая машина, которая использует популярность ссылок как основной критерий ранжирования веб-сайтов. Именно поэтому особенно хорошо в ней представлены ресурсы по темам "автомобили" и "путешествия". <br /> <ol start=12> <li><b>Inktomi </b>- <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u>/ <br /> </ol> <br />Первоначально была поисковой машиной Inktomi в UC Berkeley. Затем учредители сформировали собственную компанию под тем же именем. Сейчас механизм Inktomi используют разные компании. <br /> <br /><b>Каталоги</b> <br /> <ol> <li><b>Yahoo!</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Существующий с конца 1994 года, Yahoo! - самый популярный и старейший из основных каталогов Интернета. Секрет популярности Yahoo! - люди. Это один из крупнейших путеводителей по веб, созданных вручную около 150 авторами в попытке упорядочить сеть. Yahoo! использует результаты поисковой машины Inktomi. При вводе запроса Yahoo! производит поиск по своему каталогу. Если результаты здесь неудовлетворительны, запрос автоматически перенаправляется к Inktomi. Содержит более миллиона веб-страниц. На голову выше конкурентов по качеству результатов поиска - каждый сайт каталога прошел фильтрацию работниками системы. <br /> <ol start=2> <li><b>Lycos </b>- <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Существующая с конца 1994 года, поисковая система Lycos являлась старейшей среди основных поисковых систем. Однако она затерялась в потоке заявок, когда попыталась стать сайтом для широких масс. Поэтому в апреле 1999 года она преобразовалась в каталог, действующий подобно Yahoo!. Основной источник ресурсов - Open Directory project, также Lycos пользуется услугами Direct Hit или собственным глобальным поиском. В октябре 1998 года Lycos был приобретен конкурирующей поисковой машиной HotBot. <br /> <ol start=3> <li><b>LookSmart</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Это каталог веб-сайтов, созданный вручную. Являясь самостоятельным каталогом, Look Smart предоставляет ресурсы для MSN Search, Excite и многих других своих партнеров. AltaVista выдает для LookSmart дополнительные результаты поиска. LookSmart начал независимое существование в октябре 1996 года, затем на год был куплен Reader's Digest. LookSmart становится одним из основных конкурентов Yahoo! в категории сайтов. Cодержит около четверти миллиона сайтов, разделенных на категории. <br /> <ol start=4> <li><b>Snap</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Каталог веб-сайтов, созданный мастерами CNET. Поддерживается механизмом поиска Inktomi. Как и LookSmart, пытается конкурировать с Yahoo! в упорядочивании Web. Snap был запущен в конце 1997 и поддерживается CNET и NBC. Содержит обзоры по сайтам, ссылки на партнеров, на другие сайты CNET. <br /> <ol start=5> <li><b> Open Directory</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Известный ранее как NewHoo, каталог начал работу в июне 1998. В ноябре 1998 года был куплен Netscape, при этом компания заявила, что каждый сможет пользоваться информацией каталога по открытому соглашению. Целью проекта Open Directory является создание каталога по Web с привлечением широкого круга добровольных авторов. Это связано с тем, что автоматизированные поисковые машины и каталоги не справляются с растущим количеством ресурсов. Каждый пользователь может сделать свой вклад в упорядочивание ресурсов Сети. Содержит 1739097 сайтов, 262356 категорий, 24598 авторов. Lycos и AOL Search активно используют данные Open Directory, в то время как AltaVista и HotBot включают ресурсы Open Directory в свои результаты поиска. <br /> <ol start=6> <li><b>iWon</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Поддерживаемый американской телевизионной сетью CBS, iWon содержит каталог веб-сайтов, генерируемый автоматически Inktomi. iWon раздает ежедневные, еженедельные и ежемесячные призы по маркетинговому моделированию. Начал работать осенью 1999 года. <br /> <ol start=7> <li><b> MSN Search</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />MSN Search компании Microsoft - каталог веб-сайтов, опирающийся на LookSmart и AltaVista. Также доступны данные RealNames и Direct Hit. Пользователям Internet Explorer 5 MSN Search также предлагает уникальную возможность сохранять результаты предыдущих поисков. <br /> <ol start=8> <li><b> Netscape Search -</b> <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Результаты в Netscape Search's базируются на Open Directory собственной базе данных Netscape ("Smart Browsing"), в которой хорошо представлены официальные веб-сйты. Также использует Google. На портале Netscape Netcenter представлены другие поисковые машины. <br /> <br />Как уже отмечалось выше, некоторые поисковые системы имеют при себе еще и каталог: <br /> <ul> <li>Excite NetDirectory - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> <li>Go (InfoSeek) - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> <li>WebCrawler - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ul> <br />Ниже в таблице представлены статистические данные за апрель 2000 года по некоторым каталогам и поисковым машинам. Данные взяты с сайта <b>Search Engine Watch</b> (<u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u>). <br /> <br /><b> Основные поисковые системы и каталоги Рунета </b> <br /> <br /><b>Поисковые системы</b> <br /> <ol> <li><b>Rambler </b>- <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />На сегодняшний день, пожалуй, самая популярная российская поисковая система. Создана компанией Stack Ltd. Представляет собой базу данных по более чем 45 тысячам сайтов (имен DNS). Рамблер не учитывает мета-тэги. В результатах, наряду с заголовком и первыми строчками, поисковик выдает процент соответствия найденных документов запросу пользователя. <br /> <br />Поисковая система Rambler поддерживает рейтинг русских страниц Top 100 (более 35 тысяч участников). Списки страниц разбиты на группы, и многие используют данный рейтинг как каталог, так что я советую Вам поучаствовать. К тому же, рекламодатели очень часто обращаются именно к этому рейтингу для выбора рекламных площадок. <br /> <ol start=2> <li><b>Яndex</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Является оригинальной разработкой фирмы CompTek. В своей базе содержит около 20 миллионов документов (май 2000 года). Выполняет поиск по российской части Интернета с учетом морфологии русского языка. Имеет очень мощный язык запросов, описание которого можно изучить по адресу: <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u>. <br /> <br />Результаты поиска упорядочиваются по степени значимости (учитывается число встретившихся в документе терминов, их положение и число слов между ними) и содержат хорошую аннотацию. Очень удобным инструментом является боковая табличка, в которой выдается Топ10 сайтов, на которых находятся странички с лучшей релевантностью запросу. Кроме этого, Яндекс быстрее всех индексирует новые ресурсы. Как показывает практика, робот приходит на сайт через 15 минут после добавления ресурса в базу данных. <br /> <ol start=3> <li><b>Апорт!</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Поисковая система "Апорт!" разработана компанией "Агама" при поддержке Intel. Понимает все кириллические кодировки и выполняет поиск с учетом морфологического анализа. Имеет гибкий язык запросов и возможность перевода запроса с русского на английский язык и наоборот. <br /> <br />Результаты поиска упорядочиваются по частоте употребления искомых терминов. Вместе со ссылкой отображается фрагмент текста, где встречается термин, указывается индекс соответствия запросу и дата последней модификации файла. "Апорт!" очень удобен тем, что в выдаваемом фрагменте текста выделяет красным цветом запрошенные слова. <br /> <ol start=4> <li><b> TELA - ПОИСК </b>- <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Поисковая система TELA, созданная компанией DUX, позволяет производить поиск по ключевым словам русскоязычных страничек во Всемирной Паутине, а также англоязычных страничек на российских серверах. Поиск производится с учетом морфологии русского языка. <br /> <br />Результаты поиска упорядочиваются по частоте употребления искомых терминов. Вместе со ссылкой отображается начальный фрагмент текста найденного документа, а также дата и время последней модификации файла. Есть возможность предварительного ("чернового") просмотра странички из базы TELA (это бывает полезно при недоступности странички или медленной связи). Но, к сожалению, уровень системы не позволяет ей конкурировать с тройкой лидеров. <br /> <br /><b> Каталоги Рунета</b> <br /> <ol> <li><b>"@Rus"</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Каталог находится в стратегическом союзе с поисковой системой "Апорт!" и рейтингом Ranker. Реализована система голосования. Представлена информация из российских узлов, а также зарубежные материалы, имеющие отношение к нашей стране. На 01.04.2000 содержал более 40 тысяч зарегистрированных сайтов. <br /> <ol start=2> <li><b>List.Ru</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Каталог List.Ru - проект компании "РК-Аудит". Интересным аспектом является наличие гидов - реальных людей, поддерживающих определенные разделы каталога. На данный момент это самый обширный каталог (в мае 2000 года содержал более 89 тысяч зарегистрированных сайтов). <br /> <ol start=3> <li><b> Russia on the Net</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Один из самых старых каталогов Рунета (был открыт в сентябре 1995 года). Является службой известного московского провайдера - компании Demos. Регистрация ресурсов производится на двух языках (русский и английский). <br /> <ol start=4> <li><b>Интернет Столица</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Каталог появился сравнительно недавно. Приятно удивил меня продуманной рубрикацией, а также функциональным и приятным дизайном. На 19.01.2000 года содержал 11 451 сайтов. Есть статистика по запросам различных рубрик каталога. <br /> <ol start=5> <li><b>Up.ru</b> (<u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u>) <br /> </ol> <br />Каталог студии Delux. Работает совместно с рейтингом one.ru, что, правда, не влияет на сортировку выдачи результатов поиска. На май 2000 зафиксировано 16 115 ссылок. <br /> <ol start=6> <li><b>Улитка</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Каталог российских интернет-ресурсов "Улитка". Пока, к сожалению, все выглядит не очень профессионально, но проект продолжает работать и развиваться. Ссылки выстраиваются по рейтингу, который составляется на основе переходов из каталога на эти ресурсы. В марте 2000 года каталог содержал порядка 17 500 ссылок. Проект принадлежит дизайн-студии "Арт-Конструктор". <br /> <ol start=7> <li><b> The List of Russian Web Servers </b>- <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Один из старейших каталогов, один из проектов компании MARK-ITT из Ижевска. Имеется русская и английская версия каталога. <br /> <ol start=8> <li><b> Справочник предприятий СНГ</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Интерактивный справочник, содержащий данные о предприятиях и организациях СНГ, доступных через Интернет. Возможен поиск по названию, производимой и потребляемой продукции, услугам, ключевому слову, телефону, e-mail и URL, а также по классификатору видов деятельности. <br /> <ol start=9> <li><b> Иван Сусанин</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Каталог создан питерской дизайн студией WebPlus в 1998 году. Функциональный дизайн с интуитивно-понятной навигацией и без излишеств. К маю 2000 года каталог содержал до 9000 ресурсов. Одно из достоинств - возможность поиска по словоформам <br /> <ol start=10> <li><b> SEARCH CENTRE</b> - <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> <br /> </ol> <br />Разработка студии Design Centre. Данный каталог начал свою работу 2 ноября 1998 года. В мае 2000 года в базе насчитывалось более 7600 веб-сайтов. Одним из неудачных решений, как мне кажется, является учет регистра слов в описаниях ресурсов при выдаче результатов поиска. <br /><br /><br /><b> Глоссарий терминов по поисковым системам и каталогам</b> <br /> <br /><b>Boolean search:</b> Поиск с использованием операндов булевой алгебры, таких, например, как AND, NOT и OR. Использование операндов существенно увеличивает эффективность поиска. Если мы введем в поисковую систему запрос: <br /> <br /><i>(мокрый OR склизкий) AND водяной AND (NOT сантехник), </i> <br /> <br />то получим страницы отвечающие следующим критериям: <br /> <ul> <li>содержат слово(а) "водяной"; <br /> <li>содержат либо "мокрый", либо "склизкий"; <br /> <li>не содержат слова "сантехник". <br /> </ul> <br />Детально язык и синтаксис запросов изложен в Нelp каждой поисковой системы. <br /> <br /><b>Bridge Page (redirect page, enter page, редирект-страницы):</b> Страницы, созданные специально для получения высокого рейтинга в поисковых системах. Веб-мастер разрабатывает целый набор подобных страниц, каждая из которых оптимизирована под определенную поисковую систему и определенные ключевые слова. Такие страницы являются промежуточными и перенаправляют посетителя уже непосредственно на веб-сайт. Некоторые поисковые системы считают подобные действия спамом и игнорируют редирект страницы. <br /> <br /><b> Classification (классификация):</b> Процесс определения того, к какой категории принадлежит тот или иной документ, веб-сайт и т.д. <br /> <br />C<b>ase sensitivity (чувствительность к регистру):</b> Некоторые поисковые системы чувствительны к запросам с учетом регистра, другие - нет. Например, чувствительная к регистру поисковая система <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> при запросе "лебедь" выдаст все страницы, содержащие слово "лебедь", где буквы могут быть в любом регистре, то есть надет страницы и про птицу, и про небезызвестного генерала. Но при запросе "Лебедь" - только страницы, содержащие это слово с заглавной первой буквой, скорее всего это будет именно фамилия или предложения, где это слово стоит первым. <br /> <br /><b> Concept search (концептуальный поиск): </b>Поиск документов, имеющих прямое отношение к указанному поисковому слову, а не просто содержащих его. <br /> <br /><b>Document (документ):</b> Информационный объект, который желает найти и получить пользователь. Это может быть текстовый файл, Html-файл, картинка и т.д. <br /> <br /><b> Index (индекс):</b> Индекс поисковой системы представляет собой гигантский информационный массив, где хранятся преобразованные особым образом текстовые составляющие всех посещенных и проиндексированных роботом Html-страниц и текстовых файлов. Робот не только пополняет массив новыми поступлениями, но и регулярно обновляет уже имеющиеся в индексах документы. <br /> <br /><b> Full-text search engine (полнотекстовая поисковая система):</b> Полнотекстовые поисковые системы индексируют все слова на веб-странице (иногда за исключением стоп-слов) и учитывают порядок их расположения. В отличие от них, абстрактные поисковые системы по определенному алгоритму создают некий экстракт проиндексированной страницы. <br /> <br /><b> Keyword search (поиск по ключевым словам):</b> Поиск документов, которые содержат указанные пользователем ключевые слова. <br /> <br /><b>Phrase search (поиск по словосочетаниям):</b> Поиск документов, которые содержат в точности указанное пользователем словосочетание, предложение, отрывок текста. <br /> <br /><b> Proximity search (поиск с расстоянием):</b> Поиск, при котором пользователь указывает, на каком расстоянии между собой должны располагаться ключевые слова в документе. Например, для поисковой системы <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> при запросе. <br /> <br /><i>"мокрый /3 сантехник" </i> <br /> <br />Вы требуете найти документы, в которых содержится и слово "мокрый", и слово "сантехник", и расстояние между ними должно быть не более трех слов. <br /> <br /><b> Query (запрос):</b> Набор слов и служебных символов, характеризующий информацию, которую хочет найти пользователь. <br /> <br /><b>Query-By-Example (find similar, найти подобные):</b> Данной полезной функцией обладает лишь часть поисковых систем. При просмотре результатов первоначального поиска Вы выбираете документ или группу документов, наиболее близких к тому, что Вы ищете и даете системе команду "найти подобные документы". <br /> <br /><b> Query Expansion (расширенный запрос):</b> Процесс построения нового запроса на базе предыдущего. Например, <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> позволяет разрядить многотысячный список с результатами поиска путем удаления оттуда документов по определенным критериям. <br /> <br /><b> Relevancy (релевантность документа):</b> Мера того, насколько полно тот или иной документ отвечает критериям, указанным в запросе пользователя. Разумеется, далеко не всегда документ, признанный поисковой системой наиболее релевантым, будет таким по мнению самого пользователя. <br /> <br /><b> Search by Field (поиск в определенных полях):</b> Некоторые системы позволяют производить поиск не только по всему Html-документу, но и выборочно, по определенным полям. Например, можно искать по заглавию документа (title). B этом случае учитываются только ключевые слова, встречающиеся именно в заглавии. <br /> <br />Существует поиск по полю ALT тега IMG. Таким поиском пользуются, когда хотят найти в Интернете изображение на определенную тему. <br /> <br />Есть поиск по текстам в гиперссылках, адресах, заголовках разделов. Например, в системе <u><a rel="nofollow" href=" " onclick="return false">ссылка скрыта</a></u> по запросу <br /> <br /><i>"$TITLE: реклама and $URL: ресурсы" </i> <br /> <br />система найдет все страницы, содержащие слово "реклама" в заголовке, и, помимо этого, хотя бы одну имеющуюся на странице ссылку, содержащую слово "ресурсы". <br /> <br /><b> Search Engine (поисковая система): </b>Содержит в себе три компонента: <br /> <ul> <li>робот, который обходит веб-сайты и заносит страницы в индексы системы; <br /> <li>индекс системы, где хранятся преобразованные особым образом текстовые составляющие всех посещенных и проиндексированных роботом Html-страниц и текстовых файлов; <br /> <li>и, наконец, система поиска - программа, которая обрабатывает запрос пользователя, находит в индексе документы, отвечающие критериям запроса, и выводит список найденных документов в порядке убывания релевантности. <br /> </ul> <br /><b> Spider (Crawler, Bot, Robot, робот поисковой системы):</b> Неотъемлемая составляющая поисковой системы - программа, которая посещает веб-страницы, считывает (индексирует) полностью или частично их содержимое и далее следует по ссылкам, найденным на данной странице. Робот возвращается через определенные периоды времени (например, каждый месяц) и индексирует страницу снова. Вся информация заносится роботом в индексы поисковой системы. <br /> <br /><b> Stemming (морфологический поиск):</b> Возможность системы искать слово в документах не только в строго заданном виде, но и во всех его морфологических формах. Например, не только "идти", но и "идет", "шел" и т.д. <br /> <br /><b> Stop words (стоп-слова):</b> Для экономии места и увеличения производительности некоторые поисковые системы не включают в индексы слова, встречающиеся на веб-страницах очень большое количество раз. Например, "www", артикли "а", "the" и т.д. <br /> <br /><b> Thesaurus (тезаурус):</b> Список синонимов для ключевого слова, которые может использовать система при поиске. <br /> <br /><b>Weighting (весовой коэффицент): </b>Увеличивать релевантность документа может не только количество содержащихся в нем ключевых слов, но и их расположение в документе. Больший "вес" имеют слова в заголовке страницы (заголовок - это то, что указанно между парным тегом <title></title>); слова, выделенные тегами </frameset>