Разработка системы моделирования поисковой оптимизации веб-сайта

Курсовой проект - Компьютеры, программирование

Другие курсовые по предмету Компьютеры, программирование

чиванием новых сайтов или их обновлений, в базу поисковой машины. Паук не различает и не читает графику, флеш и скрипты, которые использую web-мастера при создании сайтов. Поисковый робот видит только код страниц, соответственно наполняя страницы баннерами и анимацией, Вы тем самым ухудшаете ее индексацию.

Путешествующий паук (краулер) - название говорит само за себя, путешествуя по сети, выполняет функцию ищейки. Отслеживает появление новых сайтов и страниц и сообщает пауку-спайдеру о появлении нового документа, который необходимо занести в базу поисковой системы. Играет одну из важных ролей в работе поисковой машины. Для того, чтобы краулер нашел Ваш сайт, необходимо сообщить ему о нем. Сообщить можно, либо путем регистрации в поисковике, либо установкой ссылки ведущей на Ваш сайт на проиндексированном ресурсе - подойдет каталог сайтов.

Индексатор - специальная программа, играющая также немалую роль в работе поисковой машины. Путем анализа страниц, определяет релевантность и тематическое соответствие содержания страницы, некоторым поисковым запросам. Алгоритмы работы индексатора в каждой поисковой машине отличаются друг от друга, но цель у них одна.

Архив или база поисковой машины - здесь размещаются все страницы сайтов, которые были проиндексированы и найдены пауками. Работа поисковой машины сводится к выявлению из этой общей базы данных, наиболее релевантного запросу сайта.

Сервер поисковой машины - тут надо понимать, что поисковая машина работает одновременно с несколькими тысячами запросами и сайтами, ежедневно перелопачивая невиданные объемы информации. Соответственно поисковики располагаются на мощнейшем сервере, который позволяет за доли секунды выполнять запросы нескольких тысяч пользователей одновременно. Такие сервера обеспечивают стабильную работу поисковой машины.

Алгоритм работы поисковой машины заключается в следующем.

Вы задаете слово или фразу в поисковую форму на сайте поисковика, не важно, на каком из них Ramblere, Yandexe или др., тем самым, давая команду поисковой машине на обработку запроса.

Поисковик в свою очередь сравнивает совпадение запроса с ключевыми словами, которые заключены в мета-теги страниц, а также совпадение названия страниц с заданным запросом.

Поисковая машина, сделав выборку наиболее релевантных сайтов, выдает их список пользователю. Выполняет ранжирование сайтов или другими словами распределение позиций, согласно соответствию и ценности информационного содержимого страниц, заданному пользователем запросу.

Скорость работы поисковой машины, зависит от количества обрабатываемой информации. Чем больше она будет загружена, тем дольше Вам придется ждать индексации сайта. Период между нахождением сайта поисковой машиной и занесением его в свою базу данных, составляет от двух дней до нескольких месяцев.

После того как сайта будет обнаружен и поисковая машина выполнит индексацию страниц Вашего сайта, он появится в базе каталога, и будет занимать позиции при выдаче пользователю согласно своей релевантности запросу.

Для того, чтобы работа поисковой машины соответствовала тому ради чего она была сделана, ей приходится постоянно претерпевать изменения алгоритмов. Разработчики постоянно вносят обновления для изменения тех или иных параметров работы поисковика, что в свою очередь создает дополнительные трудности вweb-мастерам. Когда меняется алгоритм работы поисковой системы, неизвестно на какие позиции улетит Ваш сайта, на верхние или же опустится ниже. Поэтому web-мастерам при изменении алгоритма работы поисковика, приходится менять содержимое и структуру сайта, тем самым, подстраиваясь под эти обновления.

2. Процессы изменения состояния популярности сайта

 

.1 Графы состояний рейтинга сайта, виды состояний, вероятности состояний

 

Для описания процессов изменения состояния популярности сайта мы будем пользоваться теорией случайных процессов, а точнее Марковскими процессами с дискретными состояниями.

Строго говоря, в природе не существует совершенно не случайных, в точности детерминированных процессов, но есть процессы, на ход которых случайные факторы влияют так слабо, что при изучении явления ими можно пренебречь. Существуют и такие процессы, где случайность играет основную роль. Между этими двумя крайними случаями лежит целый спектр процессов, в которых случайность играет большую или меньшую роль. Учитывать (или не учитывать) случайность процесса зависит также и от того, какую практическую задачу мы решаем.

Случайный процесс, протекающий в любой физической системе S, представляет собой случайные переходы системы из состояния в состояние. Состояние системы может быть охарактеризовано с помощью каких-то численных переменных; в простейшем случае - одной, а в более сложных - нескольких.

Рассмотрим физическую систему S, в которой протекает случайный процесс с дискретными состояниями:

, s2, … si, …,(2.1.1)

 

число которых конечно (или счетно). Состояния si, s2,... могут быть качественными (т. е. описываться словами) или же каждое из них характеризуется случайной величиной (либо случайным вектором).

Прежде всего, рассмотрим множество состояний (2.1.1) с точки зрения его структуры - возможности системы S переходить из состояния si в данное состояние sj непосредственно или через другие состояния. Для этого удобно пользоваться наглядной схемой, так называемым графом состояний.

Имеется две основные разновидности графов: не?/p>