Особенности вероятностного анализа и мониторинга информационных ресурсов сети интернет а. В. Бухановский, А. Б. Дегтярев Институт высокопроизводительных вычислений и баз данных, Санкт-Петербург Тел.: (812) 251-90-92

Вид материалаДокументы
Подобный материал:

ОСОБЕННОСТИ ВЕРОЯТНОСТНОГО АНАЛИЗА И МОНИТОРИНГА ИНФОРМАЦИОННЫХ РЕСУРСОВ СЕТИ ИНТЕРНЕТ

А.В.Бухановский, А.Б.Дегтярев

Институт высокопроизводительных вычислений и баз данных, Санкт-Петербург

Тел.: (812) 251-90-92, факс: (812) 251-83-14, e-mail: deg@fn.csa.ru


Постоянный рост числа пользователей сети Интернет, быстрое развитие распределенных сетевых программных комплексов и специального программного обеспечения (поисковых приложений) привело к необходимости разработки методики мониторинга информационных ресурсов в реальном масштабе времени. Основными задачами мониторинга являются:
  • Определение текущих эксплуатационных характеристик элементов сети, и сопоставление их с проектными.
  • Выявление аномальных ситуаций в сети: перегрузки канала, несанкционированный доступ, распространение информационного «мусора».
  • Оптимизация состава и расположения информационных материалов на WWW–серверах.

Целью настоящего доклада является построение методики мониторинга на основе наиболее простой характеристики – числа обращений на конкретный сервер. В качестве исходных данных рассмотрен массив почасового количества обращений на WWW–сервер Института высокопроизводительных вычислений и баз данных с IV.1998 по V.2000 г.

Первичный анализ исходного массива позволил описать его моделью нестационарного полициклического полимодулированного случайного процесса, подверженного суточной, недельной, сезонной и межгодовой изменчивости.

В межгодовом диапазоне изменчивости увеличение количества обращений вследствие роста общего числа пользователей Интернет описывается моделью линейного тренда. Для аппроксимации сезонного хода используется его разложение в ряд Фурье по годовой и полугодовой гармоникам; при этом их амплитуды сопоставимы, что отражает сходное снижение нагрузок в сети в сезон летних отпусков (июль–август) и рождественских каникул (декабрь–январь).

Анализ высокочастотных флуктуаций числа обращений (с периодом менее месяца), в стационарном приближении продемонстрировал наличие ярких недельной и суточной цикличностей. Для описания процесса в этих диапазонах использована модель периодически коррелированной случайной функции (ПКСФ). Анализ недельных циклов показал, что в среднем количество обращений в выходные дни снижается более, чем в два раза, однако коэффициент их вариации существенно выше единицы, т.е. в отдельные недели на субботу и воскресенье приходится не меньшая нагрузка сети, чем в будни. Суточный цикл имеет более устойчивую асимметричную форму и характеризуется пиком числа обращений с 11 до 19 часов (абсолютный максимум – 14–15 часов GMT+03:00), что подтверждает гипотезу о том, что основные внешние пользователи расположены на территории Европы.

Проведенный вероятностный анализ позволяет построить многомасштабную стохастическую модель на основе вложенных процессов авторегрессии и ПКСФ–регрессии, которая используется для воспроизведения различных сценариев функционирования сети. Сопоставление типовых сценариев с результатами новых измерений позволяет судить об их экстремальности, т.е. производить мониторинг интенсивности и длительности аномальных нагрузок. Дополнительная информация об адресате, сохраняемая в базе данных статистики количества обращений, позволяет установить источник аномальной нагрузки и принять меры к обеспечению безопасности сервера.

Разработанный алгоритм мониторинга на базе стохастической модели использует усвоение результатов новых измерений с помощью фильтра Калмана–Бьюси, что, в отличие от статических моделей, применяемых при проектировании, позволяет ему адаптироваться к непрерывному увеличению числа и категорий пользователей сети, и расширению ее инфраструктуры.

Работа поддержана грантом РФФИ, № 00-07-90227.