Особенности вероятностного анализа и мониторинга информационных ресурсов сети интернет а. В. Бухановский, А. Б. Дегтярев Институт высокопроизводительных вычислений и баз данных, Санкт-Петербург Тел.: (812) 251-90-92
Вид материала | Документы |
- А. С. Писарев Институт высокопроизводительных вычислений и баз данных, Санкт-Петербург, 26.92kb.
- Ооо "линтес патент" Россия, Санкт-Петербург, 9011.83kb.
- Перечень автоматизированных информационных систем (аис) и информационных ресурсов (баз, 547.88kb.
- О рганизационный комитет россия, 197110, Санкт-Петербург Петрозаводская ул., 12, лит., 78.14kb.
- «ромб консалтинг», 43.04kb.
- Санкт-Петербург, Маршала Блюхера Просп., 12 +7 (812) 5454100 тел, 30.32kb.
- Тел. (812) 327-3408, (812) 272-4638, Санкт-Петербург, 191028, Литейный, 176.51kb.
- Программа 29. 12. 11: Спб-хельсинки-рованиеми, 93.33kb.
- Тел./ф. (812) 234-93-48, т. (812) 327-91-88, 236.33kb.
- 191186 Санкт-Петербург, ул. Б. Конюшенная, д. 27 тел.+7(812) 336-63-08, 571-55-55,, 67.44kb.
ОСОБЕННОСТИ ВЕРОЯТНОСТНОГО АНАЛИЗА И МОНИТОРИНГА ИНФОРМАЦИОННЫХ РЕСУРСОВ СЕТИ ИНТЕРНЕТ
А.В.Бухановский, А.Б.Дегтярев
Институт высокопроизводительных вычислений и баз данных, Санкт-Петербург
Тел.: (812) 251-90-92, факс: (812) 251-83-14, e-mail: deg@fn.csa.ru
Постоянный рост числа пользователей сети Интернет, быстрое развитие распределенных сетевых программных комплексов и специального программного обеспечения (поисковых приложений) привело к необходимости разработки методики мониторинга информационных ресурсов в реальном масштабе времени. Основными задачами мониторинга являются:
- Определение текущих эксплуатационных характеристик элементов сети, и сопоставление их с проектными.
- Выявление аномальных ситуаций в сети: перегрузки канала, несанкционированный доступ, распространение информационного «мусора».
- Оптимизация состава и расположения информационных материалов на WWW–серверах.
Целью настоящего доклада является построение методики мониторинга на основе наиболее простой характеристики – числа обращений на конкретный сервер. В качестве исходных данных рассмотрен массив почасового количества обращений на WWW–сервер Института высокопроизводительных вычислений и баз данных с IV.1998 по V.2000 г.
Первичный анализ исходного массива позволил описать его моделью нестационарного полициклического полимодулированного случайного процесса, подверженного суточной, недельной, сезонной и межгодовой изменчивости.
В межгодовом диапазоне изменчивости увеличение количества обращений вследствие роста общего числа пользователей Интернет описывается моделью линейного тренда. Для аппроксимации сезонного хода используется его разложение в ряд Фурье по годовой и полугодовой гармоникам; при этом их амплитуды сопоставимы, что отражает сходное снижение нагрузок в сети в сезон летних отпусков (июль–август) и рождественских каникул (декабрь–январь).
Анализ высокочастотных флуктуаций числа обращений (с периодом менее месяца), в стационарном приближении продемонстрировал наличие ярких недельной и суточной цикличностей. Для описания процесса в этих диапазонах использована модель периодически коррелированной случайной функции (ПКСФ). Анализ недельных циклов показал, что в среднем количество обращений в выходные дни снижается более, чем в два раза, однако коэффициент их вариации существенно выше единицы, т.е. в отдельные недели на субботу и воскресенье приходится не меньшая нагрузка сети, чем в будни. Суточный цикл имеет более устойчивую асимметричную форму и характеризуется пиком числа обращений с 11 до 19 часов (абсолютный максимум – 14–15 часов GMT+03:00), что подтверждает гипотезу о том, что основные внешние пользователи расположены на территории Европы.
Проведенный вероятностный анализ позволяет построить многомасштабную стохастическую модель на основе вложенных процессов авторегрессии и ПКСФ–регрессии, которая используется для воспроизведения различных сценариев функционирования сети. Сопоставление типовых сценариев с результатами новых измерений позволяет судить об их экстремальности, т.е. производить мониторинг интенсивности и длительности аномальных нагрузок. Дополнительная информация об адресате, сохраняемая в базе данных статистики количества обращений, позволяет установить источник аномальной нагрузки и принять меры к обеспечению безопасности сервера.
Разработанный алгоритм мониторинга на базе стохастической модели использует усвоение результатов новых измерений с помощью фильтра Калмана–Бьюси, что, в отличие от статических моделей, применяемых при проектировании, позволяет ему адаптироваться к непрерывному увеличению числа и категорий пользователей сети, и расширению ее инфраструктуры.
Работа поддержана грантом РФФИ, № 00-07-90227.