Научно-исследовательская работа студентов: Материалы юбилейной 60-й научной студенческой конференции. Петрозаводск: Изд-во ПетрГУ, 2008. 325 с. Isbn 978-5-8021-0880-2

Вид материалаНаучно-исследовательская работа

Содержание


Графический редактор семантической сети
Расширение системы мониторинга
Имитационное моделирование
Оптимальное управление
Анализ событий в сети на основе
Разработка системы получения
Подобный материал:
1   ...   17   18   19   20   21   22   23   24   ...   68

Для построения нормального профиля анализируются обращения пользователей к документам ЭБ за период, когда предполагалось только нормальное, то есть безопасное с точки зрения системы поведение (этот период называется периодом обучения). Математической основой для построения профиля работы пользователя является марковская цепь (МЦ).


Поведение пользователя представлено как последовательность идентификаторов запрошенных им документов. Источник информации о поведении пользователей — лог-файлы ЭБ. Для каждого пользователя строится МЦ, состояниями которой являются уникальные идентификаторы документов ЭБ, а под переходом из состояния i в состояние j подразумевается обращение к документу j сразу после обращения к документу i. Для того чтобы построить общий для всех пользователей профиль нормального поведения, полученные МЦ сливаются в одну. Суть работы системы обнаружения вторжений заключается в том, что, анализируя текущее поведение пользователя, она может классифицировать это поведение как нормальное или как аномальное.

В процессе эксплуатации система обнаружения вторжений, основанная на аномальном подходе, может совершать следующие ошибки при классификации поведения пользователей: классификация нормального поведения пользователя как аномального (ложная тревога), классификация аномального поведения пользователя как нормального (пропуск атаки).

Для того чтобы уменьшить количество ошибок, необходимо настроить параметры модели. Оптимальные значения параметров определяются в работе на основе результатов проведения вычислительных экспериментов.

^ ГРАФИЧЕСКИЙ РЕДАКТОР СЕМАНТИЧЕСКОЙ СЕТИ
УЧЕБНОГО КУРСА

Михайлов А.
Научный руководитель — канд. физ.-мат. наук, доц. Сиговцев Г. С.

Дистанционный образовательный процесс является одним из перспективных методов обучения. Доступ к дистанционным курсам и другим учебным ресурсам, как правило, происходит через сеть Интернет. Наиболее эффективным способом представления учебной информации, передаваемой по компьютерным сетям, в настоящее время является гипермедиа. Гипермедиа представляет собой сочетание нелинейной гипертекстовой структуры для организации информации в виде набора узлов и связей (ссылок) между ними и мультимедийных форм представления информации в узлах сети. Удобной и наглядной моделью описания предметных областей различного рода учебных ресурсов является семантическая сеть. С формальной точки зрения семантическая сеть является ориентированным графом, вершины которого соответствуют концептам предметной области, а дуги отражают логические, родовидовые, причинно-следственные и другие отношения между концептами. В частности, семантическая сеть позволяет адекватно отразить структуру гипермедиа информации.

Целью данной работы является разработка программного средства, обеспечивающего построение, редактирование и отображение семантической сети в стиле визуального программирования. Создаваемые семантические сети должны легко интегрироваться с различными учебными Интернет-ресурсами. Разработанная система представляет собой клиент-серверное приложение. Выполняемые на сервере скрипты системы обеспечивают регистрацию и авторизацию пользователей, хранение семантической сети и формирование html-страниц. Сеть хранится в формате XML, что обеспечивает структурированное хранение информации, легкость передачи по протоколу HTTP и возможность взаимодействия с другими программными средствами. Пользователь для работы с учебным ресурсом использует браузер, и поэтому в качестве клиентского приложения используется Java-апплет, который выполняется
в браузере и не требует установки.

При построении и редактировании сети апплет предоставляет пользователю графические примитивы для изображения двух типов узлов и двух типов связей. Каждый узел сети имеет название, описание, ссылку. Узел может содержать вложенную сеть, за счет чего достигается возможность построения иерархических семантических сетей. С применением апплета обеспечивается удобная навигация, просмотр и редактирование сети. Построенная семантическая сеть может быть использована как графическое оглавление к существующему учебному курсу или как модель для проектирования содержания разрабатываемого вновь учебного ресурса.

^ РАСШИРЕНИЕ СИСТЕМЫ МОНИТОРИНГА
ПОВЕДЕНИЯ TCP ПРОТОКОЛА
НА УРОВНЕ ЯДРА ОС LINUX

Ковалев В.
Научный руководитель — ст. преп. Пономарев В. А.

Система мониторинга поведения транспортного протокола GetTCP, представленная ранее, не была предназначена для поставки внешним пользователям, поэтому было принято решение модифицировать ее архитектуру так, чтобы обеспечить произвольное задание набора перехватываемых данных, упростить управление системой и разработать простое руководство пользователя.

Результатом работы в данном направлении явилась разработка формата конфигурационного файла GetTCP и транслятора, осуществляющего разбор данного конфигурационного файла.

Для описания конфигурации используется C-подобный язык, который позволяет гибко и лаконично задавать набор перехватываемых данных. При использовании такого подхода пользователю системы (администраторы ЛВС) достаточно лишь минимальных знаний синтаксиса языка С и структуры TCP протокола.

Кроме описания данных, в конфигурационном файле также можно управлять некоторыми внутренними характеристиками системы (например, размерами и количеством подбуферов).

В задачи транслятора входит:

1. Лексический и синтаксический разбор конфигурационного файла.

2. Построение дерева получаемых переменных в соответствии
с конфигурационным файлом.

3. «Упаковка» дерева (объединение битовых полей и смежных переменных для минимизации операций копирования).

4. Построение «упрощенного» представления дерева для передачи
в ядро ОС.

5. Запись дерева переменных в бинарный файл для последующей интерпретации полученных данных.

Таким образом, в результате работы был разработан формат конфигурационного файла системы GetTCP, а также реализован транслятор данного конфигурационного файла. Полученные результаты позволяют существенно упростить взаимодействие системы GetTCP с пользователем за счет введения динамического управления набором перехватываемых данных и характеристиками системы.

^ ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ
ПАРАЛЛЕЛЬНЫХ ОЧЕРЕДЕЙ

Ивашов К.
Научный руководитель — канд. физ.-мат. наук Аксенова Е. А.

Пусть есть некоторая область памяти размера m единиц. В этой памяти требуется разместить 3 FIFO очереди, причем память может распределяться неравномерно. Размер памяти выделенной первой очереди обозначим s, 2-й — z, 3-й — остается m-s-z единиц памяти. В каждый момент времени с каждой очередью может произойти 3 события: извлечение элемента, добавление элемента, очередь не меняет своего размера. Извлечение и добавление элементов происходит параллельно.

Для очередей задано 27 вероятностных характеристик. При извлечении элемента из пустой очереди ничего не происходит, при переполнении одной или сразу нескольких очередей процесс останавливается. Задача: для заданных вероятностей и памяти m нужно найти такие s и z, чтобы время работы очередей до переполнения было максимальным. Процесс работы очередей можно представить как блуждание точки в трехмерном пространстве O × 1 × 2 × 3. Координаты точки соответствуют текущей заполненности очереди. Например, при добавлении элемента в первую очередь координата x1 увеличивается на единицу. Поскольку очереди параллельны, точка может двигаться по диагонали. Область блуждания ограничена плоскостями x1 = s + 1, x2 = z + 1, x3 = m – s – z + 1, попадание на которые означает переполнение, и плоскостями x1 = –1, x2 = –1, x3 = –1, попадание точки на которые возвращает ее на оси координат. Для вычисления оптимального распределения памяти между очередями использован следующий метод: для всех возможных распределений процесс блуждания точки моделируется 5 000 раз. То распределение, при котором среднее количество шагов до переполнения одной из очередей максимально, является оптимальным.

Для вычисления оптимального распределения памяти написана программа на языке Java. Для заданных вероятностных характеристик и размера памяти программа рассчитывает оптимальное разбиение памяти. Также есть возможность изображать процесс блуждания точки на трехмерном графике.

^ ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ
ДИНАМИЧЕСКИМИ СТРУКТУРАМИ ДАННЫХ

Драц А.
Научный руководитель — доктор физ.-мат. наук,
проф. Соколов А. В.

Разработка многих программ на определенном этапе развития науки информатики уже не является творческим актом, а становится результатом применения некой технологии, которая может строить программы из готовых блоков, реализующих оптимальные алгоритмы обработки некоторых базовых структур данных. Работы Д. Кнута дали толчок ряду новых направлений исследований, получивших название математический анализ алгоритмов. Эти направления подразумевают построение новых математических моделей, которые описывают работу некоторых конкретных алгоритмов, позволяют изучать свойства этих алгоритмов и в идеале получать оптимальные алгоритмы. В данной работе исследуются одни из наиболее важных в программном и аппаратном обеспечении ЭВМ структуры данных — стеки и очереди.

Часто возникает проблема размещения нескольких стеков или очередей в памяти одного уровня. Существует 2 принципиально разных способа организации работы с ними: последовательный и связный.

При последовательном представлении быстрая память делится на части между всеми стеками или очередями, при этом часть памяти может остаться неиспользованной в том случае, если одна из структур данных переполнится.

При связанном представлении стек или очередь хранится в виде списка, при этом часть памяти тратится на указатели, но переполнение возникает только в том случае, когда вся быстрая память заполнена.

Была поставлена задача найти среднее время работы со стеками или очередями при последовательном и связанном представлении при известных вероятностных характеристиках.

Для решения поставленной задачи использованы однородные поглощающие цепи Маркова. Были предложены алгоритмы нумерации состояний процессов и функции для вычисления номера состояния по текущим длинам структур данных. На языке C++ были реализованы программы, которые составляют матрицу вероятностных переходов цепи Маркова и вычисляют среднее время работы со структурами данных до переполнения.

^ АНАЛИЗ СОБЫТИЙ В СЕТИ НА ОСНОВЕ
ПРОТОКОЛА DHCP

Димитров В.
Научный руководитель — канд. тех. наук, доц. Богоявленский Ю. А.

При работе компьютерной сети происходят различного рода события. В качестве примера таких событий можно привести следующие: «компьютер подключился к сети», «пользователь вошел в систему», «компьютер А передал компьютеру B данные размером 10Кб». Фиксация подобных событий необходима для решения задач сетевого управления. Алгоритмы обнаружения событий базируются на сетевых протоколах. В нашей работе мы рассматриваем протокол DHCP, который позволяет сетевой ЭВМ динамически получать различные параметры (например, IP адрес), необходимые для корректного сетевого взаимодействия. Настройки DHCP-сервера хранятся в файле dhcpd.conf, а регистрационная информация в dhcpd.leases. Регистрационная информация представлена в текстовом формате и может включать в себя следующие данные: IP адрес компьютера, MAC адрес компьютера, время начала регистрации, время завершения регистрации, сведения о состоянии регистрации. На основе этой информации в сети можно зафиксировать следующие события:

1. Подключение компьютера к сети.

2. Корректное завершение работы компьютера в сети.

3. Некорректное завершение работы компьютера в сети.

4. Попытка появления в сети неизвестной или запрещенной машины.

5. Нехватка диапазона IP-адресов, раздаваемых DHCP-сервером.

6. Появление в сети машин с одинаковыми IP-адресами.

Например, алгоритм фиксирования события «Некорректное завершение работы компьютера в сети» имеет следующий вид:

1. Выделяем следующую запись с заданным MAC-адресом. Время ends записи должно лежать в заданном промежутке времени.

2. Если за время, меньшее default-lease-time, для MAC-адреса в наборе leases записей существуют две записи выделения адреса, то фиксируем некорректное завершение работы в сети.

3. Если за время default-lease-time для MAC-адреса в наборе leases записей нет записи обновления адреса, то фиксируем некорректное завершение работы в сети.

4. Если через default-lease-time находится запись на освобождение адреса, то фиксируем некорректное завершение работы в сети.

5. Переходим на шаг 1.

^ РАЗРАБОТКА СИСТЕМЫ ПОЛУЧЕНИЯ
ОБЩИХ ХАРАКТЕРИСТИК ТРАФИКА УЗЛА INTERNET
ПО ДАННЫМ NETFLOW С ПОМОЩЬЮ ПАКЕТА
FLOW-TOOLS

Артемьев Д.
Научный руководитель — канд. тех. наук, доц. Богоявленский Ю. А.

Трафик — это основной и единственный ресурс сети Интернет
с точки зрения транспорта, это суммарный объем пакетов, прошедших через точку наблюдения.

Анализ трафика позволяет:

• оценить фактическую загрузку сети и необходимую емкость ее каналов;

• выяснить устойчивость работы сети и оперативность реакции на различные нештатные ситуации;

• судить о динамике развития сети и планировать сроки ее модернизации;

• регулировать различные информационные потоки на коммуникационных узлах связи;

• сформулировать рекомендации об оптимальных режимах выполнения различных коммуникационных задач;

• косвенно судить о разветвленности сети и числе ее пользователей.

NetFlow — приложение Cisco IOS, которое предоставляет статистику о пакетах, проходящих через маршрутизатор. Оно позиционирует как первичная технология безопастности и сетевого учета. Cisco IOS NetFlow предоставляет администратору окружение с набором инструментов для инспекции: кто, когда, где и как использует сетевой трафик.

Flow-tools — это библиотека и набор программ, используемых для сбора, отправки, обработки и генерации отчетов из данных NetFlow. Библиотека Flow-tools предоставляет программный интерфейс для разработки различных приложений для NetFlow.

Flow-nfilter — программа, входящая в пакет flow-tools и позволяющая фильтровать данные по таким критериям, как ip адрес/подсеть источника/получателя, порты, номера AS, номер интерфейса. Утилита flow-stat позволяет формировать большое количество отчетов практически «на лету». Плюсы этой программы состоят в уже готовых типах отчетов, использование которых указывается при вызове утилиты. Flow-report программа, требующая для своей работы отдельный файл с описанием шаблона по принципу flow-nfilter. Гибкость программы flow-report позволяет генерировать любые отчеты по данным NetFlow.

В качестве задачи, для решения которой использовались flow-tools, было определение адресов внешних и локальных компьютеров университетской сети и вычисление адресов с наибольшим трафиком. Принадлежность адресов категориям определялась по таблице маршрутизации, полученой по snmp.

Отчеты получали по данным netflow за неделю. Отчеты составлялись вручную и посредством «готовых» решений, в качестве которых выступали flow-report и flow-stat.

В результате все используемые методы дали идентичные результаты, свидетельствующие о прохождении больших объемов трафика через отдельные адреса.

Данные, полученные таким образом, позволяют судить о загруженности как отдельных участков сети, так и о всей сети в целом, что дает возможность прогнозировать дальнейшее использование и модернизацию соответствующих элементов сети.