Исследование трафика от источников информации в корпоративной сети с целью выявления характеристик нагрузки на транспортную подсистему

Вид материалаИсследование

Содержание


Структурная теория алгебраических систем
Трехмерная визуализация
Информационно-аналитические системы
Подобный материал:



Серия издания

«Научные школы

МГТУ им. Н.Э. Баумана —

национального исследовательского университета

техники и технологий»



Научная школа

«Теоретическая информатика»


МГТУ им. Н.Э. Баумана

2011

Кафедра ИУ-9 – «Теоретическая информатика и компьютерные технологии» – одна из самых «молодых» кафедр в МГТУ им. Н.Э. Баумана, как по дате создания, так и по среднему возрасту сотрудников. Несмотря на молодость, сотрудники кафедры активно участвуют в научных исследованиях, и ими накоплен солидный багаж научных достижений.

Изначально основным профилем научной работы кафедры были высокопроизводительные вычисления и тесно связанные с ними сетевые и телекоммуникационные технологии. Работы в области высокопроизводительных вычислений проводились на кластерных вычислительных системах. В рамках этих работ был детально исследован находившийся в распоряжении кафедры 12-узловой кластер, сотрудники кафедры научились добиваться на нем хорошей степени распараллеливания задач, требующих большой вычислительной мощности.

Исследованиями в области сетевых и телекоммуникационных технологий руководит бессменный заведующий кафедрой ИУ-9 доктор технических наук И.П. Иванов. Основными областями его научных интересов являются:

– исследование трафика от источников информации в корпоративной сети с целью выявления характеристик нагрузки на транспортную подсистему;

– исследование доступности ресурсов в источниках информации, используемых в общедоступных сервисах корпоративных сетей;

– разработка ресурсных математических моделей оконечных и транзитных узлов транспортной подсистемы корпоративной сети;

– исследование процессов взаимной блокировки информационных потоков в транзитных узлах при различных дисциплинах обслуживания очередей в интерфейсах;

– исследование предельных допустимых информационных нагрузок в оконечных и транзитных узлах транспортной подсистемы на ее различных иерархических уровнях;

– мониторинг распределения информационных потоков и их характеристик в топографической схеме сети с выявлением и устранением «узких» мест;

– классификация и анализ информационных атак в ресурсах корпоративной сети, разработка надлежащих алгоритмов защиты информации;

– совершенствование методов управления транспортной подсистемой корпоративной сети с целью повышения ее производительности.

В процессе развития кафедры круг научных интересов преподавателей «девятки» существенно расширился, в него дополнительно вошли как чисто математические проблемы, так и вопросы разработки системного и прикладного программного обеспечения, напрямую не связанного ни с высокопроизводительными технологиями, ни с сетями и телекоммуникациями. В данной работе мы попытаемся кратко обрисовать спектр научных исследований и прикладных разработок, проводимых в настоящее время сотрудниками кафедры.


^ Структурная теория алгебраических систем

Направление теоретических исследований кафедры, связанное с чистой математикой, а именно, со структурной теорией алгебраических систем, возглавляет доцент А.Ю. Голубков. Основные научные интересы А.Ю. Голубкова сосредоточены в рамках тематики теории радикалов алгебраических структур и включают в себя в первую очередь структурную теорию линейных групп над ассоциативными кольцами, теорию радикалов алгебр Ли, ассоциативных алгебр, йордановых и других алгебр близких к ассоциативным.

Структурная теория алгебраических систем, включающая в себя и теорию их радикалов, зародилась в работах К. Вейерштрасса и Ю. Дедекинда в последней четверти XIX-го столетия. Первыми шагами к появлению самого понятия радикала стали близкие им по времени работы Ф.Э. Молина и Э. Картана, первого из которых можно считать одним из основателей отечественной алгебраической школы и фактически первым в мире исследователем, применившим на практике подлинную радикальную конструкцию. Накопленный к середине ХХ-го века качественный и терминологический аппарат структурной теории алгебраических систем (на тот период в основном ассоциативных), а также богатый опыт использования для их описания различного рода радикальных отображений, потребовал введения строгого формального определения самого понятия радикала, которое было реализовано в рамках аксиоматики радикала Куроша-Амицура. К этому же времени сформировалась и концепция прикладной теории радикалов как базового раздела структурной теории алгебраических систем, ставящего своей целью описание алгебраической системы через описание структуры её радикальной и полупростой составляющей применительно к выбранному радикальному отображению. Стоит отметить, что формы и методы подобного описания могут быть весьма разнообразны. Так, например, в случае алгебр описание полупростых алгебр осуществляется, как правило, в терминах различного рода разложений (прямых сумм, подпрямых произведений) их полупростых фактор-алгебр, которые имеют или более элементарную по сравнению с исходными структуру множества своих двусторонних идеалов, или могут быть эффективно описаны с точки зрения гомологической теории колец, а описание радикальных алгебр реализуется в основном на языке свойств, составляющих их элементов (сразу оговоримся, что в большинстве реальных ситуаций удаётся получить качественное описание такого рода только для одного из классов алгебр: либо для полупростых, либо для радикальных). Одновременно с появлением самого понятия радикала в смысле Куроша-Амицура были пересмотрены с более общих позиций уже хорошо известные и широко применявшиеся с сороковых годов ХХ-го века технические приемы построения и исследования радикальных конструкций (тех же нижнего ниль-радикала Бэра, радикалов Перлиса-Джекобсона, Левицкого и Кёте), что в свою очередь привело к возникновению абстрактной теории радикалов в качестве самостоятельного раздела алгебры со своим собственным языком и своими собственными специфическими задачами. В своём современном состоянии теория радикалов алгебраических систем разделяется, пусть и весьма условно, на два указанных здесь раздела: абстрактную теорию радикалов и их прикладную теорию, ориентированную преимущественно на конкретные особенности исследуемой алгебраической структуры.

Одним из основных направлений научной деятельности А.Ю. Голубкова является исследование взаимосвязи между радикалами ассоциативных алгебр и радикалами определённых над ними линейных групп.

К середине XIX-го века классические линейные группы преобразований конечномерных векторных пространств уже довольно прочно вошли в базовый инструментарий конечномерной линейной алгебры и связанных с ней разделов теории представлений. Вместе с тем, в последних десятилетиях того же столетия в работах К. Жордана, Л. Диксона и Э. Мура наметилась весьма чёткая и полностью оправданная с точки зрения постоянно возникающих приложений тенденция перехода к всё более широким классам колец коэффициентов. В частности, если работы упомянутых авторов были посвящены получению структурного описания классических линейных над конечными полями, то уже в 40-ых годах XX столетия вместе с появлением работ Ж. Дьедонне и Э. Артина были начаты серьёзные и планомерные исследования линейных групп над телами, а в последующие два десятилетия в работах Дж. Бреннера, Х. Басса, Й. Менике, Ж.-П. Серра, М. Лазара, В. Клингберга и ряда других авторов было получено большое количество структурных результатов для линейных групп над нульмерными кольцами и некоторыми одномерными кольцами арифметического происхождения, включающими в себя в том числе и области Хассе.

В середине 60-ых годов ХХ века вышла в свет пионерская работа Х. Басса по алгебраической K-теории, где ставшее в дальнейшем стандартным описание строения нормальной подгруппы в терминах элементарной и полной конгруэнц-подгрупп уровня идеала основного кольца было получено для нормальных подгрупп полной линейной группы размерности не ниже 3 над ассоциативным кольцом соответствующего стабильного ранга и нормальных подгрупп стабильной (предельной) линейной группы над произвольным ассоциативным кольцом. В последствии тематика работы Х. Басса, но уже применительно к другим классическим группам, была продолжена целой линией замечательных работ Э. Бака, К. Денниса, В. Ван дер Каллена, М. Стейна, Л. Васерштейна, А.В. Михалёва, А.А. Суслина и многих других авторов. Следующий мощный импульс теория классических групп над кольцами поучила уже в середине 70-ых годов ХХ-го века вместе доказанными в это время теоремами Суслина и Уилсона-Голубчика, в которых стандартное описание нормальных подгрупп было получено для полной линейной группы размерности не ниже 3 над любым коммутативным кольцом. Тем самым был сделан первый и весьма важный шаг к переходу от колец коэффициентов с конечным стабильным рангом к кольцам коэффициентов с полиномиальными тождествами, структурная теория которых к тому моменту была уже достаточно глубоко развита. Вслед за публикацией упомянутых результатов А.А. Суслина, Дж. Уилсона и И.З. Голубчика в работах А.А. Суслина с его учениками В.И. Копейко и М.С. Туленбаевым, И.З. Голубчика и А.В. Михалёва, З.И. Боревича и Н.А.Вавилова, Е.И.Зельманова и других появились многочисленные варианты этих результатов, полученные как для коммутативных колец, так и для иных значительно более широких классов ассоциативных колец. Естественным их продолжением стали и полученные позднее структурные теоремы для групп Шевалле над коммутативными кольцами.

Аффинные групповые схемы, которые принято также называть по именам их первых исследователей К. Шевалле и М. Демазюра аффинными схемами Шевалле-Демазюра, вошли в арсенал теории линейных алгебраических групп в начале 60-ых годов ХХ века. За два последующих десятилетия после своего появления схемы Шевалле-Демазюра стали предметом пристального изучения целой плеяды выдающихся математиков, среди которых в первую очередь следует отметить Ж.. Титса, Ф. Брюа, Х. Фрейденталя, Р. Стейнберга и А. Бореля. Схема Шевалле-Демазюра представляет собой функтор из категории коммутативных колец с единицей в категорию групп, сопоставляющий произвольному коммутативному кольцу с единицей группу гомоморфизмов в это кольцо алгебры Хопфа некоторой полупростой связной линейной алгебраической группы, построенной довольно простым и естественным способом на основе представления полупростой конечномерной алгебры Ли над полем комплексных чисел и заданной с помощью системы целочисленных уравнений. Указанную здесь группу гомоморфизмов традиционно называют группой Шевалле над рассматриваемым коммутативным кольцом. Конструкция группы Шевалле оказалась весьма удачной не только с точки зрения самой теории линейных алгебраических групп, но и нашла самое широкое применение в теории конечных групп и теории линейных групп над кольцами. Достаточно сказать, что любая полупростая связная линейная алгебраическая группа над алгебраически замкнутыми полем нулевой характеристики может быть реализована как группа Шевалле над этим полем, а все известные классические линейные группы над любым коммутативным кольцом с единицей совпадают с подходящими группами Шевалле над данным кольцом. Невозможно недооценить и ту роль, которую в классификации простых конечных групп играют серии простых групп Шевалле, определённых над конечными полями. Начиная с 70-ых годов ХХ века и по настоящее время продолжаются исследования различных подходов доказательства вариантов теорем Суслина и Уилсона-Голубчика для групп Шевалле над коммутативными кольцами для систем корней неединичного ранга, полученных первоначально в работах Дж. Таддеи, Е. Абе и Л.Н. Васерштейна. Среди группы авторов, посвятившим данной тематике большие циклы печатных работ следует особо отметить Л.Н. Васерштейна, Н.А. Вавилова, Е.Б. Плоткина и А.В. Степанова, обогативших теорию групп Шевалле значительным числом новых и весьма перспективных технических приёмов.

Параллельно с изучением групп Шевалле над коммутативными кольцами, проводятся исследования и в области их обобщений на некоммутативную ситуацию, среди которых центральное место занимают работы И.З. Голубчика по группам лиевского типа над ассоциативными алгебрами с полиномиальными тождествами, определёнными над полями нулевой характеристики. Применительно к таким группам стандартные формулировки структурных теорем преобразуются, естестественно, в несколько иную форму, но, тем не менее, этот новый описательный язык прекрасно согласуется с устоявшейся терминологией.

Говоря о структурной теории линейный групп над кольцами невозможно обойти стороной пример В.Н. Герасимова, опубликованный в 1987 г. Этот результат положил конец надеждам на выполнение стандартных структурных теорем в полной линейной группе над произвольным ассоциативным кольцом, не связанным каким-либо дополнительными ограничениями. В то же время, стандартное описание может сохраняться у тех нормальных подгрупп линейной группы над кольцом, определение которых предполагает выполнимость для коэффициентов составляющих их матриц некоторых нетривиальных соотношений. Наиболее важными примерами подобных нормальных подгрупп являются различные радикалы линейной группы.

В отличие от общей теории групп, для которой описания в терминах радикалов Куроша-Амицура являются в целом излишне укрупнёнными и потому не часто используемыми, история развития структурной теории линейных групп содержит достаточное количество результатов, связанных с радикальной проблематикой. Одним из ключевых вопросов подобного рода является вопрос о характеризации выбранного радикала линейной группы над ассоциативным кольцом в терминах подходящего радикала кольца коэффициентов (в большинстве случае речь идёт о его описании как полной конгруэнц-подгруппы уровня радикала кольца коэффициентов). Естественным основанием для получения удовлетворительного ответа на данный вопрос может служить хорошо известная конструктивная общность многих радикальных конструкций теории групп и теории ассоциативных колец. Более того, многие из радикалов теории групп были изначально сконструированы как прямые аналоги соответствующих радикалов ассоциативных колец. В частности, построенный ещё в начале 50-ых годов прошлого века Б.И. Плоткиным локально нильпотентный радикал групп (радикал Плоткина-Хирша) и появившиеся вслед за ним в работах Ф.Холла различные обобщения этой конструкции представляют собой теоретико-групповые варианты хорошо известных радикала Левицкого и локально конечного радикала ассоциативных алгебр. В духе подобной аналогии по инициативе А.Г. Куроша его учеником К.К. Щукиным был определён и первичный (RI^*-разрешимый) радикал групп. Правда, здесь следует сразу оговориться, что трансформации понятий такого рода изначально не были застрахованы от проблем аксиоматического порядка, поскольку для их реализации выбирается не наиболее общее описание соответствующего радикала в терминах полупростых и радикальных относительного него классов, а лишь какая-то конкретная его характеризация, специфичная для наиболее изученного класса ассоциативных алгебр. Тем не менее, как показали дальнейшие исследования, эти выпадающие из теории радикалов Куроша-Амицура объекты являются основным строительным материалом для получения качественных описаний радикалов, правильных с точки зрения данной теории. Так, к примеру, если бы теория групп не располагала бы радикалами Бэра и Грюнберга, которые, конечно же, не являются радикалами в смысле Куроша-Амицура, то, наверное, в её рамках было бы невозможно получить и следующие из теоремы Бэра-Кемхадзе описания нижнего ниль-радикала (радикала RN )и радикала RN^*.

Истоками исследований радикалов линейных групп можно считать классические теоремы Х. Цассенхауза о локально нильпотентных и локальных разрешимых линейных группах над полями, опубликованных в 30-ых годах ХХ-века, а также появившихся в начале следующего десятилетия апроксимационные теоремы А.И. Мальцева, на которых базируется как полученное В.П.Платоновым описание локально нильпотентного радикала линейных групп, так и установленное позднее в работах Б.И. Плоткина, С.А. Пихтилькова и А.Ю. Голубкова совпадение в PI-представимых группах первичного радикала, нижнего ниль-радикала, радикала RN^* , локально разрешимого и слабо разрешимого радикалов. Целенаправленное изучение радикалов классических линейных групп над ассоциативными кольцами началось в 70-ых годах ХХ-века с появлением теоремы Голубчика-Михалёва, в которой было установлено совпадение первичного радикала полной линейной группы над ассоциативным кольцом с её центром по первичному радикалу кольца коэффициентов. Впоследствии А.Ю. Голубков, продолжая линию исследований своего учителя А.В. Михалёва, получил унитарные варианты теоремы Голубчика-Михалёва над ассоциативными кольцами с инволюцией, а также перенёс этот результат на все группы Шевалле над коммутативными кольцами и их бесконечномерные аналоги, соответствующие нескрученным аффинным алгебрам Каца-Муди. В наиболее общей своей форме описание первичного радикала было получено А.Ю. Голубковым для подгрупп полной линейной группы над ассоциативными алгебрами над полями нулевой характеристики, нормализуемыми элементарными группами Шевалле. Помимо описания первичного радикала А.Ю. Голубковым были найдены описания нижнего ниль-радикала (радикала RN) и слабо разрешимого радикала подгрупп полной линейной группы и унитарной группы над ассоциативным кольцом и ассоциативным кольцом с инволюцией, нормализуемых их элементарными подгруппами, подгрупп полной линейной группы над ассоциативной алгеброй над полем нулевой характеристики, нормализуемых элементарными группами Шевалле.

В настоящий момент область научных интересов деятельность А.Ю. Голубкова выходит далеко за рамки исследований радикалов линейных групп над ассоциативными кольцами и ориентирована в целом на поиск взаимосвязей и описательных аналогов радикалов и близких к ним объектов между различными алгебраическими системами. Основное их содержание составляют проводимое совместно с А.В. Михалёвым и С.А. Пихтильковым крупномасштабное исследование радикалов алгебр Ли и связанных с ними радикалов различных алгебр близких к ассоциативным. Радикалы алгебр Ли стали заложниками сложившегося исторически пути развития теории алгебр Ли, проходившего в значительной степени по влиянием теории бесконечных групп. Поэтому теория алгебр Ли, имеющая в своём распоряжении достаточный набор различных радикалов, привнесённых из теории групп и, как следствие, не подпадающих по большей части под определение радикала Куроша-Амицура, нуждается в качественном наборе аксиоматически правильных радикалов, без которых практически невозможно дальнейшее развитие её структурной теории. Вместе с тем, как и в теории групп существующие сегодня в алгебрах Ли радикальные конструкции, изучавшиеся в работах Б.И. Плоткина, Б. Хартли, Р. Амайо, Я. Стюарта, С. Того и их учёников, являются практически незаменимыми базовыми конструктивными элементами построения аксиоматических правильных радикалов. Последнее особенно хорошо видно на примере нижнего ниль-радикала алгебр Ли. Доказательство его идеальной наследственности над полем нулевой характеристики, полученное А.Ю. Голубковым, и родственных с этим утверждений было бы практически невозможно осуществить без того опыта использования близких к радикалам конструкций, который был накоплен исследователями второй половины прошлого века. Стоит сказать и то, что подобный процесс построения радикалов алгебр Ли в смысле Куроша-Амицура ценен не только с точки зрения самих алгебр Ли, для которых в терминах построенных таким образом радикалов естественным образом формулируются структурные теоремы сходные с известными результатами теории ассоциативных алгебр, но и заставляет в ряде случаев по новому взглянуть на описание уже хорошо изученных ассоциативных радикальных конструкций.

Не менее значимыми для теории алгебр Ли является и изучение их взаимосвязей с теорией йордановых пар и теорией йордановых алгебр. Наиболее сильные и глубокие результаты применения в теории алгебр Ли теории йордановых пар были получены 70-ых и 80-ых годах ХХ-го века Е.И. Зельмановым в цикле прекрасных работ, блестящим завершением которых стало полное решение ослабленной проблемы Бернсайда. На стыке с этим направлением исследуются и различные пути применения в теории алгебр Ли уже довольно развитой теории йордановых алгебр, выходящие за пределы классических сюжетных линий, связанных с конструкцией Титса-Кантора-Кёхера. Особо стоит отметить значимые продвижения на этом пути, полученные совсем недавно А. Лопесом, Э. Гарсия и М. Лозано, с которыми А.Ю.Голубков поддерживает тесные и плодотворные научные контакты.


^ Трехмерная визуализация

В последнее десятилетие все чаще ставятся задачи производственного и учебного характера, требующие внедрения статических и динамических (видео ) стереоизображений в практику визуализации и анализа объемных объектов.

В 2006 году лаборатория кафедры ИУ 9 была оснащена современным оборудованием для регистрации и наблюдения стереоизображений. Однако при этом возник комплекс проблем, связанных с мобильностью полученных решений.

В частности, задачи могут иметь самые различные постановки, и ориентированы на повышение качества статических и, в первую очередь, динамических изображений, а также увеличение точности расчетов и измерений по результатам стереосъемки как двумя камерами, так и одной камерой с мерным объектом. Кроме того, задача может предполагать, применение мобильного бытового оборудования для регистрации и наблюдения стереоизображения. Научным руководителем описанного комплекса работ является кандидат технических наук, доцент кафедры ИУ 9 А.Б. Домрачева

Очевидно, что для выполнения задания, связанного со стереомониторингом объекта (фото- и видеостереомониторинга) необходимо реализовать набор технологических решений: калибровки стереосистем на основе пары камер и единственной камеры с использованием мерного объекта, захват стереовидеопотока в прикладных программах (например, Skype, ooVoo и т.д.) и прочее.

Кроме того, решение должно быть ориентировано на применение для мониторинга объекта недорогой техники наблюдения. В частности, в качестве устройств ввода изображений хотелось использовать две бытовые веб-камеры, а для наблюдения – анаглифические очки.

В результате была разработана программная система, включающая четыре модуля:

1. Модуль калибровки стереосистемы с двумя веб-камерами (осуществляется захват параллельных видеопотоков с двух веб-камер, настройка стереосистемы с целью получения корректных данных, вывод результата с помощью пользовательского интерфейса);

2. Модуль калибровки стереосистемы с одной веб-камерой (осуществляется захват видеопотока с одной веб-камеры, реализуются алгоритмы, позволяющие получать реальные размеры наблюдаемых в сцене объектов при наличии мерного объекта);

3. Модуль захвата видеопотока и предоставления интерфейса прикладным программам, работающих с видеоподсистемой Windows;

4. Модуль обработки изображений для построения стереопар.

Основной принцип, который лег в основу разработанной системы, заключается в том, что все фильтры – стандартные и специализированные – с помощью настройки требуемых интерфейсов организуются в очередь, которая при необходимости может быть модифицирована добавлением новых блоков. Для прикладных программ системы нет различия между реальной камерой и виртуальной стереокамерой, так как в обоих случаях прикладные программы связываются с однотипными каналами передачи видео данных. Созданный фильтр позволяет выхватывать видео данные с каналов двух веб-камер, перемешать их и отправить в нужном виде на выходной канал.

Разработанная программная система является контейнером, позволяющим выполнить задание без дополнительных затрат на решение трудоемких технологических проблем, возникающих при программной реализации. Это особенно актуально при использовании в лабораторных практикумах, а также в дипломном и курсовом проектировании.


^ Информационно-аналитические системы

Одним из направлений научных исследований кафедры являются работы в области информационно-аналитических систем, в которых основным инструментом анализа является анализ связей. Под информационно-аналитическими системами понимают комплекс аппаратно-программных средств, информационных ресурсов и методик, которые используются для автоматизации работы аналитика в процессе обоснования принятия решений. За это направление отвечает старший преподаватель Вишняков И.Э.

Бурное развитие информационно-аналитических систем в большей степени связано с тем, что современные высокопроизводительные аппаратные средства позволяют накапливать и обрабатывать объемы необходимой и используемой для принятия решений информации, которые достигают сотен мегабайт, а в крупных корпоративных и государственных системах – десятков терабайт. При этом информация характеризуется многоплановостью, сложностью описываемых объектов предметной области, явлений и процессов, а также связей между объектами, соответственно, зачастую скрытыми являются и характерные для данной предметной области закономерности.

Задача построения информационно-аналитической системы включает в себя три основных аспекта. Во-первых, это извлечение необходимой информации, представленной в различных форматах, из множества гетерогенных источников, и её приведение к единому формату и единой структуре, пригодным для дальнейшей обработки. Во-вторых, это разработка и реализация алгоритмов выделения и анализа информации, полезной для принятия конкретных решений, при этом такие алгоритмы могут быть как универсальными, так и специализированными для рассматриваемой предметной области. Третьим аспектом является представление результатов анализа в таких формах, которые были бы наиболее эффективны с точки зрения восприятия результатов конечным пользователем. Собственно говоря, эффективность процесса анализа в целом определяется качеством проработки аппаратно-программных решений во всех трех перечисленных областях.

Задача накопления данных решается путем создания информационных хранилищ, которые содержат сведения о деятельности организации в течение длительного, часто максимально возможного, периода времени, а также большое количество нормативно-справочной информации, необходимой для обеспечения этой деятельности. Информационное хранилище может содержать как структурированные данные (как правило, в форме таблиц баз данных), так и неструктурированные данные, содержащиеся в текстовой и иной форме в документах различных форматов.

Таким образом, первый этап извлечения информации может заключаться в обработке неструктурированных данных с использованием отдельно или последовательно алгоритмов обработки и анализа изображений, распознавания текста, лингвистического анализа и обработки текста. Следующий этап заключается в так называемой нормализации данных, в процессе которой необходимая информация подвергается преобразованиям по определенным правилам с целью приведения данных из различных источников к единой структуре и формату. В качестве простейшего примера нормализации можно упомянуть приведение телефонных номеров к международному формату.

Основным представлением данных в информационно-аналитических системах, основанных на анализе связей, являются семантические графы. Они естественным образом отражают полученные в результате накопления и предварительной обработки элементы реляционной модели данных, описывающей предметную область: сущности отображаются вершинами графа, а связи – ребрами. Однако такое отображение не является непосредственным в силу того, что семантический граф является некоторым представлением сущностей реального мира, и для лучшего восприятия различные элементы такого графа могут объединять в себе сразу несколько отношений реляционной модели. Во-первых, как вершины, так и связи семантического графа обладают иерархией описывающих их атрибутов, во-вторых, каждый из атрибутов может содержать в себе сразу несколько значений. Соответственно, на этапе выделения значимой информации появляется задача оптимальной организации описывающих семантический граф структур данных, которые позволяют наиболее эффективно реализовать различные алгоритмы, а также использовать уже выделенную информацию в качестве промежуточных результатов для дальнейшего анализа.

Применение того или иного алгоритма, как универсального, так и специализированного, ориентировано на выявление различных, в том числе скрытых, пространственных и временных закономерностей для явлений и процессов рассматриваемой предметной области. Кроме того, реализация любого алгоритма должна быть масштабируемой, то есть обеспечивать возможность обработки значительных объемов данных. К универсальным относятся как алгоритмы на графах, применяемые к построенным семантическим графам, так и различного рода статистические алгоритмы, позволяющие обрабатывать входные данные, поступающие в табличном виде из реляционных источников.

Как уже упоминалось выше, элементы семантического графа являются отражением сущностей предметной области и обладают достаточно сложной структурой. С другой стороны, они формируются на основе получаемых из гетерогенных источников данных, которые могут быть искажены ошибками ввода, ошибками при распознавании текста и т.д. Соответственно, при построении и анализе семантического графа возникает задача поиска идентичных или в некотором смысле похожих объектов с целью минимизировать влияние некорректных или дублирующих друг друга данных на процесс принятия решений. Очевидно, что строгое сравнение значений атрибутов объектов в этом случае является неэффективным. Наилучших результатов позволяет достичь сравнение значений с учетом их семантики, однако даже использование нестрогого сравнения для различных типов данных (строк, дат, вещественных и целых чисел), значительно повышает качество результатов поиска похожих объектов.

В качестве примера специализированных алгоритмов можно привести анализ поведения при осуществлении транзакций, который может использоваться как в маркетинговых исследованиях, так и в правоохранительных целях для выявления фактов мошенничества. Такого рода анализ основан на построении шаблонов типичного поведения по уже накопленным данным для отдельных участников транзакций или их групп, после чего для вновь поступающих данных производится выявление значимых отклонений от построенных шаблонов. Собственно процедура построения и сопоставления шаблонов может использовать как статистические алгоритмы, так и сравнение структуры подграфов.

Для обеспечения наиболее полного и эффективного восприятия результатов анализа должны использоваться максимально разнообразные формы визуализации данных. Для рассматриваемых систем центральной формой представления результатов является визуализация семантического графа. Вспомогательными формами представления являются таблицы и диаграммы, а также геоинформационные модули для отображения результатов анализа на картах различного рода. Конечным результатом работы аналитика является обоснование решения в виде отчета, который помимо текста может содержать в себе все перечисленные выше формы представления результатов анализа.

Опыт внедрения информационно-аналитических систем показывает необходимость разделения функций администратора системы и пользователя-аналитика. Администратор системы должен иметь возможность настраивать и корректировать процедуры выделения значимой информации, обладая всей полнотой знаний о составе и структуре данных в информационных хранилищах, а также о доступных алгоритмах анализа. Работа аналитика ориентирована на получение результатов за минимально возможное число операций, что достигается тщательной проработкой пользовательского интерфейса, в том числе путем предоставления возможности объединять типичные последовательности операций в сценарии анализа.