На правах рукописи
ПРИХОДЬКО Максим Александрович
Теория и методы исследования информационной среды распределенных систем обработки данных
Специальность
05.13.01 - Системный анализ, управление и обработка информации (промышленность)
Автореферат
диссертации на соискание ученой степени
доктора технических наук
Москва 2011
Работа выполнена в ФГБОУ ВПО Московский государственный горный университет
Научный консультант | доктор технических наук, профессор Нина Ивановна Федунец |
Официальные оппоненты | доктор физико-математических наук, профессор Валерий Николаевич Решетников доктор физико-математических наук, профессор Александр Николаевич Сотников доктор технических наук, профессор Юрий Алексеевич Ивашкин |
Ведущая организация | Институт системного анализа РАН (г. Москва) |
Защита состоится 25 сентября 2012 г. в 1300 на заседании диссертационного совета Д-212.128.07 при Московском государственном горном университете по адресу: 119991, Москва, Ленинский проспект, д. 6.
С диссертацией можно ознакомиться в библиотеке Московского государственного горного университета.
Автореферат разослан 2012 г.
Учёный секретарь диссертационного
совета Д-212.128.07
доктор технических наук, профессор С.Н. Гончаренко
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность работы. Современное состояние общества характеризуется процессом информатизации, затрагивающим практически все сферы деятельности человека. Вслед за периодом локальной компьютеризации наступила эра создания корпоративных информационных систем, эра распределенных систем. Сложность этого этапа заключается в том, что автоматический перенос хорошо зарекомендовавших себя решений в области локальной информатизации на распределенные системы зачастую приводит к плачевным результатам. Требуется выработка новых решений, поиск новых подходов, создание новых технологий.
Надежность работы распределенных систем, скорость и качество обработки информации - темы, актуальные сегодня как никогда. Для доказательства достаточно обратиться к сети Интернет - одной из наиболее ярких распределенных систем современности:
Х темпы роста Интернет-трафика последние два года превышают 60% (74% в 2009 году и 62% в 2010 году);
Х объем информации в сети Интернет увеличивается с каждым годом в геометрической прогрессии;
Х увеличивается доля сложной для обработки медиа-информации: звуковой, графической, видео;
Х растут объемы паразитной информации, например, доля спама в почтовой информации сегодня - свыше 90%.
Пример сети Интернет показывает: темпы развития инструментов, а также средств накопления и передачи данных превышают существующие возможности по их обработке. Проблема усугубляется постоянным ростом доли сложной для обработки информации - графической, звуковой, видео. Многие задачи требуют уже не просто быстрой, а моментальной обработки - на лету. Распределенные системы насчитывают сотни тысяч и миллионы узлов. Вирусные эпидемии распространяются в течение нескольких часов и даже минут, а их масштабы достигают миллионов зараженных компьютеров. И все это происходит на фоне крайне слабой развитости инструментов описания эволюции во времени как самих распределенных систем, так и популяций функционирующих в их структуре программ.
До недавнего времени это не являлось проблемой. Несмотря на свою распределенность, распределенные системы представляли собой статичные по своей структуре комплексы, содержащие весьма ограниченное количество узлов. Например, одна из крупнейших распределенных систем Российской Федерации ГАС Выборы-М содержит около 4000 компьютеров. Но что это на фоне сети Интернет, к которой по разным оценкам подключено около 1.5 млрд. компьютеров?! - менее 3 десятитысячных (!) доли процента.
Сегодня мы находимся на пороге новой эры, когда распределенные системы будут содержать миллионы и миллиарды устройств. И спрогнозировать их поведение существующими методами не представляется возможным. Потребуется построить суперкомпьютерный аналог андронного коллайдера, чтобы заниматься в нем традиционным моделированием функционирования подобных распределенных систем обработки информации. Но и это еще не самая сложная задача.
Гораздо более серьезные вызовы готовит нам еще одно направление развития все той же сети Интернет - мобильный доступ. Будучи изначально распределенной системой существенно неоднородной структуры и достаточно непостоянного состава, с развитием технологий мобильного доступа в сеть Интернет она трансформируется в первую общедоступную и функционирующую распределенную систему с динамически изменяющейся структурой, причем изменяющейся совершенно непредсказуемо. Мобильные устройства, подключающиеся к сети Интернет, а также функционирующие в них программы, которые нередко называют мобильными агентами, формируют сегодня уникальную распределенную среду, не имеющую аналогов. Анализ современных отечественных и зарубежных работ показывает, что существующие подходы к изучению распределенных систем обработки информации не готовы ответить на вопрос, как она будет развиваться дальше.
Мы видим, что распределенные системы обработки информации глобальных масштабов с непредсказуемо и динамически изменяющейся структурой - не просто ближайшее будущее, а самое реальное настоящее. Вместе с тем существующие методы описания и исследования распределенных систем уже сейчас не в состоянии ответить на самые первые серьезные вопросы, например о протекании вирусной эпидемии. Впрочем, как и о поведении популяций любых других однотипных программ. Существующие эпидемиологические модели в лучшем случае достаточно точно отвечают на вопрос о том, сколько узлов распределенной системы обработки информации заражено вирусом. И совершенно не знают ответ на вопрос, какие именно. Налицо необходимость разработки модели, позволяющей определять пространственно-временное распределение различных однотипных программ по узлам распределенной системы обработки информации в заданный момент времени. Актуальность поставленной задачи для повышения надежности функционирования распределенных систем не вызывает сомнений.
В диссертационной работе предлагается новая теория описания распределенных систем обработки информации с позиций информационного потенциала на базе квантовой теории поля и мультиагентного подхода. Квантовая теория поля выбрана в качестве основной не случайно, а вследствие того, что элементарные кванты информации в распределенных системах обработки информации проявляют свойства, присущие кванто-механическим системам. На основе предложенной теории разработана модель мультиагентной системы, позволяющая определить пространственно-временное распределение интеллектуальных агентов по узлам распределенной системы обработки информации. Полученная модель используется для анализа пространственно-временного распределения фракций контрагентов в условиях конфликтного взаимодействия и построения на основе полученных результатов системы выработки управляющего воздействия, направленного на нормализацию функционирования распределенной системы обработки информации.
Цель диссертации заключается в повышении надежности работы распределенных мультиагентных систем обработки информации за счет нормализации функционирования путем формирования оптимальных управляющих воздействий на основе данных о пространственно-временном распределении контрагентов по узлам распределенной системы.
Для достижения указанной цели предполагается решить следующие основные задачи:
- Анализ передовых отечественных и зарубежных достижений в области мультиагентных систем и распределенных систем обработки информации;
- Исследование методов качественного и количественного описания распределенных систем обработки информации и обоснование необходимости применения информационно-потенциального подхода к изучению конфликтного взаимодействия интеллектуальных агентов в распределенных мультиагентных системах обработки информации с позиций квантовой теории поля;
- Выявление и формализация типовых конфликтных ситуаций с позиций информационно-потенциального подхода на базе методов квантовой теории поля и мультиагентных систем;
- Разработка концептуальной модели распределенной мультиагентной системы обработки разнородной информации в условиях возникновения множества негативных процессов (популяций контрагентов) в узлах распределенной системы с позиций информационно-потенциального подхода;
- Разработка модели выработки управляющих воздействий для нормализации функционирования распределенной системы обработки информации в условиях прогнозируемого распространения контрагентов;
- Разработка модели выработки управляющего воздействия для нормализации функционирования распределенной системы обработки разнородной информации в условиях непрогнозируемого изменения объемов и характера обрабатываемой информации;
- Разработка пакета прикладных программ нормализации функционирования распределенной системы обработки информации в условиях распространения различных фракций контрагентов.
Основная идея работы заключается в исследовании динамики популяций интеллектуальных агентов в условиях их конфликтного взаимодействия в распределенных мультиагентных системах обработки информации путем определения информационного потенциала информационной среды с позиций квантовой теории поля.
Методы исследования, используемые для решения поставленных задач, включают методы квантовой теории поля, методы теории специальных функций и дифференциальных уравнений, методы математического моделирования, методы теории вероятностей.
Научные положения работы, выносимые на защиту:
1. Обоснована теория описания распределенных мультиагентных систем обработки информации с позиций информационного потенциала как единой информационной среды на базе квантовой теории поля.
2. Создана теория, которая показала, что базовыми видами информационных потенциалов распределенных систем обработки информации с сетевыми структурами, соответствующими основным видам топологии сети, являются потенциалы с равномерной напряженностью или напряженностью, убывающей с удалением от области, занятой контрагентами. В частности, таким потенциалом является равномерный потенциал, а также кулоновский потенциал и потенциал центробежных сил.
3. Поставлена и решена задача определения пространственно-временного распределения контрагентов по узлам распределенной системы обработки информации для основных видов информационного потенциала.
4. Разработана математическая модель конфликтного взаимодействия интеллектуальных агентов в распределенных мультиагентных системах обработки информации, учитывающая новый вид макровзаимодействия интеллектуальных агентов - трансформацию.
5. Решены задачи конфликтного взаимодействия контрагентна и интеллектуального агента для трех основных сценариев роста численности контрагентов и интеллектуальных агентов, для которых разработаны модели, методы и базовые алгоритмы выработки управляющего воздействия для нормализации функционирования распределенной системы обработки информации.
7. Разработан пакет прикладных программ нормализации функционирования распределенной мультиагентной системы обработки информации в условиях распространения различных фракций контрагентов.
Новизна научных исследований заключается в следующем:
- предложена новая теория и методы описания распределенных мультиагентных систем с позиций информационного потенциала на базе квантовой теории поля, что впервые позволяет оценить среду как единое целое и получить количественные и качественные оценки пространственно-временного распределения негативных процессов (контрагентов) по узлам распределенной системы обработки информации;
- установлены взаимосвязи топологий сетевых структур распределенных систем обработки информаций и видов информационного потенциала;
- предложена математическая модель взаимодействия интеллектуальных агентов и контрагентов, впервые учитывающая новый вид макровзаимодействия - трансформацию интеллектуальных агентов в агенты иного рода, которая описывает численную эволюцию фракций интеллектуальных агентов и в отличие от существующих впервые позволяет описать их конфликтное взаимодействие;
- получены аналитические выражения числа контрагентов в условиях конфликтного взаимодействия для основных сценариев роста численности интеллектуальных агентов и контрагентов;
- получены аналитические оценки параметров управляющего воздействия в условиях конфликтного взаимодействия для основных сценариев роста численности интеллектуальных агентов и контрагентов;
- созданные модели и методы выработки управляющего воздействия впервые позволили определить не только количественные характеристики протекающих процессов, но и их качественные свойства, такие как вероятностное распределение протекающих процессов по узлам распределенной системы.
Обоснованность и достоверность научных положений, выводов и рекомендаций подтверждаются:
- анализом представительного объема научных работ отечественных и зарубежных авторов;
- использованием результатов анализа отечественного и зарубежного практического опыта в области распределенных систем обработки информации, мультиагентных систем, математического моделирования;
- корректным использованием методов квантовой теории поля, теории специальных функций и дифференциальных уравнений, математического и имитационного моделирования, теории вероятностей;
- положительными результатами использования основных положений диссертации в практике разработки стратегий обеспечения антивирусной защиты ФГУП НИИ Восход.
Научное значение заключается в разработке теории информационно-потенциального описания распределенной мультиагентной системы обработки информации, позволившей впервые определить пространственно-временное распределение фракций интеллектуальных агентов в условиях их конфликтного взаимодействия для выработки оптимального управляющего воздействия с целью нормализации функционирования распределенной системы обработки информации.
Практическое значение состоит в том, что использование разработанных теоретических и практических положений и рекомендаций обеспечит повышение надежности функционирования распределенных мультиагентных систем обработки информации и качества обработки информации.
Реализация выводов и рекомендаций. Предлагаемая теория была использована при разработке части общей стратегии обеспечения антивирусной защиты ФГУП НИИ Восход. Разработанные теоретические принципы исследования распределенных систем обработки информации использованы в учебном процессе при подготовке специалистов на кафедре Автоматизированные системы управления по направлению 230100 Информатика и вычислительная техника специальности 230102 Автоматизированные системы обработки информации и управления в Московском государственном горном университете. Методы и модели анализа протекания негативных процессов в распределенных системах обработки информации также используются в учебном процессе.
Основные результаты работы, связанные с разработкой моделей и методов описания протекания негативных процессов в распределенных системах обработки информации, были внедрены в рамках подготовки решений по обеспечению антивирусной защиты ФГУП НИИ Восход, а также разрабатываемых предприятием проектов.
Апробация работы. Основные положения и результаты работы докладывались на кафедре Автоматизированные системы управления Московского государственного горного университета, на международном научном симпозиуме Неделя горняка (Москва, 2009-20011 гг.), на II Международной студенческой конференции по проблемам компьютерной безопасности IT-Security Conference for the Next Generation (Москва, 2009 г., Диплом I степени в номинации Средства анализа и тестирования современных средств защиты, Сертификат о присвоении статуса Победителя конференции Лаборатории Касперского в номинации компании Softline), Всероссийской научно-технической конференции студентов, аспирантов и молодых ученых Научная сессия ТУСУР-2009 (Новосибирск, 2009 г.), Пятом международном научном конгрессе Роль бизнеса в трансформации российского общества (Москва. 2010 г.), научно-практической конференции Современные информационные технологии в управлении и образовании (Москва, 20011 г., Грамота за I место с работой Современные способы обнаружения негативных процессов в сетевых структурах и распределенных системах, Диплом лауреата премии имени д.т.н. В. С. Корсакова-Богаткова).
Публикации. По теме диссертации автором опубликовано 20 научных работ, в т.ч. 15 статей - в журналах по перечню ВАК Минобрнауки России.
Структура и объем работы. Диссертация состоит из введения, 6-ти глав, заключения, содержит 31 рисунок и список литературы из 250 наименований.
В ходе подготовки работы автор обсуждал промежуточные результаты и возможные перспективы исследований с рядом ведущих специалистов в области мультиагентных систем и математического моделирования. Подобные контакты способствовали формированию взглядов автора в выбранной области исследования, за что автор искренне благодарен научному консультанту - д.т.н., проф. Н. И. Федунец, явившейся идейным вдохновителем работы.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность темы диссертации, проведен анализ исследуемой научной проблемы и обоснован подход к ее решению, поставлены цель и задачи диссертационного исследования, определена научная новизна и практическая значимость результатов, сформулированы основные научные положения, выносимые на защиту.
В первой главе диссертационной работы проанализировано современное состояние и проблемы распределенных систем обработки информации, рассмотрены вопросы надежности функционирования распределенных систем, качества обработки информации. Показано, что в настоящее время темпы развития инструментов и средств накопления и передачи данных превышают существующие возможности по их обработке, а представление распределенной системы обработки информации как неделимого целого недостаточно для описания протекающих в ней процессов и решения новых задач.
Двумя основными качествами распределенных систем обработки данных будущего становятся глобальный масштаб (миллионы и миллиарды узлов), а также существенно неоднородный состав и динамически и непредсказуемо изменяемая структура. Существующие методы описания распределенных систем обладают двумя существенными недостатками: невозможностью с практической точки зрения исследовать глобальные системы, содержащие по крайней мере миллионы узлов, а также фактическим постулированием статичной структуры распределенной системы обработки информации. Необходима разработка новых моделей и методов, позволяющих описывать серьезно неоднородные, непредсказуемо изменяющиеся распределенные системы обработки информации, а также быстрые и масштабные информационные процессы, протекающие в них.
Предпосылки для создания такой модели формирует агентный подход. Направление хоть и молодое, но бурно развивающееся. Именно агентный подход и концепция мультиагентных систем обработки информации в целом дают два важнейших результата, которые могут быть положены в основу новой модели. Во-первых, агентный подход на естественном уровне позволяет описать неоднородность и динамичность структуры распределенной системы обработки информации. Во-вторых, концепция интеллектуального агента как нельзя лучше подходит к описанию однотипных программ, входящих в состав распределенной системы обработки информации или функционирующих в ее среде. Однако для того чтобы продвинуться до конкретных результатов, необходимо предварительно дать формальный ответ на ряд вопросов о природе самих мультиагентных систем и протекающих в них информационных процессов. В частности, сам агентный подход требует определенного расширения, т. к. в классическом агентном подходе разрешение конфликтов предполагается на основе переговоров, что не позволяет нам описать взаимодействие мультиагентной системы с чужеродными интеллектуальными агентами, не умеющими или не желающими участвовать в переговорах. Например, во время распространения вирусной эпидемии вирус может рассматриваться как некоторый интеллектуальный агент, однако было бы наивно считать, что он будет участвовать в каких-либо переговорах с другими интеллектуальными агентами распределенной мультиагентной системы обработки информации, в которой эта эпидемия распространяется. Более того, применительно к тем же самым вирусам доподлинно известно, что борьбу за необходимые им ресурсы компьютеров они ведут, в том числе между собой, не считаясь с интересами других сторон.
То же самое верно и для понятия линтеллектуальный агент, которое применительно к распределенным системам обработки информации следует трактовать шире, а именно как некоторый элементарный процесс обработки информации, который не обязательно должен быть программой. Это позволяет по-новому взглянуть на распределенные мультиагентные системы обработки информации, объединив в единую форму описания все многообразие процессов, протекающих в такой системе, например обработку информации оператором.
Мы видим, что модель пространственно-временного распределения различных однотипных программ по узлам распределенной системы обработки информации может быть сформулирована на основе агентного подхода. При этом ее важнейшим свойством должна быть возможность описать в рамках модели не только естественное, но и конфликтное взаимодействие интеллектуальных агентов не только друг с другом, но и с инородными интеллектуальными агентами, не участвующими в переговорах.
Здесь мы вплотную подходим к методу построения такой модели. Как было уже показано, существующие методы моделирования существенно ограничены в возможности их использования для решения поставленной задачи. Все это заставляет задуматься, достаточно ли описания информационных систем как набора программных и аппаратных средств или настало время искать новые подходы, новую парадигму распределенных систем обработки информации, новую теорию их описания.
Еще древнегреческие философы высказали предположение об атомарном строении материи. Однако ни тогда, ни сейчас никто не пытался предсказать поведение вещества, исходя из моделирования поведения каждого отдельного атома. В классической физике ученые изучали свойства материи, и только затем свойства элементарных частиц, из которых она состоит. В информационных системах предстоит пройти аналогичный путь, только в противоположном направлении, от линформационных атомов - программ и устройств до понятий более высоких уровней абстракции - линформационной материи, информационной среды. Толчком к такому переходу служит стремительное развитие информатизации общества и экспоненциальный рост сложности информационных систем. Уже сейчас смоделировать сеть Интернет, состоящую из миллиардов устройств, и спрогнозировать ее поведение в той или иной ситуации практически невозможно. Однако механика сплошной среды точно предсказывает поведение металлического стержня при скручивании, не пытаясь при этом описать поведение каждого отдельного атома. Время перехода от дискретного представления информационных систем как набора программно-аппаратных средств к описанию их как информационной среды настало.
Здесь необходимо отметить, что отдельные попытки создать теорию единого информационного поля, полностью и единственно правильным образом описывающего всю полноту событий реального мира, уже предпринимались. Однако эти попытки основывались в первую очередь на новых философских взглядах на мироустройство в целом и имели мало общего с изучаемым вопросом. В остальном наиболее близкие по духу исследования касаются информационных потоков, однако интерес исследователей преимущественно сконцентрирован на вопросах управления и перенаправления потоков информации, в то время как фундаментальные принципы их формирования остаются неизученными.
Глубокое изучение моделей поведения элементарных квантов информации в распределенных системах обработки информации показывает, что зачастую они проявляют свойства элементарных частиц, находящихся в зоне действия некоторого потенциального поля. Это потенциальное поле определяется воздействием распределенной системы обработки информации как информационной среды на помещенный в нее элементарный квант информации или интеллектуальный агент и представляет собой глобальное знание о природе распределенной системы. Возможность создать аналог классической теории поля для распределенных систем обработки информации существенно продвигает нас в решении сложнейших задач, позволяющих повысить надежность работы распределенных систем и качество обработки информации.
Основным результатом первой главы является доказательство обоснованности потенциального подхода с позиций квантовой теории поля к решению задачи о пространственном распределении интеллектуальных агентов по узлам распределенной системы обработки информации. Несмотря на то что вопросами поведения распределенных систем занимались многие ученые (отметим работы Н. А. Анисимова, О. Л. Бандман, И. Б. Вирбицкайте, В. В. Воеводина, В. А. Захарова, Р. Лойнеса, В. А. Малышева, Р. Л. Добрушина, А. А. Боровкова, П. Р. Кумара, В. Калашинкова, А. П. Афанасьева, коллективов под руководством Г. П. Башарина, Г. Г. Яновского, К. Е. Самуйлова, В. М. Вишневского, Б. С. Гольдштейна), проблеме информационного потенциала и теории поля посвящена только одна работа, написанная в начале 1970-х годов отечественным ученым А. А. Денисовым. Однако его понимание информационного поля основывается на совершенно иных философских взглядах - его собственной лидее внутреннего единства всех явлений природы. Информационное поле, по мнению А. А. Денисова, - это способ единообразного описания всего богатства окружающего нас мира с позиций информационного подхода, информационный потенциал, рассматриваемый нами, - характеристика распределенной системы обработки информации, определяющая ее свойства и способ воздействия на протекающие в ней информационные процессы. Других работ на тему информационного потенциала не найдено. Достоинством предложенного подхода является то, что он впервые позволяет описать пространственное распределение интеллектуальных агентов по узлам распределенной системы в виде волновой функции. Вместе с тем требуется дать формальное определение информационного потенциала и связанных с ним понятий. И ответу на этот вопрос посвящена вторая глава.
Во второй главе на основе предварительного анализа физических потенциалов с позиций распределенных систем обработки информации приводится формальное определение информационного потенциала. Компьютеры в частности и компьютерные системы в целом являются для нас примером предсказуемого поведения. В связи с этим сложно предположить, что некоторые процессы в распределенных системах обработки информации, кажущиеся на первый взгляд непредсказуемыми, протекают абсолютно случайно. Совершенно очевидно, что их протекание подчиняется определенным условиям, формируемым средой, в которой они находятся, и носит не просто случайный, но вероятностный характер. Наилучшим образом для описания вероятностного характера пространственного распределения интеллектуальных агентов по узлам распределенной системы обработки информации подходит волновая функция - плотность распределения вероятности обнаружения интеллектуального агента в определенном узле распределенной системы в фиксированный момент времени.
Вид функции, описывающей плотность распределения информационных процессов по узлам распределенной системы обработки информации, напрямую связан с ней как с информационной средой. Эта связь определяется совокупным воздействием информационной среды на находящийся в ней квант информации.
Как было показано в главе 1, элементарные кванты информации в распределенных системах обработки информации демонстрируют ряд эффектов, присущих элементарным частицам в квантовой теории поля. В частности, без каких-либо дополнительных допущений проявляются эффект потенциального барьера и туннельный эффект. Оба эффекта могут быть проиллюстрированы на примере распространения вирусной эпидемии в распределенной системе обработки информации, разделенной на два сегмента, соединенных единственным временно недоступным узлом.
Когда неактивный узел соединяет два сегмента распределенной системы обработки информации, то каждый из них становится недостижимым для квантов информации из соседнего сегмента. Это явление и есть потенциальный барьер, препятствующий распространению информационных процессов в закрытый барьером сегмент распределенной системы обработки информации (рис. 1).
Однако, несмотря на разделение распределенной системы на два не связанных друг с другом сегмента, проникновение вируса из Сегмента 1 в Сегмент 2 принципиально возможно. Как и в квантовой механике, существует вероятность того, что вирус будете перенесен в Сегмент 1, минуя нарушенный канал связи. Например, на переносном носителе. В результате происходит переход через потенциальный барьер, пусть и не совсем обычным способом. При этом вирус в Сегменте 1 может быть обнаружен на любом узле, а не только на том, который непосредственно связан с точкой входа Сегмента 2. Налицо туннельный эффект, или туннелирование, Ч преодоление частицей потенциального барьера в случае, когда ее полная энергия (остающаяся при туннелировании неизменной) меньше высоты барьера.
Рис. 1. Преодоление элементарными квантами информации потенциального барьера - туннельный эффект
Мы видим, что поиск нового подхода к пониманию распределенных систем обработки информации как некоторой информационной среды с позиций теории поля достаточно обоснован. А ключевой характеристикой распределенной системы обработки информации как информационной среды является информационный потенциал, формируемый информационной средой и определяющий поведение элементарных квантов информации, помещенных в эту среду. Дополнительным аргументом в пользу именно квантовой теории поля служит еще и тот факт, что по каналам связи элементарные кванты информации передаются на околосветовых скоростях. Однако этот аргумент уместен лишь в том случае, когда обработка элементарного кванта информации на уровне узла занимает время, сравнимое со временем передачи его по каналам связи. В противном случае существенную роль играет лишь задержка узла, а временем передачи по каналам связи можно пренебречь.
Дальнейшее изучение информационного потенциала показывает, что к нему применимы все основные понятия волновой теории. Напряженность информационного поля в узле распределенной системы обработки характеризует силу воздействия фракции интеллектуальных агентов на этот узел. Силовые линии - это пути распространения влияния информационного поля, формируемого популяцией интеллектуальных агентов (рис. 2). Информационные силовые линии простираются от узла, занятого интеллектуальным агентом, по каналам связи, связывающим его с другими узлами распределенной системы обработки информации, не занятыми интеллектуальными агентами. Данное определение согласуется с классическим определением силовой линии как линии, касательные к которой в каждой точке параллельны вектору напряженности в этой точке. Естественно предположить, что вектор напряженности в узлах распределенной системы обработки информации направлен вдоль каналов связи, связывающих его с другими узлами, в направлении распространения интеллектуальных агентов.
Рис. 2. Силовые линии информационного потенциала
Густота силовых линий, понимаемых как пути распространения информационных процессов, подсказывает смысл напряженности информационного поля - интенсивность протекания информационных процессов, связанных с распространением интеллектуальных агентов. Эта интенсивность связана не только с количественными характеристиками информационных процессов (количеством информации), но и со скоростью их протекания, поэтому одной из возможных размерностей напряженности информационного поля может быть Мбит/с.
В главе 1 введено понятие достижимость узла, характеризующее принципиальную возможность размещения элементарного кванта информации на определенном узле распределенной системы. В главе 2 показано, что напряженность информационного поля связана с понятием достижимости узла и может быть выражена в виде функциональной зависимости от расстояния до узла. Таким образом, показана принципиальная возможность определить информационный потенциал как функцию, зависящую от единственного параметра - расстояния. Важность этого результата трудно переоценить. В то время как информационный потенциал позволяет в принципе определять пространственное распределение информационных процессов по узлам распределенной системы обработки информации с помощью волновой функции, возможность описать потенциал в виде зависимости от единственного параметра позволяет найти аналитический вид волновой функции для некоторых видов потенциала.
Используя известный способ представления структуры распределенной системы обработки информации в виде графа, введено расстояние между узлами распределенной системы обработки информации. Для этого ребрам и узлам графа, представляющего распределенную систему обработки информации, присвоены веса. Каждому ребру графа присваивается вес, соответствующий среднему времени передачи интеллектуального агента по выбранному каналу передачи данных. Это значение может быть достаточно большим, сравнимым со временем, требующимся на обработку (размещение) интеллектуального агента на узле распределенной системы обработки информации.
Введено понятие задержки узла распределенной системы обработки информации как времени, которое в среднем тратится узлом на обработку полученной информации (интеллектуального агента) соответствующего рода и дальнейшую передачу по каналам связи. Важно понимать, что задержка узла зависит от характера обрабатываемой информации и не является величиной абсолютной и неизменной. Например, она может различаться для одного и того же узла в случае обработки текстовой, аудио- и видеоинформации, а также интеллектуальных агентов различного рода.
Каждой вершине графа присваивается вес, соответствующий задержке узла на обработку интеллектуальных агентов заданного вида. В результате все ребра и вершины графа ранжируются величинами одной размерности - временем в секундах. Чтобы получить безразмерную задержку информационных потоков, веса всех ребер и вершин графа делятся на наименьший из весов. Тогда минимальное значение веса 1 будет достигаться на ребре (или в узле), соответствующем каналу связи (узлу) с минимальной задержкой информационного потока.
Таким образом, с помощью введенных весов можно определить минимально необходимое время, которое требуется элементарному кванту информации, чтобы преодолеть путь между двумя узлами, что позволяет оценить расстояние между этими узлами:
Определение 1: длиной маршрута между двумя узлами распределенной системы обработки информации называется сумма весов ребер, составляющих этот маршрут, а также весов узлов, находящихся на этом маршруте, не включая концевые узлы маршрута.
Определение 2: длиной пути между узлами распределенной системы обработки информации называется сумма весов ребер, составляющих этот путь, и весов узлов, находящихся на этом пути, не включая концевые узлы пути.
Определение 3: расстоянием между узлами распределенной системы обработки информации называется минимальная длина пути, связывающего эти узлы в неориентированном дубликате графа.
Важно отметить, что введенное понятие расстояния отвечает аксиомам метрики, поэтому может использоваться при определении потенциала и нахождении волновой функции, а также обладает крайне важным свойством, дополнительно подтверждающим применимость квантовой теории поля к определению информационного потенциала.
Введем систему координат, необходимую для формализации понятия информационного потенциала. В качестве начала координат выберем первый узел распределенной системы, на котором размещен интеллектуальный агент. Такой выбор начала координат оправдан тем, что размещенный первым интеллектуальный агент оказывает определяющее влияние на формирование потенциала. Координатой узла в зафиксированной таким образом системе координат будет расстояние между началом координат и выбранным узлом.
Фактически выбор начала координат эквивалентен фиксации состояния распределенной системы обработки информации в определенный момент времени. Исходя из характера распространения интеллектуальных агентов, логично расширить определение координаты узла, а именно - считать координатой узла не просто длину пути между узлом и началом координат, а длину пути между узлом и ближайшим узлом, с размещенным на нем интеллектуальным агентом. Уточненное таким образом понятие координаты узла учитывает участие в процессе распространения интеллектуальных агентов не только первого, но и всех остальных узлов, занятых интеллектуальными агентами. Действительно, с течением времени область, охваченная интеллектуальными агентами, расширяется и смещается вглубь, в сетевую среду распределенной системы обработки информации, в результате чего повышается достижимость узлов, к которым приближается граница этой области.
С формальной точки зрения описанный эффект означает, что с течением времени расстояние до узла убывает. А введенное таким образом расстояние соответствует определению метрики расстояния, используемому в квантомеханической модели Козлова-Никишина. Поэтому именно эта модель представляется наиболее подходящей для описания поведения интеллектуальных агентов в распределенной системе обработки информации и поиска волновой функции.
На основе проведенного анализа определен линформационный смысл информационного потенциала (аналог физического смысла потенциала в классической физике):
Разность значений информационного потенциала в двух узлах распределенной системы обработки информации определяет работу по перемещению интеллектуального агента между этими узлами.
Тогда, чтобы с удалением узла от границы области, занятой интеллектуальными агентами, работа по перемещению интеллектуального агента росла, по аналогии с классическими физическими потенциалами информационный потенциал также должен быть отрицательным, а свое максимальное значение - 0 - принимать вне распределенной системы обработки информации (лв бесконечности).
Исходя из вышесказанного дано формальное определение информационного потенциала:
Определение 4: Информационный потенциал Ч это скалярная характеристика информационного поля, характеризующая потенциальную энергию, которой обладает интеллектуальный агент, помещенный в данный узел распределенной системы обработки информации (данную точку поля).
Данное определение подводит логическую черту под исследованиями возможности использования понятий теории поля применительно к распределенным системам обработки информации и впервые позволяет нам говорить о теории информационного поля.
Как уже было сказано, введенный информационный потенциал наиболее близко соотносится с квантово-механической моделью релятивистского атома водорода В. В. Козлова и Е. М. Никишина. Расстояние в модели Козлова-Никишина вводится с помощью иденфинитной метрики
Использование данной метрики в рассматриваемом нами случае абсолютно правомерно. Метрика расстояния на распределенной системе обработки информации при определении потенциала вводится таким образом, что размерность расстояния совпадает с размерностью времени, поэтому используемая формула правомочна с точки зрения размерностей входящих в нее переменных. Нормировочные коэффициенты, которые могут понадобиться для введения сбалансированной метрики, заменой координат могут быть исключены из формулы путем приведения квадратичной формы к каноническому виду.
Введенное расстояние связано со временем и при неизменной координате узла убывает с течением времени. Это позволяет учесть волновой эффект распространения интеллектуальных агентов и вовлечения в этот процесс новых узлов распределенной системы обработки информации с течением времени.
Состояние системы в модели Козлова-Никишина определяет волновая функция , удовлетворяющая стационарному уравнению Шредингера
Отметим правомочность использования уравнения Шредингера, применимого к однородной среде, в которой отсутствует смешение сред с качественно различными свойствами. Компанией Cisco разработана трехуровневая иерархическая модель сети, в которой сетевая среда разделяется на три логических уровня - базовый уровень, уровень распространения и уровень доступа. Рассматриваемая в работе сетевая среда соответствует уровню доступа, на котором находятся узлы распределенной системы с размещенными на них интеллектуальными агентами. Уровень распространения и базовый уровень в работе не рассматриваются, так как на этих уровнях происходит исключительно передача сетевого трафика. Таким образом, рассматриваемая в работе сетевая среда является однородной (единой) в смысле проявляемых ею свойств, а смешение сред с качественно различными свойствами отсутствует.
Определенное специальным образом расстояние вместе с предположением о зависимости потенциала только от длины вектора : - позволяет перейти к новым - псевдосферическим - координатам, в которых происходит разделение переменных, а сама задача превращается в систему одномерных дифференциальных уравнений, число которых равно числу размерностей конфигурационного пространства. Уравнение для радиальной составляющей волновой функции, зависящей от длины вектора , решено в аналитических функциях для некоторых видов потенциала . Таким образом, найдены волновые функции, описывающие плотность распределения информационных процессов по узлам распределенной системы обработки информации, для случаев, соответствующих распределенным системам с сетевой структурой основных видов топологии сети.
В случае когда положение информационного процесса описывается одной координатой , а потенциал имеет вид волновая функция имеет вид:
где
Показано, что в случае равномерного потенциала вида радиальная составляющая волновой функции аналогична случаю потенциала центробежных сил:
В случае кулоновского потенциала вида найдена радиальная составляющая волновой функции, которая имеет следующий вид:
где - вырожденная гипергеометрическая функция, а - обобщенный многочлен Лагерра.
Условие существования суммируемого с квадратом решения позволяет сделать вывод о допустимых значениях энергии и коэффициента :
Здесь и - целые неотрицательные числа, а коэффициент может принимать значения
Для уровней энергии получены значения энергетических уровней:
Показано, что в случае, когда положение информационного процесса описывается двумя координатами и , а потенциал имеет вид , волновая функция определяется формулой:
Полученные волновые функции доказывают принципиальную возможность определения пространственно-временного распределения информационных процессов по узлам распределенной системы обработки информации и выводят нас на новый уровень понимания процессов, протекающих в крупных распределенных системах.
Третья глава посвящена ответу на вопрос о количественном характере эволюции фракций интеллектуальных агентов. Информация о пространственно-временном распределении информационных процессов по узлам распределенной системы обработки информации впервые позволяет ответить на вопрос где?, но полную картину происходящего в распределенной системе дает только в совокупности с данными о численности соответствующих информационных процессов. Для решения задачи определения количественной эволюции фракций интеллектуальных агентов требуется разработать новую математическую модель взаимодействия интеллектуальных агентов, так как существующие на сегодня модели обладают существенными недостатками - не отражают способность мультиагентных систем динамически изменять свою структуру, а также не позволяют описать конфликтное взаимодействие интеллектуальных агентов, не участвующих в переговорах.
Показано, что список трех общепринятых видов взаимодействия интеллектуальных агентов друг с другом (порождение, сопротивление и вытеснение) целесообразно дополнить новым, четвертым видом взаимодействия - трансформацией. Трансформация отражает более широкое понимание интеллектуального агента как некоторого процесса обработки информации, который в зависимости от изменений внешней среды может трансформироваться из интеллектуального агента в контрагент и обратно. Трансформация также может быть проиллюстрирована на примере вирусов, которые заражают антивирусы и другие программы, которые, в свою очередь, тоже становятся вирусами, т.е. трансформируются в интеллектуальные агенты иного рода.
Предлагаемая математическая модель, описывающую количественную эволюцию популяций интеллектуальных агентов с точки зрения их взаимодействия друг с другом, расширяет классический агентный подход по нескольким направлениям. Во-первых, вводится новый вид взаимодействия - трансформация. Во-вторых, предлагаемая модель впервые явно постулирует динамичность структуры распределенной мультиагентной системы обработки информации и дает точный ответ на вопрос о количественной эволюции популяций интеллектуальных агентов. В-третьих, предлагаемая модель учитывает случаи конфликтного взаимодействия интеллектуальных агентов, не участвующих в переговорах. Особого внимания заслуживает тот факт, что полученная модель при исключении взаимодействия контрагентов друг с другом без дополнительных преобразований сводится к более простым эпидемиологическим моделям, описывающим распространение одного контрагента, что еще раз подтверждает правомерность построенной модели.
Наибольший интерес представляет случай конфликтного взаимодействия интеллектуальных агентов и распространения в распределенной системе обработки информации разнообразных фракций контрагентов - процессов обработки информации, функционирующих ненадлежащим образом и дестабилизирующих работу распределенной системы. Контрагенты распространяются в условиях противодействия фракций интеллектуальных агентов, задачей которых является подавление соответствующих фракция контрагентов и нормализация функционирования распределенной системы. Одновременно контрагенты взаимодействуют друг с другом и другими интеллектуальными агентами. Построение модели ведется в терминах конфликтного взаимодействия контрагентов и интеллектуальных агентов еще и потому, что она легко сводится к обычному случаю естественного взаимодействия интеллектуальных агентов путем простого исключения контрагентов из состава моделируемой мультиагентной системы.
Для формализации взаимодействия контрагентов и интеллектуальных агентов вводятся следующие обозначения:
сопротивляемость контрагентов вида j контрагентам вида i;
скорость порождения контрагентов вида i контрагентами вида j;
Сопротивление означает, что узлы с уже размещенными на них контрагентами вида недоступны для размещения контрагентов вида .
Показатель может принимать только два значения - 1 или 0. С учетом введенного обозначения доля узлов, доступных для размещения контрагентов вида , вычисляется по формуле
при условии для всех . Здесь - общее число узлов, - количество контрагентов вида .
Порождение означает, что контрагенты вида могут порождать контрагенты вида . В условиях введенного обозначения общее число порождаемых контрагентов вида вычисляется по формуле:
где - скорость увеличения численность агентов вида .
Вытеснение означает не только отсутствие сопротивления - , но и уменьшение численности контрагентов вида при размещении на соответствующих узлах конкурирующих контрагентов вида . В этом случае происходит соответствующее уменьшение численности контрагентов вида .
Показатель может принимать только два значения - 1 или 0. С учетом введенных обозначений доля вытесняемых контрагентов вида контрагентами вида вычисляется по формуле
при условии, что для всех .
Трансформация означает, что контрагенты вида трансформируются в контрагенты другого вида .
С учетом введенных обозначений изменение численности контрагентов вида вследствие трансформации вычисляется по формуле
Показано, что с учетом влияния конкурирующих агентов итоговый результат взаимодействия контрагентов друг с другом описывается следующей системой дифференциальных уравнений:
где
- скорость порождения конкурирующих агентов, а - их численность в момент времени t.
Созданная математическая модель мультиагентного конфликтного взаимодействия контрагентов и интеллектуальных агентов в распределенной мультиагентной системе обработки информации позволяет описать количественный характер эволюции популяций контрагентов. Дополненная информацией о вероятностном распределении контрагентов по узлам распределенной системы обработки информации, полученная модель дает полное представление о пространственно-временном развитии структуры мультиагентной системы.
Показано, что при отсутствии взаимного влияния контрагентов друг на друга система дифференциальных уравнений, полученная в модели, разделяется на набор одномерных уравнений. Поэтому актуально исследование одномерной задачи взаимодействия контрагентЦагент, чему и посвящена четвертая глава.
В четвертой главе решается одномерная задача конфликтного взаимодействия контрагента и интеллектуального агента в распределенной мультиагентной системе обработки информации, изучаются причины возникновения фракций контрагентов и возможные способы их обнаружения.
Показано, что возникновение фракций контрагентов может быть вызвано как непосредственным внедрением в состав распределенной системы обработки информации чужеродных интеллектуальных агентов, так и количественным или качественным изменением входящих информационных потоков.
Для обнаружения фракций контрагентов предлагается использовать следующие методы:
- сигнатурный анализ;
- эвристический анализ;
- анализ энтропийных характеристик.
Каждый из предложенных методов имеет свои слабые и сильные стороны. Исходя из анализа достоинств и недостатков выбранных методов, предложены варианты их наиболее подходящего использования. Обоснована необходимость ведения распределенной базы данных сигнатур переходных процессов, сопровождающих зарождение фракций контрагентов, а также моделей эвристического анализа для эффективного использования методов сигнатурного и эвристического анализа.
Продемонстрировано, что изменение количественных и качественных характеристик входящих информационных потоков приводит к необходимости перераспределения нагрузки (информационных потоков) и, в некоторых случая, необходимости реструктурировать распределенную мультиагентную систему обработки информации.
Решена задача перераспределения n разнотипных информационных потоков между узлами распределенной системы обработки информации в условиях непредсказуемого изменения объемов входящей информации. В задаче рассмотрена система, состоящая из узлов, в которой за обработку информации каждого типа отвечают агенты соответствующего вида. Количество видов агентов соответствует количеству типов информационных потоков - . На каждом узле распределенной системы обработки информации в общем случае размещены агенты всех видов. Количество агентов вида , размещенных на узле с номером , - .
Предложен следующий алгоритм перераспределения информационных потоков:
Шаг 1. Каждому доступному каналу связи узла, на котором наблюдается излишек информационной нагрузки, присваивается вес, прямо пропорциональный емкости узла и обратно пропорциональный скорости передачи информации по этому каналу (рассматриваются только узлы с положительной емкостью) ;
Шаг 2. Каналы связи (доступные узлы) ранжируются по возрастанию присвоенного им веса
Шаг 3. Среди ранжированных узлов выбираются первые , сумма емкостей которых не менее излишка информационной нагрузки, а сумма емкостей любых узлов - меньше
Шаг 4. Максимальный вес выбранных каналов связи определяет задержку в обработке излишка информации ;
Шаг 5. Доля дополнительной нагрузки , передаваемой на соответствующий узел распределенной системы обработки информации, изменяется от 0 до 1 () и позволяет уменьшить значение в случае неполного использования емкости одного из выбранных узлов, когда
или ;
Шаг 6. После проведенной таким образом первоначальной инициализации весов дальнейшая оптимизация возможна, если есть свободные узлы с незадействованной емкостью. В этом случае часть информационной нагрузки последнего выбранного узла с номером может быть перераспределена на свободные узлы (перераспределение нагрузки с любых других узлов не уменьшит задержку по условию нормировки узлов - для любого );
Шаг 7. Шаг 6 повторяется до тех пор, пока есть свободные узлы, на которые возможно перераспределение нагрузки с максимально нагруженного узла, приводящее к уменьшению общей задержки в обработке информации.
В результате работы алгоритма излишек информационной нагрузки перенаправляется на недогруженные узлы распределенной системы обработки информации оптимальным образом, в том смысле что дальнейшее перераспределение нагрузки не приведет к уменьшению задержки ее обработки.
Однако возможно возникновение ситуации, когда объем входного информационного потока увеличивается, а емкость для перераспределения излишков информационной нагрузки отсутствует. В этом случае возможны два варианта поведения:
1. Количественная реорганизация структуры узлов: узлы, испытывающие излишек информационной нагрузки, увеличивают количество агентов, отвечающих за обработку информации соответствующего типа, за счет уменьшения количества агентов других типов (при существовании такой возможности);
2. При отсутствии возможности увеличить количество агентов необходимого типа за счет уменьшения количества агентов других типов увеличение производительности узла возможно за счет качественного изменения агентов соответствующего типа.
Если же причиной возникновения фракции контрагентов являются чужеродные интеллектуальные агенты, то для нормализации функционирования распределенной системы требуется управляющее воздействие в виде интеллектуальных агентов, направленных на подавление контрагентов. А сам процесс нормализации представляет собой конфликтное взаимодействие контрагента и интеллектуального агента. Решение одномерной задачи не только является частным случаем более общей модели, полученной в главе 3, но и позволяет ответить на два очень важных вопроса. Во-первых, получить аналитическое выражение числа контрагентов в текущий момент времени для основных сценариев взаимодействия контрагентЦагент. Во-вторых, определить параметры управляющего воздействия (фракции интеллектуальных агентов), реализующие требуемые условия надежности функционирования распределенной системы обработки информации. Таким условием может быть, например, максимально допустимая доля узлов, на которых размещен контрагент, или время полной нормализации функционирования распределенной системы. В частности, решение одномерной задачи дает ответ на вопрос о принципиальной возможности реализации такого воздействия - максимально допустимой задержке обнаружения фракции контрагентов и необходимой скорости наращивания популяции интеллектуальных агентов.
Предварительно проведен анализ возможных сценариев роста численности контрагентов и интеллектуальных агентов. Показано, что основными сценариями являются равномерный и экспоненциальный рост численности фракций контрагентов, причем экспоненциальный рост численности контрагентов может провоцироваться даже равномерными изменениями во входных информационных потоках.
Частная задача конфликтного взаимодействия контрагента и интеллектуального агента решена для трех основных сценариев роста численности фракций контрагентов и интеллектуальных агентов:
- равномерное увеличение численности контрагентов и равномерное увеличение численности интеллектуальных агентов;
- экспоненциальное увеличение численности контрагентов и экспоненциальное увеличение численности интеллектуальных агентов;
- экспоненциальное увеличение численности контрагентов и равномерное увеличение численности интеллектуальных агентов.
Рассмотрен случай распределенной системы обработки информации, состоящей из узлов. В начальный момент времени t0 = 0 в распределенной системе обработки информации находится n0 контрагентов. До момента времени t = T численность контрагентов увеличивается бесконтрольно. В момент времени T начинается активное управляющее воздействие в виде размещения интеллектуальных агентов A. Первоначально размещается q(T) = a0 агентов, где q(t) Цчисло агентов в момент времени t.
Для случая равномерного увеличения численности контрагентов и равномерного увеличения численности интеллектуальных агентов найдено аналитическое выражение числа контрагентов до и после введения управляющего воздействия в виде фракции интеллектуальных агентов (рис. 3). В условиях отсутствия противодействия число контрагентов вычисляется по формуле
После введения противодействия в виде интеллектуальных агентов число контрагентов вычисляется по формуле:
где q(t) = a0 + a(t - T) - число агентов A в момент времени .
Рис. 3. Характерный график численности популяций агентов и контрагентов в случае равномерного увеличения
Получена оценка времени стабилизации, начиная с которого число контрагентов убывает: где .
Для случая экспоненциального увеличения численности контрагентов и экспоненциального увеличения численности интеллектуальных агентов также найдено аналитическое выражение числа контрагентов до и после введения управляющего воздействия в виде фракции интеллектуальных агентов (рис. 4). В условиях отсутствия противодействия число контрагентов вычисляется по формуле
После введения противодействия в виде интеллектуальных агентов число контрагентов вычисляется по формуле:
Рис. 4. Характерный график численности популяции агентов и контрагентов в случае экспоненциального увеличения их численности
Получена верхняя оценка времени стабилизации, начиная с которого число контрагентов убывает:
Для случая экспоненциального увеличения численности контрагентов и равномерного увеличения численности интеллектуальных агентов (рис. 5) в условиях отсутствия противодействия число контрагентов вычисляется по формуле
После введения противодействия в виде интеллектуальных агентов число контрагентов вычисляется по формуле
Найдена верхняя оценка времени стабилизации, начиная с которого число контрагентов убывает:
Полученные результаты являются основой для создания базовых алгоритмов выработки управляющего воздействия для нормализации функционирования распределенной системы обработки информации. В общем случае управляющее воздействие формируется как совокупность подобных частных решений.
Рис. 5. Характерный график численности популяции агентов и контрагентов в дискриминационном случае
В пятой главе приведены модели и базовые алгоритмы выработки управляющего воздействия для нормализации функционирования распределенной системы обработки информации. Базовые алгоритмы разработаны для трех рассмотренных сценариев конфликтного взаимодействия контрагентЦагент.
Базовые алгоритмы являются составной частью модели выработки управляющего воздействия, направленного на нормализацию функционирования распределенной системы обработки информации в условиях возникновения разнообразных фракций контрагентов. Разработанные алгоритмы схожи по своей структуре и могут быть описаны единой блок-схемой. Используемые результаты и вычисления приведем только для одного из случаев.
Общими блоками для всех алгоритмов являются:
- диагностика состояния распределенной системы обработки информации;
- определение числа корректно функционирующих компьютеров и вычисление других параметров используемой модели;
- выбор параметров управляющего воздействия;
- математическое моделирование изменения численности фракций контрагентов и интеллектуальных агентов и проверка функционирования системы по критериям надежности;
- уточнение параметров управляющего воздействия;
- реализация управляющего воздействия.
Существенные отличия разработанных алгоритмов заключены только в блоке вычисления параметров используемой модели и уточнения параметров управляющего воздействия. Для случая равномерного увеличения численности контрагентов и равномерного увеличения численности интеллектуальных агентов (рис. 6) используются следующие результаты: в качестве значения задержки обнаружения T берется худшая оценка:
где - частота, с которой опрашивается распределенная система.
В качестве значения n(T) берется также худшая оценка:
где Nнорм - число нормально функционирующих компьютеров.
Скорость увеличения численности контрагентов V вычисляется по формуле в предположении n0 = 0:
По формуле , исходя из желаемого времени нормализации работы распределенной системы обработки информации Tнормализации (в предположении, что a0 = 0), получаем скорость увеличения численности фракции интеллектуальных агентов:
Полученное значение a используется для вычисления времени стабилизации численности контрагентов tстабилизации и числа дестабилизированных контрагентами компьютеров системы обработки информации к моменту стабилизации. В случае если данное значение не
соответствует требуемым критериям надежности функционирования системы обработки информации ( и ), формула рассматривается как уравнение относительно переменной a, откуда находится уточненное значение скорости увеличения численности агентов. Здесь t* = t - T - относительное время нормализации, .
Блок математического моделирования изменения численностей контрагентов и агентов используется для оценки выбранных параметров управляющего воздействия. По результатам математического моделирования полученные значения параметров управляющего воздействия при необходимости передаются в блок уточнения параметров. При соответствии результатов моделирования - времени стабилизации, численности контрагентов к моменту стабилизации, времени нормализации - заявленным критериям надежности системы обработки информации управление передается блоку реализации управляющего воздействия. В ходе реализации управляющего воздействия используются методы имитационного моделирования для анализа и подтверждения характера изменения численности контрагентов, а также тонкого уточнения параметров управляющего воздействия.
Аналогичные алгоритмы разработаны для двух других сценариев увеличения численности контрагентов и интеллектуальных агентов. Полученные алгоритмы использованы для разработки пакета прикладных программ нормализации функционирования распределенной системы обработки информации в условиях возникновения различных фракций контрагентов.
В шестой главе решается задача нормализации функционирования распределенной системы обработки информации в условиях возникновения различных фракций контрагентов.
Отметим, что признанный лидер разработки сетевого оборудовния компания Cisco активно развивает средства обеспечения сетевой безопасности, которые встраивает на аппаратном уровне в свои сетевые устройства. Построенная из таких устройств сетевая среда обладает некоторым аналогом распределенной системы сетевой безопасности, что на идейном уровне соответствует предлагаемому в работе подходу, который заключается в распределенном по времени и месту противодействии негативным процессам (контрагентам). Однако подход компании Cisco обладает рядом существенных недостатков: формально распределенная система в их понимании фактически представляет собой набор автономно функционирующих модулей, никак не связанных друг с другом. Анализ сетевого трафика не позволяет выявлять высокоуровневые контрагенты, кроме того такая система не может прогнозировать пространственно-временное распределение контрагентов по узлам распределенной системы обработки информации.
По результатам проведенного анализа разработан пакет прикладных программ Квант МП нормализации функционирования распределенной системы обработки информации (рис. 7). Пакет прикладных программ Квант МП является открытой системой, каждый модуль которого может работать как отдельно, выполняя определенные задачи, так и в совокупности с другими модулями. Для реализации пакета прикладных программ Квант МП была выбрана широко распространенная программная платформа на основе языка web-программирования PHP и СУБД MySQL.
Для нормализации функционирования распределенной системы обработки информации необходимо решить следующие задачи:
- Обнаружение фракций контрагентов (нежелательных процессов);
- Определение характера распространения фракций контрагентов;
- Выработка управляющего воздействия.
Два основных модуля пакета прикладных программ нормализации функционирования распределенной системы обработки информации определяются основными сценариями зарождения фракций контрагентов:
- контрагенты могут быть привнесены извне (например, вирусы);
- контрагенты могут являться следствием изменений во внешней информационной среде (например, непрогнозируемого изменения характеристик входящих информационных потоков).
Рис. 7. Пакет прикладных программ Квант МП
Для определения характера распространения фракций контрагентов, привнесенных извне, используется модуль анализа, мониторинга и прогнозирования пространственно-временного распределения контрагентов по узлам распределенной системы обработки информации. Данный модуль включает в себя подмодули моделирования роста численности контрагентов в зависимости от характера их распространения, определения вероятностного распределения контрагентов по узлам распределенной системы в зависимости от вида информационного потенциала, а также имитационного моделирования распространения контрагентов по узлам распределенной системы обработки информации в ходе реализации управляющего воздействия с выбранными параметрами управляющего воздействия.
Для управления нежелательными процессами, вызванными изменениями во внешней информационной среде, используется модуль управления информационными потоками и внутренней структурой распределенной системы обработки информации. Изменение количественных и качественных характеристик входящих информационных потоков приводит к необходимости перераспределения нагрузки (информационных потоков), а в некоторых случаях и к необходимости реструктурировать распределенную мультиагентную систему обработки информации.
Реструктуризация распределенной мультиагентной системы обработки информации на лету крайне важна для быстрой нормализации функционирования распределенной системы обработки информации, поэтому одним из важнейших элементов пакета прикладных программ нормализации функционирования распределенной системы обработки информации является фабрика агентов - модуль, осуществляющий порождение интеллектуальных агентов с требуемыми нам свойствами. Помимо очевидного использования фабрики агентов для реструктуризации распределенной системы обработки информации, данный модуль используется также для порождения интеллектуальных агентов, призванных подавлять выявленные контрагенты, а также для порождения инфраструктурных интеллектуальных агентов, входящих в состав модулей самого пакета прикладных программ, например модуля мониторинга.
Модуль мониторинга носит сигнальную функцию и решает задачу обнаружения сбоев в работе распределенной системы обработки информации. Задача решается с помощью интеллектуальных агентов, регулярно опрашивающих узлы распределенной системы обработки для подтверждения их нормального функционирования. Фракция агентов мониторинга решает следующие задачи:
- формирование и ведение списка опрашиваемых узлов;
- фактический опрос узлов;
- принятие решения об объявлении тревоги первого уровня;
- массовый опрос всех узлов;
- принятие решения об объявлении тревоги второго уровня.
Модуль коммуникации необходим для осуществления обмена информацией между интеллектуальными агентами, составляющими пакет прикладных программ нормализации функционирования распределенной системы обработки информации, а также координации их совместных действий. Фракция агентов коммутаторов решает следующие задачи:
- организация коммуникации между интеллектуальными агентами, входящими в состав обслуживаемого агентом-коммутатором сегмента распределенной системы обработки информации;
- коммутация коммуникационных сигналов между интеллектуальными агентами, входящими в состав различных сегментов;
- организация широковещательного режима доставки сообщений;
- самоорганизация сети агентов-коммутаторов.
С целью реализации оптимального управляющего воздействия предложено для доставки интеллектуальных агентов заданного вида от фабрики агентов до необходимого узла распределенной системы использовать транспортный модуль. Модуль транспортировки агентов пакета прикладных программ выработки управляющего воздействия может быть как автономным, так и интегрированным с операционной системой. В этом случае доставка интеллектуальных агентов будет происходить быстрее, так как будут снижены временные издержки на взаимодействие транспортного агента с операционной системой.
Активация одного из двух основных модулей осуществляется при условии обнаружения распространения фракции контрагентов. Эту задачу решает модуль обнаружения переходных процессов, сопровождающих зарождение фракций контрагентов. Основу модуля составляет модуль анализа, который отвечает за определение характера распространения контрагентов. Модуль анализа также определяет причину возникновения фракций контрагентов - вторжение инородных интеллектуальных агентов или количественное и качественное изменение входящих информационных потоков.
Предлагаемая теория была использована при разработке части общей стратегии обеспечения антивирусной защиты ФГУП НИИ Восход. Основные результаты, связанные с разработкой моделей и методов описания протекания негативных процессов в распределенных системах обработки информации, были внедрены в рамках подготовки решений по обеспечению антивирусной защиты ФГУП НИИ Восход, а также разрабатываемых предприятием проектов. В основе предложенных решений лежат полученные в работе аналитические оценки параметров реализации управляющего воздействия, гарантирующие требуемые условия надежности функционирования распределенной системы обработки информации. Внедрение рекомендаций позволило выбрать программные продукты и комплексные решения антивирусной защиты, гарантирующие требуемые параметры надежности.
ЗАКЛЮЧЕНИЕ
В диссертационной работе решена крупная научная и практическая проблема, имеющая важное значение и состоящая в разработке методологических основ исследования динамики популяций интеллектуальных агентов в условиях их конфликтного взаимодействия в распределенных мультиагентных системах обработки информации.
Основные выводы и рекомендации, полученные лично автором, заключаются в следующем:
1. Обоснована теория описания распределенных мультиагентных систем обработки информации с позиций информационного потенциала на базе квантовой теории поля.
2. Создана теория, которая показала, что базовыми видами информационных потенциалов распределенных систем обработки информации с сетевыми структурами, соответствующими основным видам топологии сети, является равномерный потенциал, а также кулоновский потенциал и потенциал центробежных сил.
3. Поставлены и решены задачи определения пространственно-временного распределения контрагентов по узлам распределенной системы обработки информации для основных видов информационного потенциала.
4. Разработана математическая модель конфликтного взаимодействия интеллектуальных агентов в распределенных мультиагентных системах обработки информации.
5. Произведено выделение основных сценариев роста численности фракций контрагентов и на их основе - основных конфликтных ситуаций .
6. Решены задачи конфликтного взаимодействия контрагентна и интеллектуального агента для основных сценариев роста численности контрагентов и интеллектуальных агентов.
7. Разработаны модели, методы и базовые алгоритмы нормализации функционирования распределенной системы обработки информации.
8. Разработан пакет прикладных программ Квант МП нормализации функционирования распределенной системы обработки информации.
Основные положения диссертации изложены в следующих опубликованных работах:
В перечне, рекомендованном ВАК Минобрнауки России:
- Приходько М. А. Асимптотика информационной энтропии для двумерного аналога атома водорода в модели Козлова-Никишина // Матем. заметки. - М.: Наука. - 2005. - Т. 78, вып. 5. - С. 727-744.
- Приходько М. А. Информационная энтропия релятивисткой модели Козлова-Никишина // Теоретическая и математическая физика. - М.: Наука, - 2006. - Т. 148. N. 3. - С. 444-458.
- Приходько М.А. Темпоральный анализ как средство совершенствования контрольно-измерительных материалов (КИМ) // Горный информационно-аналитический бюллетень. - М.: МГГУ. - 2009. - №ОВ4. - С. 313-317.
- Приходько М.А. Требования к системам персонифицированного сбора информации в условиях ограниченного времени на примере автоматизированных систем интерактивного тестирования // Горный информационно-аналитический бюллетень. - М.: МГГУ. - 2009. - №ОВ4. - С. 318-322.
- Приходько М.А., Федунец Н. И. Проблемы взаимодействия конкурирующих интеллектуальных агентов в распределенных мультиагентных системах обработки информации // Горный информационно-аналитический бюллетень. - М.: МГГУ. - 2010. - №ОВ5. - С. 252-260.
- Приходько М.А. Взаимодействие конкурирующих интеллектуальных агентов в распределенных мультиагентных системах обработки информации при экспоненциальном и равномерном возрастании числа контрагентов // Горный информационно-аналитический бюллетень. - М.: МГГУ. - 2010. - №ОВ5. - С. 236-251.
- Приходько М.А. Математическая модель мультиагентного взаимодействия конкурирующих интеллектуальных агентов в распределенных мультиагентных системах обработки информации // Горный информационно-аналитический бюллетень. - М.: МГГУ. - 2010. - №ОВ5. - С. 261-265.
- Приходько М.А. , Федунец Н. И. Информационно-потенциальный подход к оценке распространения информационных процессов в распределенной системе обработки информации // Горный информационно-аналитический бюллетень. - М.: МГГУ. - 2011. - №ОВ6. - С. 249-256.
- Приходько М.А. Оптимизация процесса обработки информации в узлах распределенной мультиагентной системы обработки разнородной информации // Горный информационно-аналитический бюллетень. - М.: МГГУ. - 2011. - №ОВ6. - С. 257-261.
- Приходько М.А., Федунец Н. И. Алгоритмы формирования управляющих воздействий в распределенных мультиагентных системах // Программные продукты и системы. - 2010. - №4 (92). - С. 81-84.
- Приходько М.А. Взаимодействие конкурирующих интеллектуальных агентов в распределенных мультиагентных системах // Программные продукты и системы. - 2010. - №3 (95). - С. 41-43.
- Приходько М. А. Информационно-потенциальный подход к исследованию распространения интеллектуальных агентов в распределенных системах обработки информации // Прикаспийский журнал: управление и высокие технологии. - 2011. - № 2 (14). - С. 8-13.
- Приходько М. А. , Н. И. Федунец. Проблема несанкционированной утечки информации в инфокоммуникационных мультиагентных системах // Прикаспийский журнал: управление и высокие технологии. - 2011. - № 2 (14). - С. 13-16.
- Приходько М. А. Мультиагентные технологии в системах дистанционного обучения // Прикаспийский журнал: управление и высокие технологии. - 2011. - N 3 (15).
- Приходько М. А. Перераспределение информационных потоков в узлах распределенной мультиагентной системы обработки разнородной информации // Прикаспийский журнал: управление и высокие технологии. - 2012. - N 1 (17).
В других изданиях:
- Приходько М.А. Взаимодействие вируса и активного антивирусного агента в ограниченной сетевой среде при равномерном и экспоненциальном увеличении числа вирусов и активных антивирусных агентов // Роль бизнеса в трансформации российского общества - 2010: мат-лы V Междунар. науч-практ. Конгресса / Моск. фин.-пром. академия. - М.: МФПА, 2010. - С. 499-500.
- Приходько М.А. Компьютерный вирус как средство анализа и модернизации современных средств защиты // II Международная студенческая конференция по проблемам компьютерной безопасности IT-Security Conference for the Next Generation. Апрель 2009. Сборник докладов.
- Приходько М.А. Компьютерный вирус как базис развития средств защиты будущего // Всероссийская научно-техническая конференция студентов, аспирантов и молодых ученых Научная сессия ТУСУР-2009. Май 2009. Сборник докладов.
- Приходько М. А. Современные способы обнаружения негативных процессов в сетевых структурах и распределенных системах // Современные информационные технологии в управлении и образовании: Сборник научных трудов. В 3-х ч.- М.: ООО Издательство Проспект. - Ч. 1. - 240 с. - С. 52-57.
- Приходько М. А. Информационный потенциал сетевых структур и распределенных систем для основных видов топологии сети // Современные информационные технологии в управлении и образовании: Сборник научных трудов. В 3-х ч.- М.: ООО Издательство Проспект. - Ч. 1. - 240 с. - С. 57-65.
Подписано в печать 12.2011 Формат 60×90/16
Объем 2 п.л. Тираж 100 экз. Заказ №
ОИУП Московского государственного горного университета
Москва, Ленинский проспект, д.6
Авторефераты по всем темам >> Авторефераты по техническим специальностям