Авторефераты по всем темам  >>  Авторефераты по техническим специальностям

На правах рукописи

ИШКИНА ЕВГЕНИЯ ГЕННАДИЕВНА

СИТУАЦИОННОЕ УПРАВЛЕНИЕ ПРОЦЕССОМ ГЕНЕРАЦИИ ЭЛЕКТРОННЫХ УСЛУГ НА ОСНОВЕ КОНТЕКСТНОЗАВИСИМЫХ ЭВРИСТИК

Специальность 05.13.10 Управление в социальных и экономических системах

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Астрахань 2012

Работа выполнена в ФГБОУ ВПО Астраханский государственный университет.

Научный консультант: кандидат технических наук Щербинина Оксана Владимировна

Официальные оппоненты: Жуков Дмитрий Олегович доктор технических наук, профессор, Институт криптографии, связи и информатики Академии ФСБ РФ, профессор кафедры №7Халилов Абдурахман Исмаилович доктор технических наук, профессор, Дагестанский государственный университет, профессор кафедры дискретной математики и информатики

Ведущая организация: Костромской государственный университет им. Н.А. Некрасова

Защита состоится 30 марта 2012 г. в 14:00 ч. на заседании диссертационного совета ДМ212.009.03 при Астраханском государственном университете по адресу: 414056, г. Астрахань, ул. Татищева, 20а.

С диссертацией можно ознакомиться в библиотеке Астраханского государственного университета.

Автореферат разослан л28 февраля 2012 г.

Ученый секретарь диссертационного совета ДМ212.009.03, к.т.н. Щербинина О.В.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность исследования. В настоящее время Интернет представляет собой постоянно развивающуюся сетевую инфраструктуру, позволяющую создавать, распространять, использовать и интегрировать информационные ресурсы. Сервис-ориентированная парадигма на сегодняшний день признана основной для Интернет, что подтверждается значительным объемом исследований в этой области и развитием соответствующих технологий за последние 10 лет. Сервисы представляют собой атомарные слабосвязанные компоненты, реализующие прикладные функции автоматизированных систем.

Для обеспечения интероперабельности гетерогенных ресурсов и сервисов Интернет требуются семантические технологии, единые стандарты и средства согласования данных. Анализ европейских исследовательских проектов позволяет сделать вывод, что количество доступных сервисов в скором времени будет исчисляться миллиардами.

В перечень десяти ключевых стратегических технологий 2012 года, по мнению Gartner, ведущей исследовательской и консалтинговой компании, специализирующейся на рынках информационных технологий, входят:

Контекстно-зависимые вычисления (context-aware computing). В таких приложениях используется информация об окружении пользователя, его действиях, предпочтениях с целью улучшения качества его взаимодействия с системой путем предоставления ему персонализированного контента, продукта или услуги. Наибольший интерес такие приложения представляют для пользователей мобильных устройств. Количество смартфонов, по оценкам Gartner, к 2013 году возрастет втрое и составит 1,82 миллиарда. Все больше будет разрабатываться и потребляться сервисов для мобильных устройств.

Интернет Вещей (Internet of Things). Одним из катализаторов его развития является технология NFC (Near Field Communication), которая представляет интерес в сфере мобильных платежей, а также позволяет улучшить качество услуг в сфере общественного транспорта, авиаперевозок, торговли и здравоохранения.

Новое поколение аналитических средств. В этой области Gartner прогнозирует смещение фокуса в сторону коллективного принятия решений, переход от анализа исторических данных с целью выяснения причин определенных фактов к анализу исторических данных в совокупности с данными, поступающими в режиме реального времени, для формирования прогнозов.

Таким образом, эти стратегические технологии отражают следующие тенденции развития Интернет: стремительный рост количества сервисов, доступных, прежде всего, пользователям мобильных устройств;

необходимость их адаптации к требованиям конкретного пользователя и, наконец, необходимость прогнозирования будущих потребностей потребителей сервисов.

Множество доступных сервисов может быть также расширено за счет комбинации функциональности уже существующих сервисов. В настоящее время для многих систем разрабатывается API (прикладной интерфейс программирования), который позволяет внешним системам использовать и интегрировать их функциональные возможности. Основным средством обеспечения взаимодействия являются веб-сервисы, реализуемые с использованием REST- и SOAP-подходов.

Несмотря на то, что компоновка сервисов становится все более актуальной, эта задача в настоящее время слабо автоматизирована. Для обеспечения лучшей ориентации пользователей в непрерывно растущем пространстве гетерогенных сервисов требуется реализация аналитических средств нового поколения, обеспечивающих проактивность, то есть поиск эффективных комбинаций сервисов, позволяющих решать типовые пользовательские задачи, с целью последующего повторного использования.

Однако на сегодняшний день отсутствует универсальная платформа для эффективного решения проблемы интеграции гетерогенных сервисов и проактивного поиска заранее не предусмотренных поставщиками сервисов вариантов их использования для решения типовых пользовательских задач.

Возможности динамической адаптации существующих систем к контексту использования также достаточно ограничены.

Целью диссертационной работы является повышение релевантности и эффективности использования предоставляемых потребителям электронных услуг в различных социально-экономических системах за счет интеграции гетерогенных сервисов и проактивного анализа коллективного опыта их использования в различных ситуациях, инвариантного по отношению к предметной области.

Для достижения поставленной цели необходимо решить следующие задачи:

1. Провести анализ существующих подходов к решению задачи интеграции сервисов и их адаптивного предоставления потребителям;

2. Выбрать технологии для достижения поставленной цели.

3. Разработать модели проактивной интегрированной среды взаимодействия для сервис-ориентированных систем.

4. Разработать методы динамического построения единого хранилища гетерогенных сервисов и динамической генерации сервисов, соответствующих задаче пользователя;

5. Разработать программное обеспечение на основе созданных моделей и методов.

Методы исследования. В процессе работы использовались методы математического моделирования, онтологического моделирования, интеллектуального анализа данных (Data Mining), искусственного интеллекта, теории вероятностей, теории принятия решений.

Научная новизна. В диссертации разработаны и выносятся на защиту следующие основные положения:

1. На основе интеграции онтологий предложена модель единого хранилища сервисов и контекстно-зависимых эвристик, позволяющая унифицированным образом представить знания о сервисах и их композициях.

2. Разработан метод динамического наполнения единого хранилища сервисов за счет импорта базовых сервисов и интеллектуального поиска контекстно-зависимых эвристик.

3. Разработан метод динамической генерации композиций сервисов, позволяющий получить наиболее релевантный результат за счет использования комплексных семантических аннотаций базовых сервисов и их композиций.

Практическая значимость диссертационного исследования состоит в том, что на основе предложенных моделей и методов разработано программное обеспечение, осуществляющее автоматический поиск наилучших композиций гетерогенных сервисов, соответствующих комплексной задаче пользователя, на основе анализа опыта использования сервисов в различных ситуациях.

Результаты работы используются в инновационном проекте Nice Future Campus (Ницца, Франция), а также в учебном процессе в Астраханском государственном университете при изучении дисциплин Технологии анализа данных, Онтологии и мультиагентные системы, Современные средства разработки приложений.

Апробация работы. Материалы, входящие в диссертацию, обсуждались на второй всероссийской научно-практической конференции Информационная среда ВУЗа XXI века (Петрозаводск, 2008), международной научной конференции Электронная культура.

Информационные технологии будущего и современное электронное обучение Modern IT & (E-) Learning (Астрахань, 2009), третьей международной конференции Information Systems and Economic Intelligence (Сусс, Тунис, 2010), шестой международной конференции Internet and Web Applications and Services (Синт Маартен, 2011), секции Мобильная коммерция седьмого ежегодного форума ECR (Москва, 2011).

Публикации. Основные положения диссертационной работы отражены в 7 опубликованных научных работах, в том числе в 3 статьях в ведущих рецензируемых научных журналах и изданиях, рекомендованных ВАК РФ для опубликования основных научных результатов диссертации.

Связь с проектами по проведению НИР. В основу диссертационного исследования положены работы, выполненные автором в рамках государственного контракта №02.740.11.0836 с Минобрнауки РФ по теме Теоретические основы и разработка информационных технологий для интеллектуальных систем автоматизации управления и научных исследований с применением адаптивных мобильных сервисов, мультимедиа-технологий, технологий геоинформационных систем и методов интеллектуального и многоагентного управления робототехническими комплексами (11.06.2010 - 15.10.2012), а также государственного контракта №8117р/12773 с Фондом содействия развитию малых форм предприятий в научно-технической сфере по теме Разработка учебно-исследовательских лабораторных комплексов в сфере высокоинтегрированных информационных систем с применением адаптивных мобильных сервисов и мультимедиа-технологий для опережающего и корпоративного обучения, повышения квалификации (01.06.2010 - 31.12.2012).

Связь с международными академическими проектами. Результаты диссертационного исследования были использованы в международных проектах в рамках программы TEMPUS: JEP_25070_2004 Модернизация преподавания ИКТ в университетах Юга России (MEICTSRU), 159025TEMPUS-1-2009-1-FR-TEMPUS-JPCR Сеть магистерских программ по информатике как второй компетенции в Европе, России и Центральной Азии (ERAMIS) и 511135-TEMPUS-1-2010-1-ES-TEMPUS-JPCR Настройка образовательных структур в России (TUNING).

Структура и объем работы. Диссертационная работа состоит из введения, пяти глав, заключения, списка сокращений и условных обозначений, библиографического списка, приложений. Основная часть работы изложена на 113 страницах, содержит 18 рисунков, 12 формул.

Библиографический список содержит 105 источников.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертации, сформулированы цель и задачи исследования, перечислены основные научные результаты диссертации, приведены практическая ценность и область применения результатов.

В первой главе представлены результаты анализа существующих подходов к решению задачи интеграции сервисов и их адаптивного предоставления потребителям.

Проведен обзор программных платформ или их прототипов, которые содержат аналитическую прослойку, детерминирующую процесс выбора сервисов с целью адаптации по определенным критериям. Рассмотренные платформы были классифицированы на группы в соответствии с их главной функцией: 1) персонализация сервисов, 2) поиск сервисов, соответствующих контексту (context-aware), 3) поиск сервисов, соответствующих комплексной задаче (goal-driven или task-driven), 4) проактивный поиск шаблонов (pattern-driven).

За редким исключением, эти четыре подхода реализованы отдельно.

Задача поиска шаблонов композиций сервисов в рассмотренных прототипах решается независимо от контекста. Тем не менее, важной задачей на сегодняшний день является не только обнаружение устойчивых шаблонных композиций в растущем массиве сервисов, то есть прогнозирование вариантов их использования, но и выявление факторов, определяющих уместность применения таких шаблонов в той или иной ситуации. Это необходимо для упорядочивания динамически меняющегося множества распределенных гетерогенных сервисов.

Таким образом, для достижения цели исследования необходимо сочетание всех четырех подходов. Для этого необходимо реализовать некоторую среду взаимодействия сервис-ориентированных систем, интегрирующую их сервисы и осуществляющую проактивный анализ их использования с целью повышения эффективности взаимодействия с потребителями сервисов.

Вторая глава посвящена исследованию существующих технологий, связанных с целью диссертационного исследования, и оценке ее достижимости.

Задача интеграции гетерогенных сервисов требует наличия средств их описания, позволяющих осуществлять автоматический вызов и композицию.

Существующие технологии описания сервисов были классифицированы по результатам анализа на две категории: первая позволяет описать операционный синтаксис сервиса, т.е. его название, имена параметров и соответствующие типы данных, а вторая - композиционную семантику сервиса путем добавления к нему специальных аннотаций, используемых для автоматического обнаружения, композиции и вызова сервисов.

На уровне операционного синтаксиса SOAP- и REST-сервисам может быть предоставлено метаописание с использованием языка WSDL 2.0.

Для описания композиционной семантики сервисов уже создано или находится в стадии разработки большое количество стандартов и технологий, из которых наиболее популярными на сегодняшний день являются OWL-S и WSMO.

В OWL-S отсутствует четкое разделение того, что необходимо пользователю, от того, что предоставляет сервис. Профиль сервиса в OWL-S используется для автоматического обнаружения. Более предпочтительными для достижения цели данного исследования являются онтология WSMO и соответствующий ей язык WSML, поскольку компонент целей WSMO определяет, что необходимо пользователю, а компонент веб-сервисов определяет, какие возможности сервис предоставляет. Описание операционного синтаксиса в WSMO основано на языке WSDL, поэтому именно он был выбран в качестве унифицированного средства описания SOAP- и REST-сервисов.

Композиционной семантики, которая может быть выражена средствами WSMO, недостаточно, поскольку она позволяет представить ситуационные аннотации только в виде предусловий. На самом деле они представляют собой различные типовые классы ситуаций использования сервиса, которые применяются для определения релевантности сервиса в конкретной ситуации. Кроме того, как будет показано далее, ситуационные аннотации могут относиться к компонентам сценария (эвристики), что также невозможно выразить в WSMO. Поэтому требуется разработать дополнительный третий слой описания сервисов - слой ситуационной семантики.

Динамическая генерация сервиса для конечного потребителя требует наличия средств автоматической композиции сервисов. Для оценки выполнимости этой задачи был проведен анализ существующих методов автоматической композиции сервисов: основанных на потоках работ, (EFlow, PPM) и основанных на автоматическом планировании (методы ситуационного исчисления, методы, основанные на правилах, методы на основе иерархической сети задач).

В условиях динамического расширения пространства сервисов и изменения потребностей пользователей сценарии сервисов не могут быть жестко заданы на этапе проектирования, поэтому наилучшим образом подходят методы планирования. Было выявлено, что методы на основе иерархической сети задач демонстрируют лучшую производительность по сравнению с методами ситуационного исчисления и методами, основанными на правилах. Однако не существует готовой реализации метода на основе иерархической сети задач, совместимой с WSMO.

Для проактивной интегрированной информационной среды взаимодействия необходима реализация следующих функций:

возможности автоматического обнаружения сервисов в соответствии с пользовательской целью, представления знаний о зависимости сервиса или его компонентов от ситуации, представления статистических данных об использовании сервисов для оценки их релевантности в конкретной ситуации. Ни одна из существующих моделей не удовлетворяет всем трем требованиям, однако для этого возможна комбинация трех моделей:

интенционального графа, контекстуального графа и байесовской сети.

Для формального представления знаний в проактивной интегрированной информационной среде взаимодействия использованы онтологии, т.к. единая онтология обеспечивает совместное использование знаний в открытых и динамических распределенных системах, онтологии с хорошо определенной декларативной семантикой позволяют осуществлять логический вывод знаний на основе ситуационных аннотаций, и явным образом выраженные в онтологиях знания позволяют недостаточно выразительно описанным сервисам взаимодействовать друг с другом.

Таким образом, проведенное исследование показало, что существуют развитые технологии, которые позволяют считать поставленную цель диссертационного исследования достижимой, однако требуется разработка дополнительных моделей и методов на их основе.

Третья глава диссертации посвящена моделированию проактивной интегрированной среды взаимодействия для сервис-ориентированных социально-экономических систем, в частности, разработке формальной модели проактивной интегрированной среды взаимодействия, унифицированной формальной модели сервиса и модели ситуаций использования сервисов.

Интегрированная среда взаимодействия для сервис-ориентированных систем - это инфраструктура, которая обеспечивает прозрачный доступ пользователей к информационным ресурсам, представляющим собой сервисы различных базовых сервис-ориентированных систем.

Адаптивная интегрированная среда взаимодействия для сервисориентированных систем - это интегрированная среда взаимодействия, которая собирает данные о ситуациях использования сервисов базовых систем конечными пользователями; далее по результатам анализа генерирует знания о типичных для сервисов классах ситуаций использования; а также выбирает сервисы, наилучшим образом соответствующие конкретной ситуации использования.

Под ситуацией использования сервиса понимается совокупность значений параметров, которые характеризуют момент вызова сервиса пользователем. Это могут быть характеристики пользователя (пол, возраст и т.д.), характеристики внешнего контекста (местоположение, время и т.д.). а также цель или совокупность целей, которые представляют собой причину вызова сервиса. Информация о ситуации использования может быть неполной в случае, если невозможно определить значения некоторых параметров.

Класс ситуаций использования сервиса - множество ситуаций, имеющих одинаковые значения для некоторого набора параметров, остальные параметры при этом могут принимать любые значения из соответствующего множества допустимых значений. Пример описания класса ситуаций: французский турист на Красной площади в Москве, при этом возраст и время могут быть любыми.

Проактивная интегрированная среда взаимодействия для сервисориентированных систем - это адаптивная интегрированная среда взаимодействия, в задачи которой входит также управление коллективным разумом сервисов, а именно поиск композиций сервисов, соответствующих наиболее типичным комбинациям целей, и динамическая генерация сервиса для заданной ситуации на основе доступных фрагментов (исходных сервисов и обнаруженных композиций).

Таким образом, проактивная интегрированная среда взаимодействия строит прогнозы относительно будущего поведения потребителей сервисов.

Такие композиции сервисов, которые соответствуют типовым высокоуровневым задачам пользователей, в диссертации именуются контекстно-зависимыми эвристиками, поскольку они представляют собой способы решения задач, не имеющие строгого обоснования, то есть не сформированные поставщиками сервисов, но, тем не менее, удовлетворяющие потребности пользователей в большинстве случаев.

Формально проактивная интегрированная среда взаимодействия для сервис-ориентированных систем (рис. 1) может быть определена как, где:

Ц : множество всех сервисов, доступных конечным пользователям, содержащее как сервисы, предоставляемые базовыми системами, так и, возможно, внешние сервисы;

Ц : множество доступных источников информации о ситуациях использования сервисов (именуемых в дальнейшем виртуальными ситуационными датчиками), позволяющих получить значения параметров ситуаций, характеризующих пользовательские сессии;

Ц : журнал регистрации обращений пользователей к сервисам - хронологически упорядоченный набор записей о вызовах сервисов в совокупности с показаниями виртуальных контекстных датчиков и с метками пользовательских сессий;

Ц : множество ситуационных аннотаций сервисов, где каждая аннотация представляет собой типичный класс ситуаций использования сервиса;

Ц : функция, позволяющая получить новые ситуационные аннотации сервисов или уточнить существующие путем анализа истории использования сервисов. Таким образом, - обновленное множество ситуационных аннотаций сервисов;

Ц : функция, позволяющая преобразовать данные, поступающие непосредственно с виртуальных ситуационных датчиков, во внутренний формат среды взаимодействия;

Ц : функция получения множества релевантных сервисов на основе ситуационных аннотаций сервисов ( ) и описания текущей ситуации использования ( ). Таким образом,.

Ц : механизм получения контекстно-зависимых эвристик на основе множества доступных сервисов по результатам анализа журнала.

Таким образом, - множество доступных контекстнозависимых эвристик.

Рисунок 1. Проактивная интегрированная среда взаимодействия Проактивная интегрированная среда взаимодействия осуществляет предварительную обработку записей журнала регистрации обращений пользователей к сервисам для выявления наиболее типичных классов ситуаций использования сервисов и последующего семантического аннотирования сервисов единого хранилища с использованием функции. Журнал содержит хронологически упорядоченный набор записей о вызовах сервисов в совокупности с показаниями виртуальных контекстных датчиков и позволяет восстановить пользовательские сессии. Элемент пользовательской сессии состоит из одного сервиса и соответствующего ему набора целей.

- элемент пользовательской сессии, где:

- сервис, вызванный пользователем в момент времени.

- актуальное множество целей пользователя в момент времени, - предикат первого порядка, использующий некоторый термин онтологии целей.

Для сессии определяются также параметры пользователя и контекста (местоположение, время, устройство и т.д.). Параметры пользователя хранятся персистентно в виде профилей, а параметры контекста всегда определяются динамически для каждой сессии. Для упрощения мы будет считать, что параметры контекста остаются неизменными в течение сессии.

- вектор параметров пользователя в период, - логическое выражение, основанное на некотором термине онтологии пользовательских профилей, - временной интервал сессии.

- вектор параметров внешнего контекста в период, - логическое выражение, основанное на некотором термине онтологии контекстов.

Пользовательская сессия может быть представлена в виде множества:

При этом должно выполняться условие:

Таким образом, представляет собой временной интервал, такой что, если в течение этого интервала отсутствуют вызовы сервисов пользователем, это считается разрывом двух сессий.

- пример ситуации использования сервиса. и аналогично для. Таким, образом, Для формирования описания ситуации используются виртуальные датчики (рис. 2) - программные агенты, которые владеют информацией о сервисах, доступных для определения параметра ситуации, относящегося к - термину онтологии целей, профилей пользователей или внешних контекстов, а также о ситуационных критериях, ограничивающих возможность использования сервисов, Ц.

На вход агента поступает текущее описание ситуации и на основании алгоритма упорядочивания опрашиваемых сервисов формируется логическое выражение, основанное на терме одной из ситуационных онтологий.

Датчики подразделяются на физические, которые соответствуют аппаратным компонентам, измеряющим параметры окружения, и логические, которые служат для сбора контекстной информации через внешние веб-сервисы или интерфейсы внешних приложений.

Рисунок 2. Виртуальный датчик ситуационной информации Сервис определен рекурсивно. Вначале представляется формальная модель атомарного сервиса, содержащая необходимую семантику для проактивной интегрированной среды взаимодействия:

, где - сервис с ситуационной аннотацией, помещаемый в единое хранилище; - базовый сервис, прошедший стадию интеграции, т.е.

имеющий описание операционного синтаксиса и композиционной семантики; - ситуационное ограничение на использование сервиса ; - вероятность использования сервиса при условии ; - цель, которой позволяет достичь сервис.

Помимо атомарных сервисов, единое хранилище может также содержать семантически описанные составные сервисы:, где - составной сервис, правила построения которого описаны ниже.

Элементарная конструкция для построения составного сервиса имеет вид: (рис. 3а), где - атомарный или составной сервис, может быть пустым множеством.

, где - оператор получения непустого множества элементов типа.

Как видно из представленного определения, в работе рассматриваются только две конструкции для представления сценария:

последовательность и ветвление. Это обусловлено тем, что в области динамической композиции веб-сервисов понятие цикла редко применимо.

В случае, если составляющая элементарной конструкции является составным сервисом, это может быть представлено графически так, как показано на рис. 3б (для упрощения показаны только начальная и конечная части ). На рис. 3б - промежуточные ситуационные ограничения, - промежуточные цели. Исходя из определений элементарных конструкций, представленных выше, можно утверждать, что.

В случае, если, должны выполняться следующие условия:

1), 2), - множество возможных ситуаций, соответствующих ограничениям.

В некоторых случаях осуществляется дополнительная обработка графа в соответствии со следующими правилами:

1), 2) Если, то,.

а) Элементарная конструкция для б) Упрощенная модель составного составного сервиса сервиса в общем виде Рисунок 3. Модель составного сервиса Четвертая глава диссертации посвящена разработке методов для проактивной интегрированной среды взаимодействия: методов динамического построения единого хранилища гетерогенных сервисов и методов динамической ситуационной генерации сервисов.

Методы динамического построения единого хранилища гетерогенных сервисов С использованием методов поиска ассоциативных правил (для анализа частоты вызова некоторого сервиса в совокупности с параметрами ) и логических рассуждений на основе онтологий (позволяющих вывести неявные знания, используя, главным образом, отношение включенности терминов), генерируются семантические ситуационные аннотации для заданного сервиса (рис. 4).

Первым этапом данного метода является фильтрация пользовательских сессий с целью получения множества векторов:

, где Затем выполняется поиск ассоциативных правил с использованием вариации классического алгоритма Apriori. На входе алгоритма имеем набор транзакций и предметный набор (все доступные сервисы и параметры целей, пользовательских профилей и внешних контекстов).

В ходе выполнения алгоритма осуществляется поиск ассоциативных правил, содержащих только выражения с параметрами пользовательского профиля, контекста и целями ( ) в левой части и сервис в правой части:

(рис. 4). Таким образом, в значительной степени сокращается пространство поиска. На рис. 4 соответствует компоненту цели множества, а соответствует вероятности использования сервиса при условии и вычисляется по формуле (1).

(1) представляет собой предусловия для надлежащего использования сервиса. Здесь - конъюнкция целей и логических выражений, основанных на термах ситуационных онтологий.

Рисунок 4. Семантическая ситуационная аннотация для сервиса A С использованием метода поиска ассоциативных правил Apriori и метода поиска последовательных шаблонов AprioriAll записи журнала регистрации вызовов сервисов, входящего в состав проактивной интегрированной среды взаимодействия, предварительно обрабатываются с целью получения двух типов условных зависимостей между сервисами:

1) Совместное использование двух сервисов в пользовательской сессии (рис. 5а). Эти зависимости будем в дальнейшем называть симметричными правилами; 2) Последовательный вызов двух сервисов в пользовательской сессии, когда данные, полученные на выходе первого сервиса, используются на входе второго (рис. 5б). Такие зависимости будет в дальнейшем называть (асимметричными) эвристиками (шаблонами).

На рис. 5а и рис. 5б представляет собой описание ситуации, влияющее на заданную зависимость между сервисами,.

а) Совместное использование б) Последовательный вызов сервисов A и B в сессии сервисов AB в сессии Рисунок 5. Условные зависимости между сервисами Первый шаг состоит в поиске симметричных правил (рис. 5а). Он осуществляется путем применения алгоритма Apriori со следующими входными параметрами:

Ц набор транзакций, каждая из которых соответствует отдельной пользовательской сессии:

Ц предметный набор - множество всех доступных сервисов, в том числе и составных.

На выходе алгоритма Apriori на этом шаге получаем множество правил вида, где. Правила и объединяются в одно правило, поддержка которого больше. На следующем шаге выполняется поиск ситуационных зависимостей для найденных симметричных ассоциативных правил. На входе имеем:

Ц набор транзакций, каждая транзакция соответствует найденному правилу:

:

Ц предметный набор - все доступные сервисы и параметры целей, пользовательских профилей и внешних контекстов.

На выходе алгоритма получаем правила, содержащие только цели и логические выражения на основе параметров пользовательского профиля и контекста в левой части и в правой части для каждого симметричного правила. Подобное ограничение позволяет сократить размерность пространства поиска для алгоритма Apriori и тем самым повысить эффективность алгоритма. Графическое представление пары симметричных ассоциативных правил показано на рис. 5а.

Для формирования эвристик необходимо выявить последовательности сервисов, которые могут быть объединены в композицию. Композиции сервисов являются упорядоченными, т.е. асимметричными. Поиск таких зависимостей осуществляется с помощью алгоритма AprioriAll, который анализирует пользовательские сессии, использует обнаруженные симметричные правила и знания о синтаксической и семантической совместимости сервисов, полученные на основе метаданных сервисов, для сокращения размерности пространства поиска.

В пользовательской сессии два сервиса могут быть вызваны не последовательно, однако потоки данных с выхода одного и входа другого могут быть при этом сильно коррелированы. Анализ таких корреляций для правил, найденных на предыдущем этапе, позволяет получить правила, представленные графически на рис. 5б. Затем эти правила интегрируются в единое хранилище сервисов.

Семантическая схожесть сервисов A и B заключается в схожести ситуаций их использования, а также семантической схожести их входных и выходных параметров и вычисляется по формуле (2):

(2) где и - веса, такие что и ; оператор возвращает количество элементов множества; и - множества входных и выходных параметров сервиса соответственно;

Ц множество ограничений, накладываемых на ситуацию использования сервиса ; - цель, достигаемая по результатам выполнения ;

Ц функция определения схожести целей,, возвращающая значение от 0 до 1, вычисляемая при помощи рассуждений на основе онтологии целей.

Как видно из формулы, значение варьируется от 0 до 1, значение 1 означает, что сервисы и имеют одни и те же входные и выходные параметры, а также одинаковые ситуационные ограничения.

При интеллектуальном поиске новых сервисов (паттернов композиций) для принятия решения о добавления сервиса в единое хранилище используется оценка полезности сервиса, которая вычисляется по формуле (3).

(3) где - выполнимость композиции ; - новизна композиции ; - неожиданность композиции ; и - веса, причем и.

представляет собой бинарную функцию. Значение 1 означает валидность композиции, т.е. возможность автоматического выполнения сценария. Значение 0 означает, что несмотря на то, что композиция является синтаксически верной, автоматический вызов ее компонентов невозможен. В таком случае, как видно из формулы (3), полезность композиции будет равна 0.

Новизна композиции показывает, насколько она является уникальной в едином хранилище. Для вычисления новизны используется формула (4).

(4) Неожиданность композиции вычисляется по формуле (5).

(5), где - множество базовых сервисов, задействованных в композиции ; - функция, возвращающая домен сервиса, т.е. группу релевантных сервисов, формируемую в соответствии с функцией семантической схожести сервисов ; - функция вычисления корреляции между двумя доменами.

, где - количество уникальных пар операций, задействованных в композиции.

Таким образом, очевидно, что если в композиции задействованы сервисы из относительно малого количества доменов, которые достаточно релевантны, это является менее неожиданным, чем если получена композиция, объединяющая сервисы из очень разнородных доменов.

Методы для ситуационной генерации сервисов Процесс ситуационной генерации сервисов включает следующие этапы: формулировку пользовательского запроса в виде набора целей, поиск сервисов, соответствующих каждой группе целей и их кластеризацию, семантическую редукцию сервисов, генерацию плана выполнения целей, генерацию вызовов базовых сервисов.

Ввод пользовательского запроса осуществляется с использованием онтологии целей. Затрагиваемые при этом отношения между классами онтологии целей - иерархические и синонимические. Для обозначения иерархического отношения использован оператор, т.е. истинно, если термин является наследником (прямым или косвенным) термина.

Семантическая близость двух понятий онтологии и в данной работе будет рассчитываться по формуле (6).

(6), где - ближайший общий родитель и (Least Common Subsumer); - глубина вершины.

Как видно из формулы,, а также если - корень таксономического дерева онтологии, то.

Будем рассматривать и в качестве синонимов, если и обозначать это отношение как.

Пользователь может найти необходимые ему классы целей по их названиям. Результат этого этапа представлен в виде логического выражения на основе терминов-целей (7).

(7),, где - термин онтологии целей,,.

Для каждого термина-цели в онтологии могут быть заданы параметры, которые также являются ее классами. Пользователь при вводе запроса может задать значения этих параметров в виде терминов онтологии.

На следующем этапе для каждой группы параметризованных целей формируется ранжированный список сервисов.

Цель представляет собой шаблон сервиса. Для цели определен обязательный набор входных и выходных параметров:

, где - текстовое описание; - множество входных параметров;

- множество выходных параметров; - множество параметров, для которых могут задаваться пользовательские ограничения,.

Будем считать, что сервис соответствует цели (шаблону) тогда и только тогда, когда и. С использованием данного правила для каждой группы осуществляется поиск соответствующих сервисов. Множество сервисов кластеризуется с использованием функции вычисления семантической схожести между сервисами. Каждому кластеру затем ставится в соответствие усредненная типичная ситуация использования сервисов данного кластера.

Пусть - множество сервисов, попавших в один кластер, соответствующий набору целей. Тогда (8) Для каждой группы целей набор кластеров сортируется по убыванию значения:

где - текущая ситуация использования. Далее к каждому сервису первого кластера каждой группы применяется операция редукции. Если по результатам выполнения операции в кластере не останется ни одного сервиса, тогда она выполняется для второго кластера и т.д.

Пусть и - описания двух ситуаций, т.е. накладываемых на них ограничений. Редукция относительно вычисляется по формуле (9).

(9) Результатом операции является множество, из которого удалены все элементы, для которых.

используется для обозначения тождественно истинного выражения.

В случае, если и, соответствующее ребро графа удаляется. Вместе с этим удаляются все ребра, которые более не составляют часть пути от одной из исходной начальной вершины до одной из исходных конечных.

Если по результатам редукции ситуационная аннотация сервиса стала равной, то сервис считается нередуцируемым относительно ситуации и не может быть рекомендован к использованию.

Генерация плана выполнения цели выполняется с использованием метода иерархических сетей задач направления автоматического планирования искусственного интеллекта. Генерация вызовов базовых сервисов осуществляется с использованием операционной семантики сервисов. По мере наполнения единого хранилища составными сервисами, отражающими коллективный опыт использования, будет уменьшаться среднее время обработки пользовательского запроса, т.к. будет возрастать вероятность нахождения уже готового сервиса в хранилище.

Пятая глава посвящена апробации разработанных моделей и методов. На их основе было разработано программное обеспечение, интегрирующее мобильные сервисы для студентов университета Ниццы Софии Антиполис, созданные в рамках проекта Nice Future Campus (Ницца, Франция).

Разработана многослойная архитектура проактивной интегрированной среды взаимодействия и представлена детальная схема функционирования каждого слоя (рис. 6). Благодаря модульности и многослойности архитектуры упрощается масштабирование программного продукта и его настройка для конкретной предметной области.

В базовой версии программного продукта реализована возможность импорта SOAP- и REST-сервисов. Также на примере SAWSDL продемонстрирована возможность интеграции сервисов, для которых описана семантика. Для интеграции семантических веб-сервисов реализован модуль согласования (медиации) данных. Данный процесс частично автоматизирован, однако его полная автоматизация является сложной задачей, которая в настоящее время не решена, поэтому был разработан соответствующий интерфейс для инженера онтологий (рис. 6а).

Для реализации модуля определения ситуации использован многоагентный подход (рис. 6б). Для получения значений параметров ситуации используются формально описанные виртуальные датчики, процедура сбора данных с которых может зависеть от показаний других датчиков. Каждому датчику соответствует программный агент, осуществляется согласование данных и параллелизация опросов.

Для представления ситуационных аннотаций комплексных сервисов разработано расширение языка WSML, именуемое WSML+ (рис. 6в).

Администратор хранилища с использованием специально разработанного инструмента имеет возможность добавлять композиции сервисов для решения рутинных задач, которые загружаются в единый реестр.

Результатом ситуационной генерации сервиса является его описание на языке WSML без использования дополнительных возможностей WSML+, поскольку сгенерированный сервис представляет собой простую последовательность базовых сервисов без ситуационных аннотаций (рис. 6г). Конечный пользователь получает список рекомендованных ему сервисов, соответствующих запросу, в порядке убывания релевантности.

Слой запуска сервисов представляет собой надстройку над слоем интеграции базовых сервисов. Запуск сервисов и взаимодействие с конечными приложениями осуществляется с использованием средств WSMX. Для интеграции используются настраиваемые адаптеры протоколов.

а) Слой интеграции базовых сервисов б) Слой анализа взаимодействия в) Слой управления единым хранилищем сервисов г) Слой ситуационной генерации сервисов Рисунок 6. Многослойная архитектура проактивной интегрированной среды взаимодействия Проверка достижения цели исследования, заключающейся в повышении релевантности и эффективности использования предоставляемых потребителям электронных услуг, была выполнена путем вычисления метрик точности ( ) и полноты ( ) на основе собранных в ходе вычислительного эксперимента экспертных оценок релевантности.

Пусть - множество сервисов, выданных в результате обработки запроса, - множество сервисов хранилища и потенциальных композиций на их основе, оцененных экспертами как релевантные. Тогда точность и полнота вычисляются по формулам (10) и (11) соответственно.

(10) (11) Оценка точности и полноты была проведена для выделенных трех категорий запросов: 1) простой запрос: задана одна цель, отсутствуют ограничения; 2) запрос средней сложности: задана одна или две цели с ограничениями; 3) сложный запрос: задано не менее трех целей.

Суть вычислительного эксперимента заключалась в следующем. Была сформирована группа из 20 независимых экспертов, выбранных из команды разработчиков проекта Nice Future Campus и пилотной группы его пользователей. Перед каждым из них была поставлена задача формулировки 15 запросов: по 5 запросов каждой категории. В результате было получено 100 запросов каждой категории. Каждый эксперт для каждого своего запроса до начала его обработки должен был отметить сервисы или цепочки сервисов, которые, по его мнению, были релевантными. На основе выданных прототипом результатов и экспертных оценок были рассчитаны значения полноты и точности.

Как видно из результатов эксперимента, представленных в таблице 1, для запросов средней сложности было получено максимальное значение полноты. Это связано с тем, что чем более детальным является запрос, тем точнее можно построить композицию, однако при чрезмерном усложнении композиции может снизиться релевантность результатов. Последнее объясняется еще и тем, что в этом случае пользователю сложнее корректным образом сформулировать запрос.

Для сравнения, те же характеристики были рассчитаны при отключенном модуле определителя ситуаций, т.е. при поиске сервисов не были задействованы ситуационные аннотации сервисов. Результаты представлены в таблице 1.

Как видно из результатов эксперимента, поиск с учетом ситуационных аннотаций сервисов позволяет увеличить как полноту, так и точность для всех трех категорий запросов.

Таблица 1. Результаты сравнительного эксперимента разных видов поиска Поиск с учетом Поиск без учета Сложность запроса ситуации ситуации Точность Полнота Точность Полнота Простой запрос 73,9% 62,1% 66,3% 55,8% Запрос средней сложности 76,2% 63,4% 53,2% 56,4% Сложный запрос 74,8% 63,8% 51,0% 56,2% Поскольку на сегодняшний день не существует реализаций контекстно-зависимых паттернов (эвристик), то невозможно провести сравнительную оценку по ключевым показателям. Поэтому была предложена следующая методика, позволяющая оценить эффективность использования найденных эвристик и их ситуационных аннотаций.

Пусть - паттерн, - цель, которой он позволяет достичь.

- автоматически вычисляемое количество появлений в результатах обработки запросов.

Ц количество появлений в результатах запросов, оцененных пользователями в качестве релевантных.

- автоматически вычисляемое количество запросов, в которых хотя бы для одной из участвующих целей было бы выполнено условие (на основе онтологии целей).

Тогда относительная релевантность выдачи паттерна вычисляется по формуле (12).

(12) Востребованность паттерна можно оценить по формуле (13).

(13) Всего в ходе проведения эксперимента было автоматически выявлено 6 паттернов, среднее арифметическое значений их относительной релевантности составило 71,4%, а среднее арифметическое значений востребованности - 46,3%.

Результаты демонстрируют востребованность и релевантность выдачи автоматически обнаруживаемых эвристик. В случае отсутствия надстройки для поиска паттернов, пользователю для решения аналогичной задачи пришлось бы отдельно искать нужные сервисы и самостоятельно выполнять согласование входных и выходных данных.

В заключении формулируются основные результаты, полученные в ходе выполнения диссертационной работы, и выделяются возможные направления дальнейших исследований.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИОННОЙ РАБОТЫ 1. Проведен анализ существующих подходов к решению задачи адаптивного предоставления сервисов, стандартов описания сервисов, методов автоматической композиции сервисов, в результате сформированы требования к проактивной интегрированной среде взаимодействия, осуществляющей автоматический поиск наилучших композиций гетерогенных сервисов, соответствующих комплексной задаче пользователя, на основе анализа опыта предоставления сервисов в различных ситуациях.

2. Разработана модель единого хранилища сервисов, позволяющая унифицированным образом представить знания о гетерогенных базовых сервисах и их композициях. Модель отличается возможностью хранить семантические связи между сервисами, а также между сервисами и элементами ситуации в форме контекстно-зависимых эвристик. Модель основана на интеграции нескольких онтологий и позволяет осуществлять логический вывод для поиска фрагментов сервисов в конкретной ситуации использования.

3. Разработан метод динамического наполнения единого хранилища сервисов за счет импорта базовых сервисов и интеллектуального поиска устойчивых композиций сервисов. Уникальность метода заключается в том, что помимо композиций сервисов, он позволяет также определять факторы, влияющие на использование сервисов в определенной ситуации.

4. Разработан метод динамической генерации сервисов, позволяющий получить наиболее релевантный результат за счет использования комплексных семантических аннотаций базовых сервисов и их композиций.

5. На основе созданных моделей и методов разработано программное обеспечение, позволяющее улучшить релевантность и эффективность предоставляемых пользователям сервисов. Данное программное обеспечение апробировано в рамках проекта Nice Future Campus (Ницца, Франция).

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ Статьи в ведущих рецензируемых научных журналах и изданиях, включенных в список ВАК РФ 1. Ишкина Е.Г., Щербинина О.В. Архитектура адаптивного сервисноориентированного промежуточного программного обеспечения // Известия Волгоградского государственного технического университета:

межвузовский сборник научных статей. Серия Актуальные проблемы управления вычислительной техники и информатики в технических системах, выпуск 9, №11 (71). - Волгоград: ВолгГТУ, 2010. - с. 142-145. - ISSN 1990-5297.

2. Ишкина Е.Г. Поиск устойчивых ситуационных композиций сервисов // Научно-технический журнал Прикаспийский журнал:

управление и высокие технологии №3 (15). - Астрахань: Издательский дом Астраханский университет, 2011. - с. 12-19. - ISSN 2074-1707.

3. Ишкина Е.Г. Ситуационная генерация сервисов // Известия Волгоградского государственного технического университета:

межвузовский сборник научных статей. Серия Актуальные проблемы управления вычислительной техники и информатики в технических системах, выпуск 12, №11 (84). - Волгоград: ВолгГТУ, 2011. - с. 88-92. - ISSN 1990-5297.

Статьи в материалах международных, всероссийских конференций, в журналах 4. Miranda S., Ishkina E. NFC Mobiquitous Ecosystem for Information Services of the Future: Applications to M-tourism and M-learning // Материалы международной научной конференции Электронная культура.

Информационные технологии будущего и современное электронное обучение Modern IT & (E-) Learning, Астрахань, 6-8 октября, 2009. - с. 2328.

5. Ishkina E. Collective service intelligence management in mobiquitous systems // Proceedings of the Sixth International Conference on Internet and Web Applications and Services (ICIW 2011), Sint Maarten, The Netherlands Antilles, March 20-25, 2011. - с. 51-57. - ISBN 978-1-61208-004-8.

6. Miranda S., Pastorelly N., Ishkina E., Torre D., Chaix L. Lessons inferred from NFC mobiquitous innovative information service prototyping at the University of Nice Sophia Antipolis // Ingnierie des Systmes dТInformation №4 Vol. 16, numro spcial УSI mobiquitairesФ / Cachan (France): Lavoisier, 2011. - с. 15-48. - ISSN 1633-131.

7. Narni-Mancinelli G., Benouali H., Leitzelman M., Salvadore M., Ishkina E., Miranda S. MBDS2.0, plateforme gnrique de gestion de tags NFC et 2D pour des espaces culturels intelligents et communautaires 2.0 // Ingnierie des Systmes dТInformation №4 Vol. 16, numro spcial УSI mobiquitairesФ / Cachan (France): Lavoisier, 2011. - с. 49-62. - ISSN 1633-131.

Авторефераты по всем темам  >>  Авторефераты по техническим специальностям