Исследование основных подходов к автоматическому отображению онтологий
Дипломная работа - Компьютеры, программирование
Другие дипломы по предмету Компьютеры, программирование
?ованных информационных ресурсов над Wеb-сайтами со слабоструктурированными данными, при построении цифровых (электронных) библиотек.
В работе рассмотрены критерии и мультикритерии подобия онтологий. На этой основе дан обзор методов автоматического отображения онтологий. Рассматриваемые критерии подобия онтологий построены на основе подобия сущностей соответствующих семантических сетей, дескриптивной логики, ограничений и правил и пр. Все критерии являются транзитивными: если А подобно В, и В подобно С, то А подобно С. Таким образом, рассматриваемые критерии можно использовать для установления подобия более, чем двух онтологий.
Для иллюстраций в работе используется язык описания онтологий OWL (Web Ontology Language).
Компоненты, из которых состоит онтология, зависят от используемой модели онтологии. Обычно онтология описывается с помощью
-концептов (понятий, классов, сущностей, категорий),
-атрибутов концептов (слотов, свойств, ролей),
-отношений между концептами (связей, зависимостей, функций),
-дополнительных ограничений (аксиом, фасет).
Элементы предметной области (элементы данного концепта) называются экземплярами. Зависимость между концептами, которая включает в себя необходимое условие и следствие выполнения этого условия, называется правилом. Онтология вместе с множеством соответствующих экземпляров составляет базу знаний.
Подобие некоторых сущностей x, y определяется с помощью функции подобия sim(x,y)[0,1], которая обладает следующими свойствами :
-sim (x,y)=1x=y (объекты x, y идентичны);
-sim(x,y)=0 (объекты x, y совершенно разные и не имеют схожих характеристик);
-sim(x,y)=1 (свойство возвратности функции подобия);
-sim(x,y)=sim(y,x) (свойство симметричности функции подобия).
Пусть O1, O2 - рассматриваемые онтологии, bi,jOi - некоторая сущность онтологии Oi, i=1,2. Подобие сущностей b1,2, b2,1 означает, что sim(b1,2, b2,1)t, где t - пороговая величина (уровень подобия, уровень отсечения).
Отображение онтологии O1 на онтологию O2 означает попытку найти для каждого из концептов онтологии O1 подобный ему концепт в онтологии O2. Другими словами, отобразить онтологию O1 на онтологию O2 означает отобразить каждую из сущностей b1,2 онтологии O1 на соответствующую сущность b2,1 онтологии O2.
Если онтология O2 есть отображение онтологии O1, то этот факт записывается в виде map(O1)= O2.
В работе было выделено 19 критериев подобия для автоматического отображения онтологий:
) Критерии на основе подобия идентификаторов или URI сущностей.
Критерий L1. Первым из критериев этого класса является критерий на основе идентификаторов сущностей (меток). Критерий формулируется следующим образом: если метки двух сущностей подобны, то эти сущности подобны. Вместо имен сущностей могут сравниваться имена их синонимов (с использованием существующих словарей общей и профессиональной лексики или тезаурусов).
Критерий L2. Критерий строится на основе идентификаторов сущностей, уникальных для каждой из сущностей, например, URI (Uniform Resource Identifier) и формулируется следующим образом: если две сущности имеют подобные URI, то эти сущности подобны.
) Критерии на основе семантической сети онтологии.
Критерий L3. Поскольку сущности состоят в отношениях с другими сущностями через свои атрибуты, имеет место следующий критерий подобия: если атрибуты двух сущностей подобны, то эти сущности подобны.
Критерий L4. Ограничить отношения между сущностями можно путем задания области применения (domain) и диапазона (range) соответствующих атрибутов сущностей. Это обстоятельство позволяет сформировать следующий критерий подобия отношений: если область применения и диапазон двух отношений подобны, то такие отношения подобны.
) Критерии на основе дескриптивной логики.
Критерии данного класса охватывают онтологии, которые обладают сложностью, достаточной для их описания дескриптивными логиками.
Здесь умные люди, книги и умный человек - концепты; читают - отношение; Сергей - экземпляр. Экземпляр Сергей наследует отношение родительского понятия. Пример дескриптивной логики на языке OWL имеет вид, который изображен на рисунке.
Таблица 4.1 - Пример дескриптивной логики
Отношение двух концептовОтношение экземпляра и концептаОтношение экземпляра и концептаумные люди читают книгиСергей читает книгиСергей - умный человек
Критерий L5 формируется, исходя из посыла, что подобные концепты с большой вероятностью имеют подобные родительские понятия: если родительские понятия двух концептов подобны, то сами концепты также подобны.
Критерий L6 основан на подобии дочерних понятий: если дочерние понятия сравниваемых концептов подобны, то эти концепты также подобны.
Рисунок 4.1 - Пример дескриптивной логики написанный на языке OWL
Критерий L7 основан на подобии концептов, относящихся к тому же уровню иерархии понятий: если концепты имеют подобные концепты того же уровня иерархии, то они также подобны.
Критерии L8 , L9 строятся на основе подобия атрибутов дочерних и родительских сущностей:
-если подобны атрибуты дочерних сущностей, то атрибуты родительских сущностей также подобны (L8);
-если подобны атрибуты родительских сущностей, то атрибуты дочерних сущностей также подобны (L9).
Критерий L10. Поскольку, как отмечалось выше, экземпляр представляет собой элемент соответствующего концепта, он наследует все атрибуты этого концепта. Поэтому имеет место следующий критерий подобия: если концепты включают в себя подобны?/p>