Исследование основных подходов к автоматическому отображению онтологий

Дипломная работа - Компьютеры, программирование

Другие дипломы по предмету Компьютеры, программирование



оцесса, при которой первоначальный перечень терминов предметной области и структура их взаимосвязей автоматически выявляются программными средствами на основании статистической обработки результатов лингвистического анализа коллекции текстов, после чего верифицируются и структурируются экспертом в соответствии с его имплицитной моделью знаний и прагматическими требованиями прикладной системы, для которой разрабатывается онтология.

3. МЕТОДЫ ОТОБРАЖЕНИЯ ОНТОЛОГИЙ

В основном к задачам отображения подходят с практической точки зрения, в зависимости от поставленной цели перед разработчиком. Поэтому нет единственно правильного определения отображения онтологий. Кудрявцев определяет отображение онтологий (ontology mapping), как деятельность по установлению соответствия между несколькими онтологиями [24]. В работах J. Euzenat и P. Shvaiko отображение рассматривают, как направленный вариант выравнивания онтологий (оntology аlignment). Процесс построения правил отображения понятий одной онтологии в понятия другой, либо как результат этого процесса, то есть, множество правил отображения одинакового направления, таких что элементы отображаемой онтологии присутствуют в нём максимум единожды. [25] На основе выше упомянутых определений, под отображением онтологий будем понимать, процесс, при котором понятия одной онтологии выражаются через понятия другой. Корректно термин отображения рассматривать в двух ракурсах: как процесс отображения одной онтологии в другую или как результат такого процесса, то есть множество функций отображения понятий одной онтологии в понятия другой. [26]

Отображение онтологий является неотъемлемой частью большинства задач согласования онтологий, таких как слияние, выравнивание онтологий, модификация одной онтологии для достижения однородности с другой и так далее.

Модели данных, используемые сегодня в качестве онтологических, либо неформальны, либо включают достаточно простые средства спецификации для возможности использования автоматического формального вывода, довольствуясь описаниями структурных спецификаций понятий и простых ограничений над ними. Поэтому большинство методов, используемых для отображения онтологий, предварительно связывают понятия по вербальной информации (именам понятий, определениям), и затем на основе полученных связей оперируют со структурными спецификациями, оценивая их близость, обнаруживая и устраняя разного рода конфликты.

Проблема отображения онтологий является актуальной с самого начала использования онтологий при создании информационных систем. Анализ состояния исследований соответствующих методов показал, что эта тема исследована до сих пор недостаточно глубоко. Разрабатываемые методы, в основном, неформальны и имеют множество открытых вопросов.

Принципы и методы отображения онтологий остаются предметом дискуссий, при создании систем вопросы отображения онтологий до сих пор предпочитают избегать. Наименее исследованы методы отображения онтологий, разработанных в неоднородных онтологических моделях. Говоря о неоднородных онтологиях, мы подразумеваем, что две (или более) онтологии по-разному описывают одну и ту же предметную область или близкие предметные области с точки зрения разных сообществ. Онтология задаёт подразумеваемую семантику для понятий предметной области и определяет онтологический контекст, в котором работает сообщество. . В результате, семантика понятий в контекстах, описанных разными онтологиями, может быть сходной при различных подходах к описанию их структуры: составу, ограничениям и степени детализации.

.1Ручное отображение онтологий. Методы ручного отображения онтологий

Ручное отображение онтологий - деятельность по установлению соответствия между несколькими онтологиями [24].

Проблема отображения онтологий заключается в том, что:

. Сущности (классы, свойства, связи, объекты) имеющие одинаковые имена могут иметь разный смысл;

. Сущности (классы, свойства, связи, объекты) имеющие одинаковый смысл могут иметь разные имена.

Отображение онтологий разделяется на 2 подзадачи:

. Локальное отображение сущностей, подразумевающее независимую установку соответствий между двумя сущностями, рассматриваемых онтологий;

. Глобальное отображение сущностей, в рамках которого, подразумевается пересмотр (пересчет) локальных отображений с учетом отображений всех остальных элементов.

Для обеспечения максимальной точности отображения сущностей при ручном режиме отображения выделяют 4 основных метода:

) Лингвистический/Лексический/Текстовый анализ сущностей онтологий

На данном этапе определяется сходство между сущностями на основе сравнения имен сущностей (оценка количества совпадающих символов, общие части слов, например, Цели и Целевые установки) или путем анализа синонимичных терминов. Для выявления синонимичных терминов могут использоваться существующие словари общей и профессиональной лексики, тезаурусы. Данный вид анализа можно считать исходным для установления соответствия между сущностями.

) Структурный анализ сущностей онтологий

.1) Анализ внутренней структуры сущностей онтологий

В данном случае оценка сходства производится на основе анализа доменов и областей допустимых значений для атрибутов и связей. Методы анализа внутренней структуры иногда называются методами на основе ограничений. Сущностей со схожей внутренней структурой, а также с?/p>