Исследование основных подходов к автоматическому отображению онтологий

Дипломная работа - Компьютеры, программирование

Другие дипломы по предмету Компьютеры, программирование



МАГРЖСТЕРСЬКА РОБОТА

Дослiдження основних пiдходiв до автоматичного вiдображення онтологiй

РЕФЕРАТ

Дипломная работа содержит 88 с., 11 рис., 1 табл., 21 источников, 1 приложение.

Магистерская аттестационная работа посвящена исследованию основных подходов к проблеме автоматического отображения онтологий. В работе рассматриваются задачи устранения структурных неоднозначностей.

Проведен детальный анализ существующих программных средств и методов для автоматического отображения онтологий, рассматривается их практическое применение в зависимости от поставленной задачи и сложности входных онтологий.

ОТОБРАЖЕНИЕ, ОНТОЛОГИЯ, МЕТОД, КОНЦЕПТ, СЕМАНТИКА, НЕОДНОЗНАЧНОСТЬ, ПОДХОД.

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ

.1 Инструменты для работы с онтологиями

.2 Инструменты для отображения и объединения

.3 Сравнительный анализ инструментов работы с онтологиями

.4 Проекты, использующие онтологии

. ПОСТАНОВКА ЗАДАЧИ

. МЕТОДЫ ОТОБРАЖЕНИЯ ОНТОЛОГИЙ

.1 Ручное отображение онтологий. Методы ручного отображения

.2 Автоматическое отображение онтологий

.3 Методы автоматического отображения онтологий

3.4 Проекты, использующие методы ручного и автоматического отображения

. ИНТЕГРИРОВАННЫЙ ПОДХОД К РЕШЕНИЮ ПРОБЛЕМЫ ОТОБРАЖЕНИЯ ОНТОЛГИЙ

4.1 Критерии подобия концептов онтологий

.2 Меры близости концептов онтологий

.3 Семантическое расстояние между концептами онтологий

.4 Быстрый алгоритм отображения для простых онтологий

4.5 Отображение сложных онтологий с помощью алгоритма повышенной точности

4.6 Апробация интегрированного подхода к отображению онтологий

ВЫВОДЫ

ПЕРЕЧЕНЬ ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

ВВЕДЕНИЕ

Развитие онтологий начинает приобретать более массовый характер, и в настоящее время в этой области есть ряд масштабных разработок. Согласно определению Т. Грубера, онтология - это спецификация концептуализации предметной области [1]. Это формальное и декларативное представление, которое включает словарь понятий и соответствующих им терминов предметной области, а также логические выражения (аксиомы), которые описывают множество отношений между понятиями. Для описания отношений в онтологиях используются весь арсенал формальных моделей и языков, разработанных в области искусственного интеллекта - исчисление предикатов, системы продукций, семантические сети, фреймы и т.п. Таким образом, термин онтология оказался близок по значению к термину искусственный интеллект, а термин онтологический инжиниринг явился синонимом термина инженерия знаний. На сегодняшний день существует не менее десятка зарубежных систем, относимых к классу инструментов онтологического инжиниринга, которые поддерживают различные формализмы для описания знаний и используют различные машины вывода из этих знаний. Наиболее известные из них - это Protg, CYC, KAON2, OntoEdit. Среди уже разработанных онтологий наиболее известными и объемными являются CYC и SUMO.

Разработано большое количество онтологий в различных предметных областях, но мир очень быстро изменяется, идет развитие новых отраслей, существующие онтологии требуют постоянного пополнения и усовершенствования. На данном этапе появляются идеи использования автоматических и полуавтоматических методов для интеграции онтологий.

Работа посвящена исследованию существующих подходов к отображению онтологий. Отображение онтологий является неотъемлемой частью большинства задач согласования онтологий, таких как слияние, выравнивание онтологий, модификация одной онтологии для достижения однородности с другой и так далее. В работе предоставлен анализ самых известных подходов к проблеме отображения онтологий. Актуальность работы состоит в том, что данное направление интенсивно развивается в современном мире. Многие ученые работают над созданием автоматических и полу-автоматических систем отображения онтологий, которые будут работать с минимальным воздействием на них человеческого фактора. В работе рассмотрены 2 основных алгоритма отображения, протестированы на реальных онтологиях и на основе полученных результатов, даны рекомендации по их использованию, для различных задач и целей.

На сегодняшний день, нет методов полностью автоматического отображения, а под ним предполагают такую организацию этого процесса, при которой первоначальный перечень терминов предметной области и структура их взаимосвязей автоматически выявляются программными средствами на основании статистической обработки результатов лингвистического анализа коллекции текстов, после чего верифицируются и структурируются экспертом в соответствии с его имплицитной моделью знаний и прагматическими требованиями прикладной системы, для которой разрабатывается онтология.

1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ

Понятие онтология сейчас активно применяется в информатике и искусственном интеллекте. Этот термин пришел из философии, где обозначал часть метафизики - учение о всем сущем, о его наиболее общих философских категориях, таких как бытие, субстанция, причина, действие, явление. При этом онтология как наука претендовала на полное объяснение причин всех явлений.

В инженерии знаний под онтологией понимается детальное описание некоторой проблемной облас