Исследование основных подходов к автоматическому отображению онтологий
Дипломная работа - Компьютеры, программирование
Другие дипломы по предмету Компьютеры, программирование
.
На первом этапе отображения необходимо найти отправную точку, назовем ее связующим звеном двух онтологий, старта алгоритма. Выделяют несколько методов ее обнаружения:
-текстовые совпадения;
-совпадения иерархических отношений;
-совпадение форматов и данных.
Под текстовыми совпадениями подразумевается идентичность имен понятий (здесь также учитываются родственные слова), текстовых определений (сравнение строк, исключение стоп-слов и др.). Иерархическое совпадение предусматривает поиск общих вышестоящих понятий, фильтрацию неоднозначностей, нахождение семантического расстояния. Под фильтрацией неоднозначностей, следует понимать, выбросы зашумленных данных, не совпадение названий понятий в двух онтологиях. Выбор семантического расстояния зависит от поставленной задачи и конечного результата. Совпадение форматов и данных опирается на внутри понятийные отношения и ограничения на заполнение слотов. После отработки алгоритмов используется функция, которая учитывает результаты всех процедур и выдает общий коэффициент совпадения. Нахождение связующего звена включает в себя также процедуру валидации, т.е. сверка заданных требований с полученным результатом, в ходе которой происходит проверка с учетом иерархических связей соотносимых понятий. Эта процедура пытается найти несоответствия понятий, цикличность отображения, проверить наследование свойств [27].
Для выявления идентичности понятий используются специально созданные критерии. Так, комплексный критерий, предложенный Н. Гуарино, проверяет сходство по нескольким параметрам:
-материал: идентичность материала, из которого сделаны экземпляры сравниваемых понятий;
-топологический: идентичность формы экземпляров сравниваемых понятий;
-морфологический: те части, из которых состоят экземпляры сравниваемых понятий;
-функциональный: использование;
-меронимический: экземпляры понятий;
-социальный: социальная роль [27].
Учитываются также возможные стандартные метонимические переносы, которые делают онтологию более гибкой и расширяют возможность нахождения близких по содержанию понятий.
Метонимия (греч. переименование) механизм речи, состоящий в переносе названия с одного класса объектов или единичного объекта на другой класс или отдельный предмет, ассоциируемый с данным по смежности, сопредельности, принадлежности или иному виду контакта; например: выпить две чашки кофе, где чашка (сосуд) означает меру жидкости. Действие механизма метонимии приводит к появлению нового значения или контекстно - обусловленному изменению значения слова. Основой метонимии могут служить отношения между однородными и неоднородными категориями, например предметами и их признаками (действиями). Регулярные отношения между предметами или действием и предметом определяют контактное положение соответствующих им слов в тексте. В этом случае метонимия часто возникает за счет эллипсиса (сокращения текста); например: Слушать музыку Шопена и Слушать Шопена.
Описанные методы являются полуавтоматическими, то есть сначала автоматически генерируются варианты соответствий, а потом вручную в несколько этапов происходит соединение онтологий. Статистика показала, что эти процедуры обладают достаточно высокой степенью точности и дают хорошие результаты [27]. Так, использование подобных автоматических алгоритмов отображения при построении онтологии SENSUS дало более 90% точности. Онтология разрабатывалась группой исследователей по компьютерной обработке естественного языка, основным направлением которой является машинный перевод и реферирование текста.
При отображении онтологий может возникнуть ряд проблем, которые может быть достаточно сложно решать автоматическими методами. Так эксперты в разных областях могут отсылать к одному и тому же понятию и понимать его различным образом. Проблемы возникают и тогда, когда одно и то же слово используется для обозначения различных понятий в каждом отдельном поле. Решением такой проблемы может быть более тесная коммуникация составителей онтологий, а также использование более широких онтологий, применимых к различным областям знания.
.3 Методы автоматического отображения онтологий
Выбор предпочтительных методов к отображению онтологий должен производиться в первую очередь не из соображений эффективного обнаружения совпадений в именах или структурных описаниях понятий, хотя это также необходимо. Основной критерий отображения понятий онтологии - близость и непротиворечивость подразумеваемой понятийной семантики.
.Если предположить, что хорошо специфицированные онтологии точно отражают семантику понятий, то важны формальные методы, доказательно сохраняющие семантику при отображении понятий друг в друга.
.Необходимо иметь на вооружении методы, позволяющие находить сходства и различия в понятийной семантике, вне зависимости от сходства и различия в описаниях их структуры. Эти методы должны быть также формальными, чтобы с высокой долей уверенности обосновывать связи понятий.
Существуют 4 основных подхода автоматического отображения:
) Отношение уточнения спецификаций сущностей онтологий.
Формальный критерий корректности отображения спецификаций, в том числе, спецификаций абстрактных типов данных и онтологических понятий, представляемых средствами абстрактных типов данных. Таким критерием является отношение уточнения спецификаций, пришедшее из теории ?/p>