Исследование основных подходов к автоматическому отображению онтологий

Дипломная работа - Компьютеры, программирование

Другие дипломы по предмету Компьютеры, программирование



поисковой оптимизации, которое находит свое применение уже сегодня.- техника векторного пространства, изначально использовалась для информационного поиска и индексации (индексирования). Предполагается, что есть основные скрытые семантические пространства, которые вычисляются (или определяются) значением (или путем вычисления) статистического метода (алгоритма), использующего ассоциативную матрицу (mXn). Следует подчеркнуть, что LSI использует структурированную информацию онтологии и WordNet (это семантические ассоциации между метриками). Структурный подход не учитывает промежуточные онтологии, т.е. метод будет работать, только для тех онтологий, в которых сохранено отношение со значениями из WordNet. WordNet был использован, потому что это хорошо продуманный и широкодоступный лексический ресурс с большим количеством записей и семантических отношений.

Отображения вычисляется на основе лексического и семантического согласования методов, которые затем используются в качестве входных данных для простого структурного алгоритма согласования, в котором использованы близость сходств концепций и свойств. Здесь, концепции/свойства включают в себя только родственные объекты и категоризируемые категории. Согласования методов было реализовано для улучшения производительности лексического и семантического согласования методов за счет использования простых структурных особенностей. Рассмотрим согласования между двумя концептами C1 и C2 источник онтологии О1 и О2, соответственно эвристика: если хотя бы два соседа концептов C1 уже (лексически или семантически) отображается на двух соседних концептах c2, то отображения отношения онтологии аксиома включения и эквивалентности, то есть подкласс C1 был сопоставлен с подклассу С2, то C1 и C2 считают структурно согласованными. Следует заметить, что дальше в процессе выравнивания, AUTOMS использует расширенную структуру метода согласования, который работает итеративно используя отображения всех методов. Этот методов расширяет близости концепций, включая свойства объекта.

Четвертый метод последовательно использует экземпляры концептов (concept instances). В частности, для концептов, которые не были определены как похожие на любой другой концепт, AUTOMS сравнивает их экземпляры, если таковые имеются. Для тех пар концептов возможно отображение, где AUTOMS обнаруживает по крайней мере один согласованный экземпляр. Согласование концепции экземпляров в настоящее время основано на сходства их локальных имен, которыми является их Uniform Resource Identifier (URI).

Пятый метод использует информацию о свойствах. Для концептов, которые не были определены как похожие на любой другой концепт, AUTOMS сравнивает их свойства, если таковые имеются. Для тех, пар концептов, которые имеют по крайней мере два соответствующих свойства, AUTOMS определяет возможность отображения. Согласование свойств объектов на основе сходства их имен свойств, а также на сходство их область определения и область распространения. Последним шагом в процессе выравнивания является выполнение расширенной структуры (enhanced) итерационного метода согласования. Этот метод использует предлагаемые совпадающие пары от всех предыдущих методов для вычисления отображения на основе расширенной близости концептов (enhanced vicinity): расширение близости концепта включает в себя все концепты, родственные с ним. Этот метод работает итеративно 2 раза, обновляя перечень предложенных совпавших пар с парами обнаруженными в каждой итерации. Было отмечено, во время тестов конкретных экспериментов, где хотя и новые отображения обнаружены в каждой итерации, нет никаких изменений в множестве отображений после второго выполнения. Дальнейшие эксперименты и исследования необходимы для улучшения этого метода.

.6 Апробация интегрированного подхода к отображению онтологий

Для тестирования выбранных алгоритмов, в рамках данной работы, были спроектированы две не сложные онтологии в предметной области: женская одежда (рис. 4.5 - 4.6). Суперкласс у обеих имеет имя - Thing, главный класс называется - женская одежда. В первой онтологии класс делится на верхнюю и нижнюю одежду, которая включает в себя кофты, брюки, юбки, куртки.

Рисунок 4.5 - Тестовая онтология №1

Во второй класс делится на подклассы: повседневная одежда, одежда для бизнеса, вечерняя и спортивная. Которая, в свою очередь, подразделяется по категориям названий одежды.

Рисунок 4.6 - Тестовая онтология №2

Предлагаемый интегрированный подход к проблеме отображения онтологий, который учитывает сложность предметной области и сравниваемых онтологий.

Для простых онтологий характеризуемых хорошо структурированной предметной областью, предлагается использовать алгоритм QOM, а для слабо структурированных и сложно формализованных - интегрированный алгоритм AUTOMS. Оба алгоритма построили онтологии, но с разной точностью. Полученные результаты позволяют сделать вывод о том, что для достижения большей точности отображения онтологий в слабо структурированных и сложно формализуемых предметных областях, целесообразно использовать подход на основе унифицированной модели, которая включает в себя декларативные описания основных понятий характеризующих определенную предметную область. Унифицированный взгляд разработчиков на решаемую проблему.

ВЫВОДЫ

В данной магистерской работе был проведен анализ предметной области, сравнительный анализ инструментов создания и ре?/p>