Теоретические аспекты инженерии знаний

Вид материалаЛекция

Содержание


Онтологии и онтологические системы
О понимают упорядоченную тройку вида: О =
Системы и средства представления онтологических знаний
Подобный материал:
1   2   3   4   5   6   7   8   9   10   11
^

Онтологии и онтологические системы



Онтология (греч. онтос – сущее, логос – учение) – термин, определяющий учение о бытии, о сущем, в отличие от гносеологии – учения о познании. Автор термина Х. Вольф (1679-1754). В философскую литературу ввел немецкий философ Р. Гоклениус. Являлась частью метафизики. Изучает абстрактные и общие философские категории: бытие, субстанция, причина, явление, действие.

Определение онтологии, предложенное в рамках разработки стандартов на мультиагентные системы международным сообществом FIPA (Foundation for Intelligent Physical Agents):

В философском смысле можно ссылаться на онтологию как на определенную систему категорий, являющихся следствием определенного взгляда на мир.

С точки зрения понятий ИИ, онтология – это формально представленные на базе концептуализации знания. Концептуализация предполагает описание множества объектов и понятий, знаний о низ и связей между ними.

В простейшем случае онтология описывает только иерархию концептов. В более сложных случаях в неё добавляются подходящие аксиомы для выражения других отношений между концептами. Учитывая вышесказанное, онтология представляет собой базу знаний, описывающую факты, которые предполагаются всегда истинными на основе общепринятого смысла используемого словаря. Для определенности дальнейшего изложения будем считать, что

Онтологии – это БЗ специального типа, которые могут «читаться» и пониматься, отчуждаться от разработчика и/или физически разделяться пользователями.
Модели онтологии и онтологической системы

Под формальной моделью онтологии ^ О понимают упорядоченную тройку вида:

О = ,

где Х – конечное множество концептов (понятий, терминов) предметной области,

К – конечное множество отношений между концептами,

Ф – конечное множество функций интерпретации, заданных на концептах.

Множество Х – конечное и непустое. В случае К =  и Ф =  онтология трансформируется в простой словарь. Онтологии-словари имеют ограниченное использование, т.к. не вводят смысла терминов. Пример: индексы машин поиска информации в сети Интернет. Для представления модели онтологии, которая нужна для решения задач обработки информации в Интернете, требуется отказаться от предположения К = . Для этого введем специальный подкласс онтологий – простую таксономию:

О = Т =<Х,{is_a}, {}>.

Под таксономической структурой понимают иерархическую систему понятий, связанных между собой отношением is_a (быть элементом класса). Такое отношение позволяет организовать структуру понятий онтологии в виде дерева.

Жизненный цикл создания онтологии


Концептуализация






































В настоящее время исследования в области онтологий и онтологических систем являются «горячими точками» не только в ИИ, но и в работах по интеллектуализации информационного поиска в среде Интернет, в работах по мультиагентным системам, в проектах по извлечению знаний из текстов на естественном языке. Онтологии можно классифицировать по:
  • степени зависимости от конкретной задачи или ПО,
  • уровню детализации аксиоматизации,
  • природе предметной области.

По степени зависимости от конкретной задачи различают: онтологии верхнего уровня, онтологии, ориентированные на ПО, на конкретную задачу и прикладные онтологии.

^ Системы и средства представления онтологических знаний

Одним из ключевых аспектов в исследованиях пространства знаний в среде Интернет являются алгоритмические и программные средства представления онтологических знаний. Общей целью таких проектов является разработка новых подходов к построению пространств знаний и средств работы с ними, где бы обеспечивались:
  • использование семантики для управления процессом ответа на запросы;
  • возможность построения ответов с хорошо определенной семантикой, которые могли быть обработаны программными агентами;
  • возможность гомогенного доступа к информации, которая физически распределена и гетерогенно представлена в Интерненте;
  • получение информации, которая явно не присутствует среди фактов, полученных из сети, но может быть выведена.

Примеры:

Международный проект (КА)² - Аннотация знаний сообществом приобретения знаний. Цель: интеллектуальный поиск в среде Интернет и автоматическое накопление новых знаний, онтологический инжиниринг.

Проект Ontobroker (1998) - интерфейс формулирования запросов, машина вывода ответов, собственно машина доступа к ресурсам – «червяк».

Проект SHOE – ориентирован на добавление к Web-страницам семантической информации и соотнесение ее с онтологиями соответствующих предметных областей. Главные направления исследований: разработка множества повторно используемых онтологий, создание средств проектирования онтологий.

До недавнего времени в распоряжении Интернет-авторов почти исключительно использовался язык HTML. Он обладает рядом недостатков:
  • жесткая ориентация на визуализацию;
  • единственная «точка зрения» на данные;
  • нерасширяемость;
  • ограниченные средства спецификации семантической структуры документов.

Разработанный специалистами W3C в 1998 году язык XML (eXtensible Markup Language) стал существенно мощнее. В нем фиксирован стандарт на определение синтаксиса и единообразие средств разметки новых тегов. А это позволяет конструировать новую маркировку Web-документов и обеспечивает возможность программным агентам понимать и обрабатывать XML-документы.

Каждый XML-документ обладает определенной логической и физической структурой. Физически это композиция элементов, называемых единицами (entities), которые могут быть связаны взаимными ссылками. Логически документ состоит из деклараций, единиц, комментариев, собственно текстов и инструкций обработки. Все теги – парные, а конструкции могут быть вложены друг в друга, образуя правильно построенное дерево.


ЛЕКЦИЯ 8