Доклад на конференцию ева 2007 Чуранов В. С., Чуранов А. С. Тема: Тематические карты, как подход к семантической организации знаний кафедры. Пример внедрения подхода на кафедре мультимедийных технологий и информационных систем мгуки

Вид материалаДоклад

Содержание


Система для универсального медиа-поиска
Тематические карты - модель представления данных
Рис. 1. Пример фрагмента книжного указателя
Пример использования СУМС на кафедре МТиИС МГУКИ
Рис. 3. Диаграмма отношений в тематической карте
Подобный материал:
Доклад на конференцию ЕВА 2007 Чуранов В.С., Чуранов А.С.


Тема: Тематические карты, как подход к семантической организации знаний кафедры. Пример внедрения подхода на кафедре мультимедийных технологий и информационных систем МГУКИ.


Введение


Начиная изучать определенную предметную область в рамках образовательного процесса, возникает большое количество вопросов о том, где найти информацию, как ее искать, как организовать для изучения и выбрать именно то, что нужно. Правильно организованный поиск – это учебный процесс, который помогает изучить и понять интересующий предмет или тему.

Современному студенту в настоящее время доступны два пути поиска информации для ведения научной деятельности: 1) Библиотеки 2) Интернет. Как показывает опыт, библиотеки все реже востребованы студентами в силу сложности использования библиотечных классификаторов, удаленностью от дома или работы, а Интернет не позволяет эффективно вести поиск в силу несовершенства поисковых алгоритмов и отсутствия семантической связи между запросом и результатами поиска. Как быть?


Используя опыт библиотечных справочных залов в организации доступа к знаниям и, имея возможность доступа к информации библиотек и архивов посредством Интернет, можно создать систему позволяющую во многом сократить время поиска нужных документов, организовать эффективную работу с ними. Нами сейчас ведется работа над демо-версией такой системы для Универсального Медиа-поиска (SUMS - System for Universal media searching). С основными возможностями системы можно ознакомится на сайте ссылка скрыта или из материалов прошлых конференций.


Прежде чем остановиться на основном вопросе данного доклада - тематических картах, как средстве организации и представления знаний, скажу несколько слов о самой системе и ее применении.


Система для универсального медиа-поиска


Под руководством профессора Кима Вельтмана ведется разработка данной системы. С ее помощью можно накапливать информацию по интересующей предметной области в пакет знаний и организовывать последующую с ней работу. Пакеты знаний формируются экспертами путем ручного внесения новых данных или автоматизированным способом, используя протокол Z39.50.

Основой SUMS являются пакеты научных знаний, которые формируются на определенную тему. Вся информация в системе подразделяются на уровни. Это могут быть предметные классификации, словарные описания, энциклопедические справки, библиографии, персоналии и др. Многоуровневая система и семантическая модель данных позволяют наглядно представить предметную область, как логически-организованную структуру знаний.

Поиск ведется в тематическом пакете знаний, сформированном экспертами в данной области. Таким образом проблема нахождения семантически неверных документов отпадает. Это можно сравнить с поиском информации в тематическом зале библиотеки, где информация собрана по определенному признаку. Остается вопрос оптимального поиска нужных материалов среди большого объема информации пакета знаний. Для этого используется принцип шести вопросов: Кто? Что? Где? Когда? Как? Почему? Эти шесть вопросов не исключают друг друга. Это всего лишь различные пути получения одной и той же информации. Выбор вопроса зависит от того, хочет ли пользователь найти отдельный медиа-объект и его описание, либо хочет получить библиографические, хронологические сведения о предмете. Описанный поиск позволяет получить доступ к одним и тем же фактам, но в используемых в разном контексте.

Благодаря использованию стандарта тематических карт (topic maps) для организации модели данных система универсальна и может использоваться для информационного обеспечение различных процессов.

Эксперт получает: эффективное управление и расширение объема знаний по заданной предметной области, персональное обеспечение учебного процесса, online доступ и обмен учебными материалами.

Пользователь получает: эффективный семантический поиск материалов, глубокое целостное погружение в изучаемую область знаний, визуальное восприятие информации, развитие индивидуального взгляда на предметную область.

На конференции будет продемонстрировано, как СУМС может быть применима на кафедре мультимедийных технологий и информационных систем МГУКИ.

Тематические карты - модель представления данных

Тематические карты (Topic maps) – стандарт ISO/IEC 13250 был предложен организацией International Organisation of Standardizations в 2000 году, а в 2002 консорциумом WWW был адаптирован для использования в Web. Стандарт представляет очень простую и в тоже время очень мощную мета-модель организации и представления знаний. Используя язык XML, данный стандарт позволяет описать сложные отношения между абстрактными понятиями определенной области знаний и связать их с реальными информационными ресурсами.

Прототипом идеи семантической организации тематических карт является предметный указатель (предметный индекс) в книге, отражающий содержание используемых в ней понятий с указанием ссылок на соответствующие страницы. Поиск чего-то в книге может сократиться до поиска в указателе. Если этого нет в указателе, можно быть уверенным, что этот вопрос не освещен в книге. Если же необходимая информация содержится в указателе, он точно ведет к искомой информации.



Рис. 1. Пример фрагмента книжного указателя


Тематическую карту можно рассмотреть как электронный указатель, включающий принцип книжного указателя и объединяющий в себе различные технологии:
  • Комплексные метаданные
    Тематические карты содержат информацию об информационных ресурсах. Это не является частью информационных ресурсов, а создается и хранится отдельно.
  • Поисковый индекс1i
    Поиск в тематической карте, сформированной экспертом, предоставляет лучшие результаты, чем поиск в полнотекстовом индексе, автоматически сформированном поисковым роботом.
  • Семантическая сеть
    Тематические карты – хорошо организованные семантические сети, помогающие не потеряться пространстве информации.
  • Структура знаний
    Тематические карты – технология моделирования и навигации знаний. Отсюда следует значимость тематических карт в управлении знаниями.



Таким образом, с помощью тематических карт возможно создавать каталог информации, который расположен отдельно от самой информации, как показано на рис. 2.



Рис. 2. Схематичное изображение тематической карты




Рис. 3. Пример указателя в конце книги, представляющего основные идеи

тематических карт

Основная концепция этот модели очень проста. В ее основе лежат три понятия: объект, вхождение и ассоциация.


  • Объекты представляют понятия реального мира и имеют названия.
  • Вхождения понятий указывают на значимые для данного понятия информационные ресурсы, источники.
  • Ассоциации связывают родственные понятия.
  • Классы понятий, классы вхождений и ассоциативные классы помогают различать различные виды понятий, их расположения и ассоциаций соответственно.



Такая схема организации позволяет управлять значением информации, а не просто самой информацией.

Чарльз Ф.Голдфарб, разработчик языка SGML и отец языков разметки, назвал тематические карты «GPS в информационном пространстве». Как глобальная система навигации помогает не потеряться в материальном пространстве и направляет к месту назначения, так тематическая карта показывает, где конкретно вы находитесь в информационном пространстве и куда нужно идти, чтобы найти необходимую информацию. Как GPS спутники посылают сигналы на GPS устройства, отображая координаты и направление движения, так тематические карты «посылают» свои «сигналы» на специальное «устройство», показывая пользователю, что он в данный момент рассматривает и куда идти, чтобы найти определенную информацию.

Тематические карты имеют расширенные возможности по сравнению с печатным книжным указателем. Среди них: адаптация информации под браузер (настольный ПК, КПК, мобильный телефон), просмотр части указателя, многоязычность, ссылки на более чем один вид информационных ресурсов (PDF, веб-сайты, аудио, видео, изображения и др.), объединение тематических карт и др.

В настоящее время наиболее часто тематические карты используются для разработки информационных порталов, экспертных систем, систем дистанционного образования.

Описанные выше особенности, гибкость и нацеленность на определенную предметную область, а не на все информационное пространство, повлияли на выбор стандарта тематических карт для организации модели знаний в рамках разрабатываемой системы.


Пример использования СУМС на кафедре МТиИС МГУКИ


Первая задача, которую требуется решить в рамках данной работы - это собрать в единый пакет знаний информацию по работе кафедры (персоналии, дисциплины, учебные материалы, мероприятия и др.) и предоставить общий доступ с возможностью поиска.

В качестве классов информационных объектов были выбраны: персоналии, дисциплины, произведения, проекты, термины. Объекты данных классов связаны между собой различными отношениями. Например: «книга-автор», «дисциплина-мероприятие», «дисциплина-профессор» и др. Список классов объектов, отношений и ресурсов может быть легко расширен.



Рис. 3. Диаграмма отношений в тематической карте


Второй вариант использования системы рассчитан на преподавательский состав. Представим, что перед началом учебного года преподаватель (эксперт) формирует некую карту знаний по своему предмету, которая содержит ссылки на предметную классификацию, ссылки на словарные определения, энциклопедические описания, библиографические сведения, полнотекстовые ресурсы и все что имеет отношение к предмету. Такая карта знаний может совершенствоваться, изменяться и наполняться с течение времени, как преподавателем, так и самими студентами.

Литература

1. Dicheva, D. & Dichev, C. (2006). TM4L: Creating and Browsing Educational Topic Maps, British Journal of Educational Technology - BJET, 37(3), 391-404. ssu.edu/iis/nsdl/Publications/BJET06-Dicheva-Dichev-Submitted.pdf

2. International Standard ISO/IEC 13250, doe.gov/capabilities/sgml/sc34/document/0322_files/iso13250-2nd-ed-v2.pdf

3. Steve Pepper, The TAO of Topic Maps: finding the way in the age of infoglut, map.com/topicmap/resources.php

4. Kal Ahmed and Graham Moore (2005). An Introduction to Topic Maps. rosoft.com/en-us/library/aa480048.aspx

5. Чуранов В.С, Чуранов А.С (2006), Эффективный поиск информации для образовательной и научной деятельности, Вестник МГУКИ 3'2007, y.ru/articles/libsearch.htm

6. Kim Veltman, Understanding New Media: Augmented Knowledge and Culture, University of Calgary Press (2005, c. 600 p).

i Полнотекстовый индекс. Наиболее известными и повсеместно используемыми являются так называемые «полнотекстовые» индексы. Как видно из названия, полнотекстовый индекс включает все слова из текста, за исключением некоторых стоп-слов: определенного артикля, неопределенного артикля, союзов.

Существует большая разница между поиском в прикнижном указателе, составленном по какому-либо признаку, и поиском в полнотекстовых индексах. Поиск в прикнижном указателе более точный так как поиск ведется только по значимым понятиям. Поиск же в полнотекстовых индексах рассматривает все слова из текста (даже те, что образуют несущественные «помехи»), и поэтому выбирает незначимые совпадения, перемешанные со значимыми. Еще хуже то, что приходится просмотреть все совпадения прежде, чем понять, что важно, а что нет. Неэффективность поиска приходится наблюдать постоянно в работе популярных поисковых систем.