Книги, научные публикации

ИСПОЛЬЗОВАНИЕ ОНТОЛОГИЙ В СИСТЕМЕ СЕМАНТИЧЕСКОГО АНАЛИЗА КЕЙСОВ А.В. Шишин, аспирант факультета бизнес информатики и прикладной математики Нижегородского филиала Государственного университета - Высшей

школы экономики О.Р. Козырев, профессор факультета бизнес информатики Государственного университе та - Высшей школы экономики okozyrev Доказавший свою эффективность на практике кейс метод сегодня активно применя ется многими учебными заведениями. Нелинейность кейсов обусловливает необходимость наличия развитых средств компьютерной поддержки процесса обучения, обладающих функциями семантической обработки. В работе формулируются концепции применения онтологий в информационной системе, призванной повысить эффективность решения преподавателями, практикующими кейс метод, задачи отбора релевантного материала, формирования последовательности кейсов и ее адаптации к обучаемым.

Применение информационных технологий привело к увеличению спроса на образовательные в сфере образования продукты. Одно из направлений в области компью сследование вопроса разработки и приме терной поддержки процесса обучения - разработка нения различного рода компьютерных си и развитие сетевых образовательных средств и про Истем в образовательных целях насчитывает дуктов, ориентированных на различные категории длительную историю. Сегодня в фокусе внимания обучаемых, например, поддержка программ ди преподавателей и исследователей находятся не про станционного обучения. В спектр таких проектов блемы создания отдельных пакетов прикладных попадают и различные информационно образова программ (основная задача сводилась к обеспече тельные порталы [3] - огромные массивы данных и нию практических занятий и лабораторного прак знаний. Наиболее эффективные из них построены тикума), а вопросы проработки концепций и созда на базе онтологий, описывающих семантику пред ния масштабных информационно образователь ставленных ресурсов [4].

ных сред, понимаемых как совокупность знаний, Одна из самых сложных проблем в работе над средств их представления и обеспечение доступа автоматизированными средствами обучения - про к ним различных категорий пользователей [1]. блема адаптации учебного материала к группам Существующая методологическая база в этой обучаемых с разным уровнем подготовки.

области позволяет создавать образовательные ком Большинством учёных констатируется факт от плексы, включающие в себя: учебные пособия;

ставания методических аспектов информационных автоматизированные учебные курсы;

различные технологий обучения от развития технических программные тренажёры. Последние служат основ средств. К существующим проблемам добавляются ным средством приобретения и освоения обучае и такие аспекты, как распространение сравнитель мыми так называемых неартикулируемых знаний, но новых методов обучения, несущих в себе новые таких как профессиональная интуиция и опыт, трудности существующим системам [1].

которые невозможно передать через текст [2]. Один из таких методов, зарекомендовавший себя Развитие информационных технологий, тоталь у преподавателей разных учебных заведений и полу ное распространение Интернета, обеспечившего чивший широкое распространение сравнительно широкую доступность информационных ресурсов, недавно, - это кейс метод, или метод анализа БИЗНЕС ИНФОРМАТИКА №3(05)Ц2008 г. ситуаций - интерактивный метод обучения, приз стороны, органично дополняющие друг друга ванный развивать в обучаемых личностный компо тексты способствуют приобретению чётко нент знания, все то, что не может быть передано не сформулированных профессиональных навы посредственно от преподавателя к обучаемому. ков. Таким образом, это проблема тематиче Такие аспекты профессионального знания могут ской группировки текстов, а её решение - руч быть получены учеником только самостоятельно ная проработка всех доступных материалов.

в ходе анализа представленных ситуаций, заведомо В рамках этой же проблемы решается вопрос не имеющих единственно верного решения. Наи адаптации материала к обучаемым с разными более активно кейс метод применяется в рамках уровнями подготовки.

курсов подготовки предпринимателей и менедже 2. Любая информация имеет свойство устарева ров в бизнес школах во многих странах. В ведущих ния. Работа с неактуальными данными, сни учебных заведениях мира накоплен обширный ма жает вовлечённость обучаемых в процесс. Эф териал, активно используемый преподавателями фективность такого кейса может сильно усту в рамках кейс метода. Простое аккумулирование пать запланированной. Здесь представляется документов в слабоструктурированных хранилищах проблема подбора альтернативы с небольши делает эти материалы практически недоступными ми девиациями устаревшему кейсу с сохране ввиду их количества и неэффективности поиска по нием общей направленности всей последова ключевым словам, когда не учитывается семантика тельности или всего курса.

слов и значение контекста, в котором они употре Периодическое обновление кейсов по одной и бляются. той же теме позволяет проводить ретроспективный Цель данной работы - представление концеп анализ способов решения сходных проблем и про ции информационной системы, призванной обес следить эволюцию решений, что представляет печить помощь преподавателям, практикующим определённый профессиональный интерес.

кейс метод в процессе обучения, в задаче поиска и Наличие системы семантического анализа тек отбора релевантных материалов, а также организа стов с функциями поиска и группировки семанти ции кейсов в последовательность, составляющую чески близких текстов позволит повысить эффек адаптированный к обучаемым курс. тивность и скорость решения описанных выше проблем.

Специфика кейс метода От системы требуется работа с текстовыми мате Особенность любого кейса - его сюжетность. риалами на уровне семантики слов и контекста, Нелинейность кейса, его насыщенность ролями де в котором они употребляются. Решение задачи лает разработку хорошего кейса нетривиальным семантической обработки текстов тесно связано длительным процессом, требующим серьёзных ин с вопросами представления знаний предметной теллектуальных затрат. С другой стороны количе области и способами аннотирования текстов. Зна ство удачных кейсов все время растёт, и этот факт ния о предметной области позволяют оперировать обусловливает необходимость наличия удобных, текстом как совокупностью объектов и фактов, интуитивно понятных средств поддержки работы идентифицируемых и интерпретируемых в рамках с хранилищами кейсов. имеющихся знаний.

Особенности, присущие кейс методу, с которы ми может столкнуться преподаватель, рассмотрены Онтологии ниже. Онтология - воплощение концептуального зна 1. Проблема подбора материала или организации ния о предметной области - состоит из следующих кейсов в последовательности, где каждый эл структурных компонентов:

емент несёт новизну, потенциально новые зна таксономии;

ния и опыт, но система в целом сохраняет тема описания отношений, в которых находятся тическую канву. Требования, предъявляемые к объекты предметной области.

такой последовательности, самые разные, на пример, непротиворечивость, уникальность, Создание онтологий - сложный и интеративный нарастающая сложность материала. С одной процесс. В нём участвуют эксперты конкретных стороны, последовательное освоение кейсов предметных областей и специалисты инженерии с опорой на уже полученный в предыдущих об знаний. На сегодняшний день разработаны подхо суждениях опыт сделает анализ текущего мате ды, позволяющие до определенной степени автома риала эффективнее и продуктивнее;

с другой тизировать этот процесс. Однако подавляющее 26 БИЗНЕС ИНФОРМАТИКА №3(05)Ц2008 г.

большинство существующих онтологий разработа с лёгкостью использовать для своего алгоритма дан ны вручную с применением специальных техни ные результаты других блоков. Чёткая специфика ческих средств - редакторов онтологий (например, ция взаимодействия составляющих системы предо Prot еg е, OntoEdit) [10, 11]. ставляет разработчику возможность повторного ис Количество качественных доступных онтологий пользования компонентов других авторов [8].

в мире сегодня не так велико, чтобы удовлетворить Синтаксис системы типов позволяет описывать растущий спрос. Поэтому коллективы разработчи иерархии одиночного наследования. Каждый поль ков вынуждены адаптировать наиболее подходя зовательский тип расширяется набором свойств щие версии, либо разрабатывать собственные онто (features). Таким образом, система типов может ин логии для решения индивидуальных практических терпретироваться как таксономия понятий предмет задач. Часто онтологии разрабатываются в рамках ной области. Система типов отображается утилитой решения одной конкретной задачи, и требования, автоматической генерации кода в набор Java классов.

предъявляемые к онтологии, диктуются специфи Каждый аннотатор имплементирует специальную ло кой выбранного подхода и поставленными целями. гику идентификации набора символов в тексте как Онтологии не создаются один раз на века. В про экземпляр того или иного класса. Результаты анноти цессе жизненного цикла они могут претерпевать рования индексируются и могут быть доступны значительные изменения, поскольку: третьим компонентам, отвечающим непосредственно онтологии могут содержать ошибки, заложен за предоставление определённой функциональности ные на этапе проектирования;

пользователю. Функциональная специализация представления о предметной области могут отдельных блоков обусловливает их относительную меняться со временем, что сделает ряд пред самодостаточность и возможность повторного положений неактуальными или противореча использования, а система, построенная из отдельных щими действительности;

компонент, является масштабируемой.

сами требования к онтологии могут также из Типичная схема построения приложений на ба меняться со временем [5]. зе UIMA представлена на рис. 1.

Представленная на рисунке подсистема обра На проблему эволюции онтологий и на развитие ботки коллекций (CPE - Collection Processing Engi средств технического сопровождения онтологии на ne) состоит из набора компонент аннотаторов. Об всём жизненном цикле направлено сегодня внима мен данными между различными компонентами ние учёных. системы осуществляется посредством CAS (Com mon Analysis Structure), представляющую результа Системы семантического анализа ты аннотирования текста. Применение технологии неструктурированной информации IBM для построения приложений семантического Одной из масштабных разработок в области се анализа данных не ограничивается научно иссле мантического анализа текстов является продукт довательскими проектами. Удачная концепция компании IBM - UIMA (Unstructured Information нашла свое применение в ряде коммерческих про Management Architecture) [8]. Данная платформа дуктов, перечень которых варьируется от интеллек предназначена для использования её в качестве ос туального поиска (OmniFind от IBM) до систем новы для построения сложных систем семантиче автоматизированной обработки заявок в службе ского анализа неструктурированной информации. поддержки пользователей [9].

Архитектура UIMA унифицирует процесс обработки не только текстов на естественных языках, но и по Концептуальное описание системы зволяет анализировать мультимедиа файлы. Напри Объединение преимуществ онтологического мер, рассматриваемый в нашем случае кейс может подхода к спецификации концептуальных знаний о сопровождаться звуковыми файлами, несущими до предметной области с потенциалом архитектуры полнительную, относительно текста, информацию. UIMA представляет определённый интерес. В рам UIMA позволяет создавать сложные приложения, ках проводимых исследований и экспериментов по где каждый компонент выполняет определённые созданию приложений семантической обработки функции: идентификация языка;

синтаксический текста на базе названных технологий системы ти анализ или непосредственное аннотирование тек пов и онтологии рассматриваются независимо друг ста. Для каждого элемента системы чётко определе от друга. Их назначение различно, последние слу ны входные параметры и формат результирующих жат для представления концептуальных знаний данных на выходе, что позволяет компонентам о предметной области и логического вывода на них, БИЗНЕС ИНФОРМАТИКА №3(05)Ц2008 г.. 1. Архитектура системы семантической обработки текстов первые - разрабатываются для анализа конкрет Система, построенная на представленной архи ного текста. В общем случае разработчики - раз тектуре, позволяет оптимизировать решение неко ные люди. Отметим, что проектирование мас торых инженерных задач.

штабной системы типов, также как и создание он 1. Значительно облегчается процесс создания тологий требует больших временных затрат. Не системы типов, используемой компонентами трудно проследить и сходства в жизненном цикле UIMA на этапе анализа документов. Весь про представителей обеих форм концептуализации цесс сводится к разработке онтологии интере предметной области. Учитывая сложность про сующей предметной области. На этом этапе цесса разработки онтологий, таксономий, а также могут быть использованы специализирован их эволюцию, целесообразнее получать системы ные визуальные средства (например, Prot eg e).

типов непосредственно из описания онтологий. 2. Актуализация автоматической синхронизации На рис. 2 приведена архитектура, на основе ко системы типов UIMA с эволюционирующей он торой разрабатываться система семантического тологией. Наличие такого механизма гарантиру анализа кейсов. Приложение, основанное на ет, что компоненты системы при анализе текста предлагаемой архитектуре, предоставит пользова всегда используют актуальную систему типов.

телям возможность работать с кейсами на уровне 3. Обновление базы данных аннотированных до семантики, заложенной в онтологии. кументов с учётом изменений в системе типов.

. 2. Структурная схема системы семантического анализа текстовой информации 28 БИЗНЕС ИНФОРМАТИКА №3(05)Ц2008 г.

Такой подход позволит избежать проведения мации. Применение онтологий в качестве точки от повторного анализа всего массива документов, счёта позволяет использовать богатый опыт веду и незначительные изменения системы типов щих инженеров в области представления знаний.

не приведут к неоправданным временным зат Основные функции, выполняемые такой систе ратам со стороны системы. мой:

семантическое индексирование больших Предлагаемая архитектура гарантирует: объёмов неструктурированной информации;

при аннотировании документов всегда ис отражение специфицированных знаний о пред пользуется актуальная версия системы типов, метной области в информационных портретах отражающая последние тенденции предста документов (эволюция информационных пор влений о предметной области;

третов вместе с развитием онтологий).

база данных аннотированных документов, Определим целевую категорию пользователей и всегда находится в актуальном состоянии и не задачи, которые могут быть решены с помощью си содержит результатов анализа документов, ба стемы.

зирующихся на неактуальных знаниях.

Таблица В рамках разработки прототипа системы делается Категории пользователей системы ряд ограничений, которые могут быть устранены Категории Выполняемые функции/ в будущем. Описание онтологии предметной обла пользователей системы решаемые задачи сти должно быть представлено на языке OWL Lite.

Добавление новых онтологий Разработчики онтологий Будем считать, что сама онтология не содержит про Модификация существующих предметных областей онтологий тиворечий. Выразительные возможности языка OWL [7] не позволяют трансформировать все кон Поиск релевантных кейсов Поиск тематически близких струкции языка в описание типов UIMA непосред кейсов ственно, особенно отображения ряда ограничений Преподаватели Составление адаптированной на свойства. Решение этой технической проблемы - последовательности кейсов с учетом подготовленности модификация исходного кода Java классов, для ге обучаемых нерации которых и служит система типов. Опыт ото Администраторы бражения специфичных для OWL языковых кон Добавление/удаление кейсов образовательного процесса струкций в Java классы подробно рассмотрен в [6].

На базе данной архитектуры предлагается по строить систему семантической обработки кейсов.

С учётом описанных в предыдущих разделах осо бенностей систем поддержки образования и ряда Заключение специфических особенностей кейс метода, активно Рассмотрены вопросы целесообразности приме используемого сегодня в различных учебных заведе нения системы семантического анализа слабо ниях, исследование вариантов построения таких си структурированной информации в сфере образова стем актуально. Главное назначение системы - ока ния, а именно в рамках кейс метода, технические зание помощи преподавателям в навигации в боль аспекты проектирования и реализации такой си ших массивах кейсов, тематической группировки стемы. Концепция системы предусматривает материала с целью создания адаптированной после серьёзную помощь в навигации и структуризации довательности кейсов. Решение, базирующееся на обширных объёмов педагогических материалов применении методов семантического анализа тек с целью последующего их объединения в полно стов, даст ощутимое преимущество перед классиче ценный курс практических занятий, тематически скими подходами в решении описанных выше ориентированный и адаптированный к определен проблем обработки неструктурированной инфор ной категории обучаемых.

Литература 1. Соловов А. В. Проектирование компьютерных систем учебного назначения, Самара, СГАУ, 1995 ( ka.ru/text/inftech/edu/design).

2. Норенков И.П., Уваров М.Ю. Информационно образовательные среды на базе онтологического подхода. // В сборнике научных БИЗНЕС ИНФОРМАТИКА №3(05)Ц2008 г. статей Интернет порталы: содержание и технологии. Выпуск 3. / Редкол.: А.Н. Тихонов (пред.) и др.;

ФГУ ГНИИ ИТТ Информи ка. - М.: Просвещение, 2005. - С. 367Ц378.

3. Радаев В.В. Идеология создания специализированного образовательного портала на примере портала по экономике, менеджмен ту и социологии / Сб. научн. ст. Интернет порталы: содержание и технологии. Вып. 1. ГНИИ ИТТ Информика. - М.: Просве щение, 2003. - С. 91Ц109.

4. Боровикова О.И., Загорулько Ю.А. Организация порталов знаний на основе онтологий. // Труды международного семинара Диа логТ2002 УКомпьютерная лингвистика и интеллектуальные технологииФ. Протвино, 2002. Т.2, С.76Ц82.

5. L. Stojanovic and B. Motik. Ontology evolution within ontology editors. In Proceedings of the OntoWeb SIG3 Workshop at the 13th Inter national Conference on Knowledge Engineering and Knowledge Management EKAW 2002, volume 62, September 2002.

6. Kalyanpur, A., Pastor, D., Battle, S. and Padget, J., Automatic mapping of owl ontologies into java. In Proceedings of Software Engg. - Knowledge Engg. (SEKE) 2004, Banff, Canada, June 2004.

7. Word Wide Web Consortium (W3C). OWL - Web Ontology Language. ref.

8. UIMA Tutorial and DevelopersТ Guides. 9. Marc Andrews Observations On Demand. 10. The prot?g? ontology editor and knowledge acquisition system. 11. OntoEdit Ontology Engineering Environment 12. The Case Method of Teaching Science. ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ - ВЫСШАЯ ШКОЛА ЭКОНОМИКИ представляет свои периодические издания Журнал освещает теоретические и прикладные проблемы экономи ЭКОНОМИЧЕСКИЙ ЖУРНАЛ ческой науки. В каждом* номере - статьи ведущих российских эко ВЫСШЕЙ ШКОЛЫ ЭКОНОМИКИ номистов. Рецензии, методологические и лекционные материалы.

Эксклюзивные статьи зарубежных экономистов. Данные официаль ЕЖЕКВАРТАЛЬНЫЙ НАУЧНО ИНФОРМАЦИОННЫЙ ной статистики по широкому кругу вопросов.

ЖУРНАЛ Каталог Агентства Роспечать - индекс Объединенный каталог Пресса России - индекс Издается с 1997 г.

Координаты редакции:

Главный редактор - 101990 Москва, ул. Мясницкая, 20, офис e mail: redact@hse.ru, тел./факс: (495) 628 Евгений Евгеньевич Гавриленков Журнал освещает состояние, динамика и дает прогноз основных со РОССИЙСКАЯ ЭКОНОМИКА:

циально экономических индикаторов. В каждом номере - хроника ПРОГНОЗЫ И ТЕНДЕНЦИИ событий экономики. Результаты конъюнктурных опросов предприя ЕЖЕМЕСЯЧНЫЙ СПРАВОЧНО АНАЛИТИЧЕСКИЙ тий. Самые свежие данные. Аналитический материал представлен с использованием таблиц, графиков и диаграмм.

ЖУРНАЛ Каталог Агентства Роспечать - индекс Издается с 1993 г.

Объединенный каталог Пресса России - индекс Координаты редакции:

Главный редактор - 117312 Москва, ул. Вавилова, 7, офис Елена Анатольевна Иванова E maii: id.hse@mail.ru Тел./факс: (495) 772 РАСПРОСТРАНЯЮТСЯ ПО РОССИИ И ДРУГИМ СТРАНАМ СНГ. ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ - НА САЙТЕ: www.hse.ru 30 БИЗНЕС ИНФОРМАТИКА №3(05)Ц2008 г.

   Книги, научные публикации