Интеллектуальный анализ данных в системе медис-4

Вид материалаДокументы
Подобный материал:

УДК 004.896(06) Интеллектуальные системы и технологии


А.В. ВОЙНОВ

Exelixis Inc. 170 Harbor Way, South San Francisco, CA 94080


ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ
В СИСТЕМЕ МЕДИС-4



Система Медис-4 предназначена для инструментальной поддержки исследований в области извлечения знаний, психосемантики и интеллектуального анализа данных. В настоящей работе рассматриваются предоставляемые системой алгоритмы обработки данных, их математические свойства, а также инженерные аспекты их реализации.


Данные о попарном сходстве или различии некоторых объектов естественным образом возникают в различных гуманитарных и прикладных исследованиях. Можно отметить такие области, как экспериментальная психодиагностика, инженерия знаний, когнитивные науки, социология, медицина, экономика, маркетинг и пр. Источником таких данных может служить прямое экспертное оценивание сходств/различий; экспертное оценивание некоторых свойств объектов с последующим определением меры сходства между объектами на основе того или иного определения метрики на множестве объектов; прямое количественное измерение объективных свойств (параметров) объектов с аналогичным переходом к мерам сходства на основе определения метрики.

Множество допустимых значений сходства может быть как числовым (непрерывным или дискретным) так и нечисловым. Определение метрики на множестве объектов также может иметь как численную природу (коэффициент корреляции и т.п.), так и нечисленную.

Система МЕДИС [1, 2] предназначена для поддержки сбора прямых и косвенных оценок различий произвольных объектов, их обработки методами многомерного шкалирования, интерпретации полученных результатов, формального представления этих результатов в виде «полей знаний» над набором выявленных в ходе обработки и интерпретации «концептов».

Исследования, проведенные с помощью системы МЕДИС, относятся к областям психосемантики, инженерии знаний [3], когнитивной науки [4]. Для поддержки исследований в области моделирования образного мышления и интуиции [5], интеллектуального анализа медицинских данных [6] в версию 4.0 включена поддержка сбора косвенных данных о различиях произвольных объектов на основе т.н. «словарного шкалирования» аннотаций этих объектов терминами из предопределенного тезауруса.

Система Медис представляет самостоятельный интерес ввиду ряда особенностей, не имеющих аналогов в других системах обработки данных. В подсистеме сбора прямых экспертных оценок различий реализован подход, сочетающий достоинства т.н. «субъективного шкалирования» и теста репертуарных решеток Келли. Шкалируемые объекты делятся на два метакласса – «элементы» и «конструкты». В процедуре предъявления «элементы» сравниваются друг с другом, кроме того, каждый «элемент» сравнивается (сопоставляется) со всеми «конструктами».

Центральным в подсистеме обработки данных о различиях является оригинальный метод многомерного шкалирования, который приспособлен к обработке нечисловых данных о различиях, где список допустимых категорий имеет очень небольшую длину и не допускает однозначной «оцифровки» числовыми значениями. Такие данные чаще всего появляются в задачах субъективного шкалирования, где эксперту (респонденту) предъявляется список категорий вида «очень похоже», «похоже», «затрудняюсь ответить», «непохоже», «очень непохоже» и пр.

Из числа нововведений в версии 4.0 следует отметить оригинальный подход к определению метрики на множестве аннотаций объектов, а также возможность совместной обработки данных прямых и косвенных оценок различий.

Настоящий доклад посвящен обсуждению некоторых математических свойств указанных алгоритмов, а также технических аспектов их реализации.


Список литературы

  1. Воинов А.В. Интеллектуальная система анализа данных МЕДИС // Пятая национальная конференция с международным участием «Искусственный интеллект-96». Казань, 1996. Т.3.
  2. Воинов А.В. Решение задач психосемантики и инженерии знаний в системе МЕДИС 4.0 // КИИ-06. 2006.
  3. Воинов А., Гаврилова Т. Инженерия знаний и психосемантика: об одном подходе к выявлению глубинных знаний // Известия РАН. Техническая кибернетика. №5. 1994. С. 3-11.
  4. Черниговская Т.В., Гаврилова Т.А., Воинов А.В., Стрельников К.Н. Сенсомоторный и когнитивный латеральный профиль: тестирование и интерпретация // Журнал «Физиология человека». 2005. Т. 31. № 2. C. 35-44.
  5. Воинов А.В., Кобринский Б.А. Иерархия локально-непротиворечивых полей знаний как модель образного мышления и интуиции эксперта в мягких предметных областях // Девятая национальная конференция по искусственному интеллекту с международным участием: Тр. конф. Т.2. М.: Физматлит, 2004.
  6. Воинов А.В., Демикова Н.С., Кобринский Б.А. Словарное шкалирование в медицинской информатике: инженерия знаний и интеллектуальный анализ данных. КИИ-06.




ISBN 5-7262-0710-6. НАУЧНАЯ СЕССИЯ МИФИ-2007. Том 3