Удк 681. 3: 519 применение методов data mining для формирования базы знаний экспертной системы прогнозирования исхода родов*

Вид материалаДокументы

Содержание


2. Технология конструирования диагностических шкал
Результаты апробации на реальных данных
Список литературы
Подобный материал:
УДК 681.3:519

ПРИМЕНЕНИЕ МЕТОДОВ DATA MINING ДЛЯ ФОРМИРОВАНИЯ БАЗЫ ЗНАНИЙ ЭКСПЕРТНОЙ СИСТЕМЫ ПРОГНОЗИРОВАНИЯ ИСХОДА РОДОВ*

О.Г.Берестнева1, Р.Г.Добрянская2, Е.А. Муратова3

В работе описывается технология формирования базы знаний экспертной системы прогнозирования исхода родов. Рассматриваются особенности применения методов data mining для формирования базы знаний. Приводятся результаты апробации на реальных данных.

Введение

Общепризнанным является тот факт, что психогенные факторы способствуют нарушению биологической готовности к родам, но исследований в этом направлении недостаточно, как и попыток прогнозирования поведенческих реакций женщины в родах [Абрамченко, 2001], [Добрянская, 2003]. Авторами разработан прототип экспертной системы прогнозирования исхода родов. Цели нашего исследования включали , во-первых, изучение особенности течения родов у женщин в зависимости от их психофизиологических особенностей и стратегий копинг-поведения, во-вторых, разработку методов экспресс-диагностики для выявления «групп риска». Решение данных задач осуществлялось на основе методов Data Mining , которые, как известно, ориентированы на решение центральной проблемы Искусственного Интеллекта – на обнаружение закономерностей (или знаний), скрытых в описании имеющихся фактов, и на использовании этих закономерностей для предсказания будущих фактов [Осипов, 1997].

Среди задач, наиболее часто решаемых методами Data Mining, выделяют следующие [Загоруйко, 2000]:
  • обнаружение закономерных связей между объектами, что позволяет формировать таксоны или кластеры;
  • обнаружение закономерных связей между описывающими характеристиками, что позволяет структурировать множество характеристик (формировать факторы или синдромы);

обнаружение закономерных связей между описывающими и целевыми характеристиками, что позволяет структурировать множество характеристик (формировать факторы и синдромы). и . в том числе с использованием разработанных нами ранее методов и алгоритмов анализа данных [Гедике и др., 2000], [Янковская и др., 2001], [Муратова и др., 2004].

1. Технология формирования базы знаний

Описание состояния объектов данной предметной области характеризуется наличием количественных, порядковых и качественных признаков, что явилось одной из причин выбора в качестве инструментария методов Data Mining . На первом этапе методом ограниченного перебора были выявлены логические закономерности (на базе пакета WizWhy) и проведена оценка информативности признаков с использованием различных методов и подходов. помощью информационной меры Кульбака. Для построения прогностических моделей были выбраны методы построения деревьев решений (на базе пакета See5) и дискриминантного анализа. Во втором случае предварительно требовалось решить задачу унификации признакового пространства. Для решения ряда задач данного исследования была использована разработанная нами технологии конструирования диагностических шкал [Муратова и др., 2004].

2. Технология конструирования диагностических шкал

Конструирование диагностической шкалы (ДШ) представляет собой процесс выделения граничных значений, образованных на основе частотного распределения значений исследуемого показателя в выборке стандартизации. Поиск новых подходов при конструировании ДШ в настоящее время в медицинских и психологических исследованиях особенно актуален, поскольку традиционная методология обладает рядом недостатков. Например, требуется формирование репрезентативной выборки стандартизации, а это в современных условиях предполагает большие трудовые, временные и финансовые ресурсы, и, кроме того, не всегда осуществимо в силу специфичности группы исследуемых. Кроме того, любые диагностические нормы, как бы они не выражались, всегда получены для определенной группы лиц или объектов, вследствие чего их нельзя считать постоянными. Нами разработан программный комплекс (ПК) UniData, реализующий адаптивный подход при выделении информативных интервалов [Гедике и др., 2000].

Технология конструирования ДШ включает 3 группы алгоритмов выделения интервалов: равномерное, неравномерное, комбинированное. В программе предусмотрена возможность сравнения информативности выделяемых интервалов с экспертными (или общепринятыми), если такие имеются в распоряжении исследователя.

В нашем исследовании технология конструирования ДШ была использована в качестве инструментария при изучении структуры экспериментальных данных и унификации признакового пространства. В первом случае, выявленные закономерности позволили объяснить существующие факты и процессы в изучаемой предметной области, обнаружить новые знания или переосмыслить ранее известные факты. Во втором случае, выделенные информативные интервалы рассматриваются в качестве новых бинарных признаков.


3. Результаты апробации на реальных данных


Экспериментальное исследование проводилось на базе женской консультации родильного дома № 1 г. Томска. Было обследовано 536 беременных женщин в возрасте от 18 до 36 лет со сроками гестации от 4 до 38 недель, вынашивающих первого ребёнка. Одной из задач настоящего исследования было исследование влияния на исход беременности таких психологических факторов, как уровень стресса, представленность психической ригидности в структуре личности, особенности копинг-стратегий у женщин, отличающихся по социальному положению (образование, семейный статус) и антропометрическим данным (рост, размеры таза, показатели кистевой динамометрии). Актуальность данной задачи обоснована в работах [Абрамченко, 2001], [Добрянская, 2003].

Психодиагностические показатели, использованные в исследовании подробно описаны в [Добрянская и др., 2005]. Представленность психической ригидности в структуре личности исследовалась с помощью Томского опросника ригидности Залевского (ТОРЗ), позволяюшего оценивать актуальную (АР), установочную (УР) и сенситивную ригидность (СР). Показатели по шкале АР характеризуют неспособность при объективной необходимости изменить мнение, отношение или установку. Шкала УР отражает личностный уровень проявления психической ригидности, выраженный в установке на принятие или непринятие нового, необходимости изменения самого себя, привычек. Шкала СР отражает эмоциональную реакцию человека на изменения в его жизни, страх перед новым (неофобии). Для определения уровня стресса применили проективную методику – метод цветовых выборов, модифицированный тест Люшера. Для исследования копинг-стратегий использовали копинг-тест E.Hein.

Применение методов Data Mining позволило выделить группу риска – это беременные женщины с высокими показателями ригидности, а так же, отдавшие предпочтение неадаптивным стратегиям по копинг тесту. По нашим наблюдениям не выявлено различий по результатам родов у женщин, отдавших предпочтение первым выбором конструктивной стратегии «протест» (обозначили как «протестующие») и неконструктивным – «подавление эмоций», «безнадежность», «самообвинение» и «агрессия». Беременных женщин, отдавших предпочтение первым выбором неконструктивным стратегиям «безнадежность», «самообвинение» и «агрессия» обозначили как группа «деструктивные пессимисты». К группе низкого психологического риска можно отнести «конструктивных оптимистов» и «позитивистов», в которых произошли срочные роды у 85,4% и 85,8% соответственно.

К группам высокого психологического риска по перинатальной смертности можно отнести «деструктивных пессимистов» и женщин с «деструктивным протестом», в которых срочные роды произошли у 61,4% и 69,2% , а перинатальная смертность составила 32,2‰ и 76,9‰ соответственно. Тогда как статистически достоверно (p<0,05) исход беременности более благоприятный у женщин из группы «деструктивных пессимистов», прошедших дородовую подготовку (нет случаев перинатальной смертности, у 88,9% произошли срочные роды).

Предпочтение механизма совладания «эмоциональная разгрузка» первым и вторым выбором можно рассматривать как психологический риск по преждевременным родам, причем групповая дородовая подготовка не улучшает результаты, по всей видимости, эти беременные женщины нуждаются в индивидуальной психологической коррекции.

Таким образом, определяя психическую ригидность как дезадаптирующий фактор, выявление высокого уровня психической ригидности в структуре личности как «фактора риска» при скриннинговых исследованиях, проведение дифференциальной психологической коррекции фиксированности к неадаптивным установкам и ожиданиям у беременных женщин на этапе дородовой подготовки требует продолжения исследовательской работы в этом направлении [Добрянская и др., 2005], [Берестнева и др., 2005] .

Заключение

Применение технологии Data Mining позволило не только выявить наиболее информативные психологические и психофизиологические признаки для прогнозирования исхода родов, но и получить на их основе новые факторы и синдромы благоприятного и неблагоприятного исхода родов.

Список литературы


[Абрамченко, 2001] Абрамченко В.В. Психосоматическое акушерство. – СПб.: СОТИС, 2001.

[Добрянская, 2003] Добрянская Р.Г. Исследование стратегий преодоления эмоционального стресса у беременных женщин //Сибирский психологический журнал. 2003. №18.

[Осипов, 1997] Осипов Г.С. Приобретение знаний интеллектуальными системами: Основы теории и технологии. – М.:Наука, 1997.

[Загоруйко, 2000] Загоруйко Н.Г. Применение методов Data Mining для ориентации разумного агента в социальной среде многоагентской системы//Седьмая национальная конференция по искусственному интеллекту с международным участием: Труды конференции. Т.1. – М.: ФИЗМАТЛИТ, 2000.

[Гедике и др., 2000] Гедике А.И., Муратова Е.А., Рожденственская Е.А., Янковская А.Е. Выявление на базе системы Имслог социально-психологических факторов возникновения К-стресса у студентов и преподавателей// Седьмая национальная конференция по искусственному интеллекту с международным участием: Труды конференции. Т.2. – М.: ФИЗМАТЛИТ, 2000.

[Янковская и др., 2001] Янковская А.Е., Муратова Е.А., Берестнева О.Г. Эффективный алгоритм адаптивного кодирования разнотипной информации // Труды конгресса «Искусственный интеллект в XXI веке». – М.: ФИЗМАТЛИТ, 2001.

[Муратова и др., 2004] Муратова Е.А., Берестнева О.Г. Муратова Е.А. , Берестнева О.Г. Применение технологии конструирования диагностических шкал в задачах психологии интеллекта // Труды международных научно – технических конференции «Интеллектуальные системы (IEEE AIS’04)» и «Интеллектуальные САПР» (CAD-2004). – М.: Изд-во Физико-математической литературы, 2004. Т.1.

[Добрянская и др., 2005] Добрянская Р.Г., Евтушенко И.Д., Залевский Г.В. Система дифференциальной медико-психологической помощи беременным женщинам /Методические рекомендации для врачей акушеров-гинекологов и психологов женских консультаций. Томск: СибГМУ, 2005.

[Берестнева и др., 2005] Берестнева О.Г., Добрянская Р.Г., Муратова Е.А. Применение технологии Data Mining для прогнозирования исхода родов// Сборник докладов XII Всероссийской конференции Математические методы распознавания образов ММРО-12. – М., 2005.

* Работа выполнена при частичной финансовой поддержке РФФИ (проект № 04-06-80413) и РГНФ (проект 06-06-00582)

1 634034, Томск, ул.Советская, 84, Институт КЦ ТПУ, ogb@rambler.ru

2 634050, Томск, Московский тр., 2, СГМУ, dobrru@mail.ru

3 634050, Томск, пр. Ленина, 30, ТПУ, muratova@tpu.ru