Нейросетевая экспертная система медицинской диагностики

Дипломная работа - Компьютеры, программирование

Другие дипломы по предмету Компьютеры, программирование

насколько это возможно. Это именно тот тип задач, которые решает алгоритм средних. В общем случае метод K средних строит ровно K различных кластеров, расположенных на возможно больших расстояниях друг от друга.

Выберем в меню пункт Statistics- Multivariate Exploratory Techniques -Cluster Analysis

В открывшемся окне выберем метод К-средних (Рисунок 22).

 

Рисунок 22. Выбор метода к-средних

 

Во вкладке Advanced выбираем 3 кластера и 10 итераций по умолчанию (Рисунок 23).

 

Рисунок 23. Выбор числа кластеров и итераций

 

Сохраняем полученный результат (Рисунок 24).

 

Рисунок 24. Выбираем Save Classifications and distances

 

Рисунок 25. Полученное разбиение на кластеры

 

Описанным выше способом в разделе 3.1 , строим нейронные сети для каждого кластера.

В результате для каждого кластера найдены нейронные сети, у которых SD Ratio хотя бы для одного из выходов достигает значения от 0 до 0.2. Ниже приведены графики зависимости наблюдаемых значений выходных переменных от предсказанных значений для каждого из трёх кластеров

Кластер 1

 

 

Рисунок 26 Приём в стационаре И-АПФ\АРА. Полученное значение SD Ratio 0.16

 

 

Рисунок 27 Приём в стационаре БАБ. Полученное значение SD Ratio 0.2

 

 

Рисунок 28. Приём в стационаре БКК. Полученное значение SD Ratio 0.17

 

 

Рисунок 29. Приём в стационаре диуретиков. Полученное значение SD Ratio 0.14

 

 

Рисунок 30. Приём в стационаре препаратов центрального действия. Полученное значение SD Ratio 0.0013

 

Кластер 2

 

 

Рисунок 31. Приём в стационаре И-АПФ\АРА. Полученное значение SD Ratio 0.14

 

 

Рисунок 32. Приём в стационаре БАБ. Полученное значение SD Ratio 0.21

 

 

Рисунок 33. Приём в стационаре БКК. Полученное значение SD Ratio 0.04

 

 

 

Рисунок 34. Приём в стационаре диуретиков. Полученное значение SD Ratio 0.20

 

Рисунок 35. Приём в стационаре препаратов центрального действия. Полученное значение SD Ratio 0.02

 

 

Кластер 3

 

 

Рисунок 36. Приём в стационаре БАБ. Полученное значение SD Ratio 0.016

 

 

Рисунок 37. Приём в стационаре И-АПФ\АРА. Полученное значение SD Ratio 0.06

 

 

Рисунок 38. Приём в стационаре БКК. Полученное значение SD Ratio 0.07

 

 

Рисунок 39. Приём в стационаре диуретиков. Полученное значение SD Ratio 0.08

 

 

Рисунок 40. Приём в стационаре препаратов центрального действия. Полученное значение SD Ratio 0.05

 

На графиках выявлены одиночные выбросы, которые не составляют прямую под 45 градусов. Скорее всего такой результат связан с тем, что характеристики отдельных пациентов сильно отличаются от большинства.

 

 

Глава 4. Кластеризация. Метод к-средних. Программная реализация модуля кластеризации методом к-средних

 

.1 Кластерный анализ. Общие сведения

 

Кластерный анализ - это совокупность методов, позволяющих классифицировать многомерные наблюдения. Термин кластерный анализ, впервые введенный Трионом (Tryon) в 1939 году, включает в себя более 100 различных алгоритмов.

В отличие от задач классификации, кластерный анализ не требует априорных предположений о наборе данных, не накладывает ограничения на представление исследуемых объектов, позволяет анализировать показатели различных типов данных (интервальным данным, частотам, бинарным данным). При этом необходимо помнить, что переменные должны измеряться в сравнимых шкалах. Кластерный анализ позволяет сокращать размерность данных, делать ее наглядной.

Кластерный анализ служит для выявления в данных групп точек, явственно отличающихся друг от друга. Важность решения этой задачи связана с тем, что применение стандартных средств анализа данных (в т.ч. стандартных эконометрических процедур) при наличии кластеров в данных приведет к смещению как точечных оценок (коэффициентов регрессии), так и стандартных ошибок, а значит, и к неверным статистическим выводам. Кроме того, структура данных и схожесть наблюдений могут представлять и самостоятельный интерес.

Кластерный анализ предназначен для разбиения совокупности объектов на однородные группы (кластеры или классы). По сути это задача многомерной классификации данных.

Задача кластерного анализа заключается в том, чтобы на основании данных, содержащихся во множестве Х, разбить множество объектов G на m (m - целое) кластеров (подмножеств) Q1, Q2, …, Qm, так, чтобы каждый объект Gj принадлежал одному и только одному подмножеству разбиения и чтобы объекты, принадлежащие одному и тому же кластеру, были сходными, в то время, как объекты, принадлежащие разным кластерам были разнородными.

Решением задачи кластерного анализа являются разбиения, удовлетворяющие некоторому критерию оптимальности. Этот критерий может представлять собой некоторый функционал, выражающий уровни желательности различных разбиений и группировок, который называют целевой функцией. Например, в качестве целевой функции может быть взята внутригрупповая сумма квадратов отклонения:

 

 

где xj - представляет собой измерения j-го объекта.

Для решения задачи кластерного анализа необходимо определить понятие сходства и разнородности.

Понятно то, что объекты i-ый и j-ый попадали бы в один кластер, когда расстояние (отдаленность) между точками Хi и Хj было бы достаточно