Нейросетевая экспертная система медицинской диагностики
Дипломная работа - Компьютеры, программирование
Другие дипломы по предмету Компьютеры, программирование
насколько это возможно. Это именно тот тип задач, которые решает алгоритм средних. В общем случае метод K средних строит ровно K различных кластеров, расположенных на возможно больших расстояниях друг от друга.
Выберем в меню пункт Statistics- Multivariate Exploratory Techniques -Cluster Analysis
В открывшемся окне выберем метод К-средних (Рисунок 22).
Рисунок 22. Выбор метода к-средних
Во вкладке Advanced выбираем 3 кластера и 10 итераций по умолчанию (Рисунок 23).
Рисунок 23. Выбор числа кластеров и итераций
Сохраняем полученный результат (Рисунок 24).
Рисунок 24. Выбираем Save Classifications and distances
Рисунок 25. Полученное разбиение на кластеры
Описанным выше способом в разделе 3.1 , строим нейронные сети для каждого кластера.
В результате для каждого кластера найдены нейронные сети, у которых SD Ratio хотя бы для одного из выходов достигает значения от 0 до 0.2. Ниже приведены графики зависимости наблюдаемых значений выходных переменных от предсказанных значений для каждого из трёх кластеров
Кластер 1
Рисунок 26 Приём в стационаре И-АПФ\АРА. Полученное значение SD Ratio 0.16
Рисунок 27 Приём в стационаре БАБ. Полученное значение SD Ratio 0.2
Рисунок 28. Приём в стационаре БКК. Полученное значение SD Ratio 0.17
Рисунок 29. Приём в стационаре диуретиков. Полученное значение SD Ratio 0.14
Рисунок 30. Приём в стационаре препаратов центрального действия. Полученное значение SD Ratio 0.0013
Кластер 2
Рисунок 31. Приём в стационаре И-АПФ\АРА. Полученное значение SD Ratio 0.14
Рисунок 32. Приём в стационаре БАБ. Полученное значение SD Ratio 0.21
Рисунок 33. Приём в стационаре БКК. Полученное значение SD Ratio 0.04
Рисунок 34. Приём в стационаре диуретиков. Полученное значение SD Ratio 0.20
Рисунок 35. Приём в стационаре препаратов центрального действия. Полученное значение SD Ratio 0.02
Кластер 3
Рисунок 36. Приём в стационаре БАБ. Полученное значение SD Ratio 0.016
Рисунок 37. Приём в стационаре И-АПФ\АРА. Полученное значение SD Ratio 0.06
Рисунок 38. Приём в стационаре БКК. Полученное значение SD Ratio 0.07
Рисунок 39. Приём в стационаре диуретиков. Полученное значение SD Ratio 0.08
Рисунок 40. Приём в стационаре препаратов центрального действия. Полученное значение SD Ratio 0.05
На графиках выявлены одиночные выбросы, которые не составляют прямую под 45 градусов. Скорее всего такой результат связан с тем, что характеристики отдельных пациентов сильно отличаются от большинства.
Глава 4. Кластеризация. Метод к-средних. Программная реализация модуля кластеризации методом к-средних
.1 Кластерный анализ. Общие сведения
Кластерный анализ - это совокупность методов, позволяющих классифицировать многомерные наблюдения. Термин кластерный анализ, впервые введенный Трионом (Tryon) в 1939 году, включает в себя более 100 различных алгоритмов.
В отличие от задач классификации, кластерный анализ не требует априорных предположений о наборе данных, не накладывает ограничения на представление исследуемых объектов, позволяет анализировать показатели различных типов данных (интервальным данным, частотам, бинарным данным). При этом необходимо помнить, что переменные должны измеряться в сравнимых шкалах. Кластерный анализ позволяет сокращать размерность данных, делать ее наглядной.
Кластерный анализ служит для выявления в данных групп точек, явственно отличающихся друг от друга. Важность решения этой задачи связана с тем, что применение стандартных средств анализа данных (в т.ч. стандартных эконометрических процедур) при наличии кластеров в данных приведет к смещению как точечных оценок (коэффициентов регрессии), так и стандартных ошибок, а значит, и к неверным статистическим выводам. Кроме того, структура данных и схожесть наблюдений могут представлять и самостоятельный интерес.
Кластерный анализ предназначен для разбиения совокупности объектов на однородные группы (кластеры или классы). По сути это задача многомерной классификации данных.
Задача кластерного анализа заключается в том, чтобы на основании данных, содержащихся во множестве Х, разбить множество объектов G на m (m - целое) кластеров (подмножеств) Q1, Q2, …, Qm, так, чтобы каждый объект Gj принадлежал одному и только одному подмножеству разбиения и чтобы объекты, принадлежащие одному и тому же кластеру, были сходными, в то время, как объекты, принадлежащие разным кластерам были разнородными.
Решением задачи кластерного анализа являются разбиения, удовлетворяющие некоторому критерию оптимальности. Этот критерий может представлять собой некоторый функционал, выражающий уровни желательности различных разбиений и группировок, который называют целевой функцией. Например, в качестве целевой функции может быть взята внутригрупповая сумма квадратов отклонения:
где xj - представляет собой измерения j-го объекта.
Для решения задачи кластерного анализа необходимо определить понятие сходства и разнородности.
Понятно то, что объекты i-ый и j-ый попадали бы в один кластер, когда расстояние (отдаленность) между точками Хi и Хj было бы достаточно