Нейросетевая экспертная система медицинской диагностики
Дипломная работа - Компьютеры, программирование
Другие дипломы по предмету Компьютеры, программирование
?ыми показателями здесь являются Profile (Тип сети), Train (Select, Test) Performance (Производительность сети на обучающем (контрольном, тестовом) множестве) и Train Error (Ошибка обучения).В разделе Profile - Тип сети описывается топология нейронной сети, т.е. класс сетей, к которому она принадлежит (в нашем случае -MLP, то есть персептрон), количество входных и выходных переменных, количество скрытых слоев и число элементов на каждом скрытом слое. На рисунке 13 изображено диалоговое окно результатов поиска сети. Здесь приводятся 10 лучших нейросетевых конфигураций среди 100, рассмотренных программой.
Рисунок 13. Диалоговое окно результатов поиска сети
Для окончательного выбора единственной наилучшей сети сравним эти сети по значениям различных ошибок.
После выделения какой-либо сети в списке на рисунке 13 и нажатия кнопки Descriptive statistics появляется окно с характеристиками данной нейросетевой модели. (Рисунок 14). В нем приводятся значения Data Меаn (среднее данных) для каждого прогнозируемого параметра, Data S.D. (среднеквадратическое отклонение данных), Еrror Mean (средняя ошибка прогноза), Еrror S.D. (среднеквадратическое отклонение ошибки прогноза), Аbs E. Mean (средняя абсолютная ошибка прогноза), SD Ratio (отношение среднеквадратического отклонения ошибки прогноза к среднеквадратическому отклонению данных), Сorrelation (величина корреляции между реальными и спрогнозированными данными).
Рисунок 15. Таблица ошибок регрессии, построенной выбранной сетью
Выберем сеть с наилучшими показателями. Значение ошибки SD Ratio является наиболее пригодной для целей сравнения, потому как представляет собой число между 0 и 1, зависит лишь от величины каждой составляющей ошибки (не зависит от знака), а также довольно восприимчиво к выбросам. Эмпирическое правило гласит, что если SD Ratio не превышает значения 0.2, сеть подобрана хорошо, если SD Ratio находится в пределах от 0.2 до 0.4 - то удовлетворительно, а если больше 0,4 - то неудовлетворительно.
В нашем примере лишь одна сеть из сохраненных программой, оказалась близка к хорошему качеству прогнозирования, но только по одному параметру.
Исследуем поподробнее выбранную сеть (она имеет номер 13, то есть она в процессе тестирования была сформирована 13-й)
Архитектура этой сети проведена на рисунке 16. Эта сеть имеет 61 вход, 30 нейронов в первом слое, 29 нейронов во втором слое, 5 нейронов в третьем слое и 5 выходов.
Рисунок 16. Архитектура лучшей сети
Графической иллюстрацией качества работы нейронной сети является график зависимости наблюдаемых значений выходных переменных от предсказанных значений. Для построения такого графика необходимо воспользоваться кнопкой Graph X versus Y - График X от Y, расположенной во вкладке Plots - Графики. При этом, предварительно указав в качестве X - axis - Observed - Наблюдаемые, Y - axis - Predicted - Предсказанные. Результаты построения графиков приведены на рисунках17-21.
Рисунок 17. Приём в стационаре И-АПФ\АРА
Рисунок 18. Приём в стационаре БАБ
Рисунок 19. Приём в стационаре БКК
Рисунок 20. Приём в стационаре диуретиков
Рисунок 21. Приём в стационаре препаратов центрального действия
Если модель построена хорошо, то точки этого графика должны располагаться как можно ближе к прямой, лежащей под углом 45 градусов к осям координат.
На этом графике отчетливо видно отсутствие какой-либо зависимости между наблюдаемыми и предсказанными значениями.
На первый взгляд может показаться, что мы получили, противоречащий теореме Колмогорова о полноте, результат. Однако, как мы уже упоминали ранее, теорема работает только с непрерывными функциями. В нашем же случае, имеются серьезные основания полагать, что функция изучаемого физического процесса не является непрерывной.
Судя по полученным результатам, среди множества данных есть и "островки стабильности". Иначе говоря, можно с большой долей уверенности предположить, что в некоторых областях пространства независимых переменных функция процесса ведет себя непрерывно.
Для нас крайне желательно такие области локализовать. Для этого осуществим разбиение данных на однородные группы, или проведем кластеризацию.
3.3 Кластеризация в программе Statistica 7 и получение новых результатов
Термин кластерный анализ (впервые ввел Tryon, 1939) в действительности включает в себя набор различных алгоритмов классификации. Общий вопрос, задаваемый исследователями во многих областях, состоит в том, как организовать наблюдаемые данные в наглядные структуры.
Существует точка зрения, что в отличие от многих других статистических процедур, методы кластерного анализа используются в большинстве случаев тогда, когда вы не имеете каких-либо априорных гипотез относительно классов, но все еще находитесь в описательной стадии исследования. Следует понимать, что кластерный анализ определяет "наиболее возможно значимое решение". Поэтому проверка статистической значимости в действительности здесь неприменима, даже в случаях, когда известны p-уровни (как, например, в методе К-средних).
Нашу выборку данных желательно разбить на 2-4 кластера. Выберем количество кластеров 3 и разобъём по методу К -средних.
Общая логика метода: Предположим, уже имеются гипотезы относительно числа кластеров (по наблюдениям или по переменным). Можно указать системе образовать ровно три кластера так, чтобы они были настолько различны,