Классификатор на основе нейронной сети art-1

Вид материалаДокументы
Подобный материал:
УДК 004.896

КЛАССИФИКАТОР НА ОСНОВЕ НЕЙРОННОЙ СЕТИ ART-1

Е.С.Борисов

Институт Кибернетики им. В.М.Глушкова НАН Украины


В этой работе построен классификатор, распознающий картинки с цифрами от 0 до 9. Для реализации классификатора используется нейронная сеть ART-1.




Рис.1: нейронная сеть ART-1
При построении классификаторов может возникать проблема стабильности - пластичности, которая заключается в необходимости постоянного разрешения следующей дилеммы: является ли текущий образ искажением старого, т.е. уже предъявлявшегося ранее, или это новый образ, существенно отличающийся от старых. Восприятие системы должно быть пластично, т.е. способно принимать новую информацию, и при этом - стабильно, т.е. не разрушать память о старых образах. Решение этой проблемы было предложено С. Гроссбергом в теории адаптивного резонанса (ART) [1]. Согласно ей общая схема интеллектуальной системы состоит из двух типов памяти: кратковременной (STM) и долговременной (LTM), которые связаны между собой. Образ помещается в кратковременную память и сравнивается с образами, хранящимися в долговременной памяти. Если содержимое STM похоже на образ из LTM то возникает состояние резонанса - т.е. система "узнаёт" входной образ. В противном случае текущий входной образ считается новым. Этот подход реализует детектор новизны образов. Гипотеза Гроссберга состоит в том, что только резонансные состояния мозга достигают рационального уровня сознания. Это перекликается с понятием естественного (человеческого) языка, который часто ошибочно определяют как средство общения, в то время как средством общения есть речь. Язык же есть средством разделения, инструментом сегментации и классификации окружающего мира. Человек способен видеть (воспринять) только то, что присутствует в его языке (состояние резонанса). В этой статье мы рассмотрим нейронную сеть ART-1 [2], она относится к дискретным рекуррентным нейронным сетям и состоит из трёх слоёв (входного и двух обрабатывающих) и двух специальных блоков (управления и сброса). Схема этой сети приведена на рис.1.

Общая схема функционирования сети выглядит следующим образом.
  1. Сигнал через входной слой подается на нейроны первого слоя.
  2. Взвешенные (с помощью матрицы весов ) выходы первого слоя поступают на входы второго слоя.
  3. Взвешенные (с помощью матрицы весов ) выходы второго слоя возвращаются к первому слою.
  4. Выходы первого слоя и входной вектор сравниваются, выполняется проверка состояния резонанса, т.е. проверяется "узнала" система образ или нет.
  5. Если резонанс не установлен, то модифицируется второй слой и процедура повторяется со второго шага.


В этой работе реализован классификатор бинарных (черно-белых) картинок с изображением цифр. На вход нейронной сети подаётся картинка в формате BMP. Входной слой сети ( на рис.1) состоит из 1581 нейронов, размер первого слоя ( на рис.1) равен размеру входного слоя , размер второго слоя (слой на рис.1) определяет емкость памяти системы, в данном случае - 10 нейронов. Данная реализация классификатора показала способность к обобщению немного хуже двухслойного персептрона [2]. Однако она обладает способностью отделять новые образы от искажённых старых (тех, что уже предъявлялись), а так же ART-1, в отличие от персептронов, способна постоянно (быстро) обучаться, не "забывая" при этом старые образы.


Литература

  1. Grossberg S. Competitive learning: From interactive activation to adaptive resonance // Cognitive Science N11/1987
  2. В.А.Головко, под ред.проф.А.И.Галушкина Нейронные сети: обучение, организация и применение. - Москва: ИПРЖР, 2001