Isbn 978-5-7262-1226 нейроинформатика 2010
Вид материала | Документы |
- Isbn 978-5-7262-1226 нейроинформатика 2010, 142.85kb.
- Isbn 978-5-7262-1226 нейроинформатика 2010, 136.25kb.
- Isbn 978-5-7262-1226 нейроинформатика 2010, 9.21kb.
- Isbn 978-5-7262-1226 нейроинформатика 2010, 113.94kb.
- Isbn 978-5-7262-1226 нейроинформатика 2010, 89.17kb.
- Isbn 978-5-7262-1226 нейроинформатика 2010, 124.83kb.
- Isbn 978-5-7262-1226 нейроинформатика 2010, 86.68kb.
- Isbn 978-5-7262-1377 нейроинформатика 2011, 107.92kb.
- Isbn 978-5-7262-1375 нейроинформатика 2011, 127.94kb.
- Isbn 978-5-7262-1375 нейроинформатика 2011, 25.66kb.
ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 2
М.В. КРЫЖАНОВСКИЙ, М.Ю. МАЛЬСАГОВ
Научно исследовательский институт системных исследований РАН, Москва
iont.niisi@gmail.com
УСКОРЕНИЕ МОДИФИЦИРОВАННОЙ ПРОЦЕДУРЫ
КЛИППИРОВАНИЯ1
Исследована возможность применения обобщенной процедуры клиппирования в задаче оптимизации квадратичного функционала
![](images/125214-nomer-1e42a286.gif)
Введение
Модифицированная процедура клиппирования [1] заключается в замене элементов матрицы межсвязей
![](images/125214-nomer-m692ed715.gif)
![](images/125214-nomer-m44ee4681.gif)
где
![](images/125214-nomer-m4629522a.gif)
![](images/125214-nomer-1b0505a4.gif)
![](images/125214-nomer-m692ed715.gif)
![](images/125214-nomer-m8ac1001.gif)
Алгоритм поиска глобального минимума квадратичного функционала с использованием обобщенной процедуры клиппирования состоит из трех этапов: первый и второй этапы используют сеть Хопфилда с клиппированной матрицей межсвязей,
![](images/125214-nomer-3014e9cb.gif)
![](images/125214-nomer-55558e7b.gif)
В работе показано, что:
- С увеличением числа градаций вероятность совпадения градиентов увеличивается, и для данного
эта вероятность не зависит от размерности сети.
- Предлагаются модификации алгоритма поиска и схемы расчета градиента, которые позволяют дополнительно увеличить его быстродействие.
Клиппирование при поиске глобального минимума
Проанализируем корреляцию градиентов
![](images/125214-nomer-ma998b8d.gif)
![](images/125214-nomer-m6b78cf62.gif)
![](images/125214-nomer-m7f1ef379.gif)
![](images/125214-nomer-m41fe49ff.gif)
![](images/125214-nomer-5f1ffc09.gif)
![](images/125214-nomer-m4f109dba.gif)
Величина
![](images/125214-nomer-6655be40.gif)
![](images/125214-nomer-m34d4971a.gif)
![](images/125214-nomer-m77cd831c.gif)
![](images/125214-nomer-m3cfd78a6.gif)
![](images/125214-nomer-m2d2e5bf6.gif)
![](images/125214-nomer-m4bc38bd0.gif)
![](images/125214-nomer-mcac68ee.gif)
![](images/125214-nomer-ma998b8d.gif)
![](images/125214-nomer-m6b78cf62.gif)
![](images/125214-nomer-m63bd4bf9.gif)
Элементы исходной матрицы
![](images/125214-nomer-m34d4971a.gif)
![](images/125214-nomer-m5b15679e.gif)
![](images/125214-nomer-m7cc90290.gif)
![](images/125214-nomer-m63d23ba6.gif)
![](images/125214-nomer-6999ed0f.gif)
![](images/125214-nomer-7fdcbd66.gif)
![](images/125214-nomer-52081907.gif)
![](images/125214-nomer-6373fda5.gif)
![](images/125214-nomer-3575e414.gif)
![](images/125214-nomer-me9eedd9.gif)
С учетом выражений (5)-(7) коэффициент корреляции
![](images/125214-nomer-153c3fa.gif)
![](images/125214-nomer-m63d23ba6.gif)
![](images/125214-nomer-6999ed0f.gif)
![](images/125214-nomer-22871a6d.gif)
При
![](images/125214-nomer-43135eda.gif)
![](images/125214-nomer-62b61c5f.gif)
![](images/125214-nomer-5704522e.gif)
В свою очередь вероятность совпадения направления полей
![](images/125214-nomer-mcac68ee.gif)
![](images/125214-nomer-m538585d8.gif)
где
![](images/125214-nomer-132f8a1e.gif)
Интеграл (9) сводится к формуле
![](images/125214-nomer-6c024d0f.gif)
Из приведенного на рис.1 графика, формул (9) и (10) следует, что локальные градиенты исходного и клиппированного функционалов с большой вероятностью совпадают
![](images/125214-nomer-76e63b4.gif)
![](images/125214-nomer-1b0505a4.gif)
![](images/125214-nomer-70c16b3d.gif)
![](images/125214-nomer-m6ad79398.gif)
![](images/125214-nomer-11cbb69a.gif)
![](images/125214-nomer-34f52025.gif)
![](images/125214-nomer-1a71837a.gif)
Рис. 1. Вероятность совпадения градиентов клиппированного и исходного функционалов в зависимости от коэффициента корреляции в случайной точке. (Сплошная линия – теоретическая зависимость (10), точки – экспериментальные данные)
![](images/125214-nomer-7daa250d.gif)
Рис. 2. Вероятность совпадения градиентов при использовании обобщенной процедуры клиппирования (кривая 1 – в случайной точке, кривая 2 – в точках минимума клиппированного функционала, кривая 3 – в точках минимума исходного функционала)
Полученные теоретические результаты точно согласуются с экспериментальными данными (рис. 1). Так измеренная экспериментально вероятность совпадения градиентов для модифицированного метода при
![](images/125214-nomer-43135eda.gif)
![](images/125214-nomer-m549b71dc.gif)
![](images/125214-nomer-m24d7b651.gif)
На рис. 2 представлены экспериментальные данные вероятности совпадений градиентов
![](images/125214-nomer-m2568a5ed.gif)
![](images/125214-nomer-mee01091.gif)
![](images/125214-nomer-m681e1896.gif)
Как следует из приведенных выше формул (8), (10) и экспериментальных результатов (рис. 1 и 2), вероятность совпадения градиентов возрастает с увеличением q и для фиксированного значения q эта вероятность не зависит от размерности сети.
Трехэтапный алгоритм клиппирования
Основной объем вычислений при расчетах нейронной сети Хопфилда приходится на вычисление градиентов, т.е. на операции умножения матрицы на вектор. Для матриц высокой размерности
![](images/125214-nomer-m71d758dd.gif)
Идея модификации заключается в применении целых чисел в одно- и двухбайтовом представлении для матричных элементов. Соответственно этому и был построен алгоритм спуска по «энергетической поверхности», который состоит из 3-х этапов, когда локальный минимум, полученный на текущем этапе, являлся начальным приближением для следующего этапа. На первом и втором этапах использовалась модификация клиппирования с числом градаций
![](images/125214-nomer-ad4a372.gif)
![](images/125214-nomer-m3abc9ce4.gif)
Ускорение вычислительного процесса зависит от числа градаций
![](images/125214-nomer-m2e969424.gif)
![](images/125214-nomer-1b0505a4.gif)
![](images/125214-nomer-m3b9bf5e.gif)
Для определения оптимального значения
![](images/125214-nomer-m2e969424.gif)
![](images/125214-nomer-6396b1c1.gif)
Результаты вычислительного эксперимента приведены в табл. 1. Ускорение
![](images/125214-nomer-6396b1c1.gif)
![](images/125214-nomer-3610dd59.gif)
где
![](images/125214-nomer-m40d480c2.gif)
![](images/125214-nomer-6d10ff75.gif)
![](images/125214-nomer-m418919e6.gif)
![](images/125214-nomer-m6b4612c6.gif)
Установлено, что в среднем
![](images/125214-nomer-m83956ba.gif)
![](images/125214-nomer-51c2885a.gif)
![](images/125214-nomer-m343add1b.gif)
Таблица 1
Ускорения алгоритма по сравнению со стандартным методом Хопфилда
в зависимости от значений параметра
![](images/125214-nomer-m250e233a.gif)
-
Размерность сети N = 256
Число градаций, q
Ускорение алгоритма, θ
2
3,3
4
4,3
8
7,9
12
10,3
15
11,2
32
6,4
64
3
Быстродействие алгоритма зависит от выбора параметра
![](images/125214-nomer-m2e969424.gif)
![](images/125214-nomer-m2a1b528.gif)
![](images/125214-nomer-2c23e955.gif)
![](images/125214-nomer-5b7e0fd5.gif)
![](images/125214-nomer-m2a1b528.gif)
![](images/125214-nomer-33cc38fc.gif)
При увеличении числа градаций на 2-м этапе число шагов на этапе коррекции состояний сокращается до 1. Поэтому на втором этапе должно быть выбрано максимальное значение
![](images/125214-nomer-m42b0fdd5.gif)
![](images/125214-nomer-m20ab93c4.gif)
Изменение схемы поиска
Эксперименты из [1] показали, что с увеличением числа градаций, старты из более глубокого минимума клиппированного функционала приводят к нахождению более глубокого минимума исходного функционала. Поэтому логично предположить, что достаточно стартовать только из наиболее глубоких минимумов клиппированного функционала. Для подтверждения этого предположения были проведены дополнительные эксперименты, а именно:
а) Производились спуски по клиппированной сети и фиксировались значения энергий клиппированной сети.
б) Определялось среднее значение энергии клиппированной сети, которое разбивало область значений на левую и правую части.
в) Из минимумов клиппированной сети производились спуски по обычной сети Хопфилда.
г) Определялся самый глубокий минимум обычной сети.
д) Определялось, есть ли попадание в самый глубокий минимум из левой и правой областей энергетического спектра клиппированной сети.
На рис. 3 приведены результаты экспериментов для
![](images/125214-nomer-3014e9cb.gif)
![](images/125214-nomer-m2601c4b7.gif)
Рис. 3. Вероятность попадания в самый глубокий минимум из левой и правой
областей энергетического спектра клиппированной сети
Видно, что вероятность найти наиболее глубокий минимум хотя бы один раз при стартах из состояний левой области значительно больше, чем при стартах из состояний правой области. Среднее значение этой вероятности 0,96. Это означает, что для нахождения наиболее глубокого минимума спуски из состояний, принадлежащих правой области, малоэффективны, и при поиске достаточно проводить коррекцию состояний из левой области. Это уменьшает объем вычислений в 2 раза. В этом случае формула (11а) приобретает вид
![](images/125214-nomer-112a83ea.gif)
Модификация схемы расчета градиента
Можно заметить, что достаточно в самом начале вычислить сумму
![](images/125214-nomer-fa898c6.gif)
![](images/125214-nomer-m29dd39c1.gif)
![](images/125214-nomer-m705ff654.gif)
![](images/125214-nomer-m59b5e82f.gif)
Подобная модификация расчета градиента уместна при малом количестве переворачиваемых спинов.
![](images/125214-nomer-21086a2.gif)
Рис. 4. Изменение расстояния до локального минимума по Хеммингу состояния от номера шага (рисунок слева). Количество изменяемых компонент состояния на каждом шаге (рисунок справа)
На рис. 4 показано, как меняется количество переворачиваемых спинов на каждом шаге (
![](images/125214-nomer-m30824787.gif)
Таблица 2
Ускорение алгоритма при использовании
модифицированной схемы расчета градиента
Размерность, N | Ускорение, Θ |
100 | 5 |
200 | 6 |
400 | 8 |
800 | 10 |
1600 | 11 |
3200 | 19 |
В табл. 2 показана зависимость ускорения работы сети с модифицированной схемой расчета градиента, по сравнению с обычной, в зависимости от размерности сети. Здесь
![](images/125214-nomer-m531d9a2c.gif)
где
![](images/125214-nomer-m121a7efd.gif)
![](images/125214-nomer-5a593afe.gif)
Видно, что подобная модификация расчета градиента более, чем в 5 раз уменьшает объем вычислений.
Заключение
Применение описанных в данной статье модификаций работы алгоритма и схем расчета позволяет уменьшить время поиска глобального минимума в 40-50 раз по сравнению с вычислениями, проводимыми с помощью сети Хопфилда.
Список литературы
- Крыжановский М.В., Мальсагов М.Ю. Применение процедуры клиппирования и ее обобщение в задачах поиска глобального минимума // XI Всероссийская научно-техническая конференция «Нейроинформатика-2009». М.: МИФИ, т.2, с. 61, 2009.
1 Работа выполнена при поддержке гранта РФФИ 09-07-00159-а.
УДК 004.032.26(06) Нейронные сети