Банковское дело / Доходы и расходы / Лизинг / Финансовая статистика / Финансовый анализ / Финансовый менеджмент / Финансы / Финансы и кредит / Финансы предприятий / Шпаргалки Главная Финансы Финансы
Д.Э. БЭСТЕНС, В.М. ВАН ДЕН БЕРГ, Д. ВУД. Нейронные сети и финансовые рынки: принятие решений в торговых операциях. - Москва: ТВП,1997. - хх, 236 с., 1997 | |
НЕЙРОННО-СЕТЕВАЯ МОДЕЛЬ |
|
Эта модель была построена на материале 45 ежемесячных промас- штабированных наблюдений за период с января 1989 г. по сентябрь 1992 г. Оставшиеся 6 наблюдений (с октября 1992 г. по март 1993 г.) использовались для проверки модели. К сожалению, MoF не смогло получить более объемную базу данных. В связи с тем, что относительно малый объем данных не позволял использовать подтверждающее множество, результаты, показанные на тестовом множестве, не являются максимально выверенными в смысле проверки на дополнительных примерах. В итоге была выбрана модель сети МВРЫ (13-2-1) с одним скрытым слоем, содержащим два элемента, и прямыми связями между входом и выходом. Коэффициент обучения был взят равным 0.8, а крутизнаЧ равной 1. Далее мы приводим данные по среднеквадратичной ошибке на обучающем и тестовом множествах для различных конфигураций. Для некоторых конфигураций количество весов явно превосходило число входных данных (наблюдений). Хотя недостаток степеней свободы делает оценку сомнительной, мы приводим здесь результаты работы 13-27-1 модели, чтобы проиллюстрировать доказанную Колмогоровым в 1957 г. и популяризованную Хехт-Нильсеном [137] теорему о существовании отображения. Эта теорема утверждает, что любая непрерывная функция может быть реализована трехслойной нейронной сетью, имеющей во входном слое т (в нашем случае 13) элементов, промасштабированных на [0,1], (2т -И) элементов-процессоров в единственном скрытом слое и м элементов в выходном слое. Таким образом, гарантируется, что иерархическая многослойная нейронная сеть может решить любую нелинейно отделимую задачу и может точно реализовать любое отображение т-мерных входных векторов в л-мерные выходные. При этом теорема ничего не говорит нам ни о возможности реализовать отображение посредством сети меньших размеров, ни о том, что для этого подойдут обычно используемые сигмоидные преобразования. Тип сети MSE при обучении MSE при проверке Число эпох Число весов NBIC 13-2-1 0.021 0.063 45 44 -0.231 13-3-1 0.019 0.066 55 59 0.9639 13-4-1 0.016 0.07 45 74 2.0338 13-5-1 0.019 0.065 55 89 3.4808 13-10-1 0.026 0.063 10 164 10.154 13-27-1 0.021 0.055 22 419 31.477 Таблица 4.1. Сводка результатов для сетей различной конфигурации Для определения наилучшего размера сети мы пользовались известным правилом для временных рядов, которое называется байесовским информационным критерием (BIC). В случае, когда две модели давали одинаковое качество результатов, предпочтение отдавалось более простой из них, т.е. имеющей меньшее число параметров. Де Гроот и Вуртц [83] предложили модифицированный нормализованный BIC под названием NBIC в виде ( InN NBIC = In ло У^ (Цел.перем.к - Прогнозк )2 N где к = 1,2,NЧ число наблюдений в обучающем множестве р - число весов. Первое слагаемое представляет собой логарифм среднеквадратич-ной ошибки на обучающем множестве. Второе слагаемое зависит от числа степеней свободы и растет линейно с ростом размера сети. Критерий действует так: сеть, имеющая наименьшее значение NBIC, обладает наилучшими способностями к прогнозу и обобщению. Видно, что из всех испробованных конфигураций наилучшей оказалась сеть 13-2-1. При относительно простой конфигурации эта сеть имеет 44 потенциальных степени свободы при том, что в обучающем множестве имеются 45 наблюдений. Чтобы смягчить это несоответствие, мы убрали несколько переменных, сильно коррелированных либо с Миль- опен-нотой (V2), либо с потреблением (V5). Таким образом были исключены следующие переменные: совокупные вложения в ценные бумаги с фиксированным доходом (V7), уровень безработицы (V8), индекс курсов акций CBS (V9), предложение денег (V10). 0.07 0.06 0.05 И 0.04 сл S о.оз 0.02 0.01 _L _L _L о 270 500 1000 _L 1500 2000 2500 5000 7500 10000 12500 Число циклов (округленно) ЧоЧ Обучение ЧжЧ Тестирование Рис. 4.1. МБЕ на обучающем и проверочном множествах В результате получилась архитектура 9-2-1 с 32 параметрами, для которых была проделана повторная оценка. На диаграмме показана MSE на обучающем и проверочном множествах. Оптимальная длительность обучения составляет примерно 7500 циклов. При дальнейшем увеличении числа эпох в обучении MSE па проверочном множестве начинала медленно расти. По сравнению с 13-2-1 сетью значения MSE и на обучающем, и на проверочном множествах получаются чуть-чуть лучше. Перед тем, как делать выводы собственно о структуре сети, разумно сравнить ее результаты с такими классическими методами, как многомерная регрессия или модель ARIMA (собственной разработки MoF). Наряду с таким хорошим критерием успеха, как MSE, можно пользоваться также так называемой средней относительной дисперсией ARV (см. [275]): Y;V (Цел.перем . - Прогноз^)2 \Д С F ARV = ^f- Ч Ч = (2) У, (Цел перем.д. - Среднее)2 ст где NЧ число наблюдений, СреднееЧ среднее значение целевого ряда, ст2 - дисперсия целевого ряда. Нормировка MSE устраняет зависимость от динамического разброса данных и учитывает волатильность внутри базы данных. Оценка качества работы сети будет дана в сравнении с результатами регрессии и модели ARIMA. Оба этих метода будут вкратце изложены. Регрессионная модель была построена с использованием только 45 наблюдений из обучающего множества: RECEIPT; = а -ьР0 CALt+p, ANNUAL,+Р2 SEA, + Р3 DAYt+p4 CON, з + р5 AIBORt+P6 CYCt + P7 RAIN,+ p8 ТЕМ,+ef. (3) Одна из переменныхЧ ANNUAL, помесячная раскладка годового прогноза правительства, имеет здесь особенно большое значение. Это неудивительно, поскольку MoF рассматривает эту зависимую пе-ременную как цель и старается приблизить значение целевой переменной (RECEIPT) к правительственному прогнозу (это - пример так называемого условного прогнозирования). Число рабочих дней (DAY), календарные эффекты (CAL) и сезонность (SEA) также играют существенную роль. Погода (RAIN,ТЕМ), ожидаемая процентная ставка (AIBOR) и потребление (CON) существенного влияния на решение не оказывают. Значение статистического показателя Дарбина-Уотсона указывает на наличие отрицательной корреляции разностей ряда. Поэтому было бы разумно перейти к разностям первого порядка или преобразовать регрессионную модель к такому виду, когда применима процедура OLS (например, итерационный процесс Кокрана-Оркутта). Однако, поскольку МоБ больше заинтересовано в прогнозировании уровня, а не тренда, разности тут плохо подходят. Обычный регрессионный ОЬБ-анализ в применении к прогнозу ежемесячных налоговых сборов дал неудовлетворительные результаты. Поэтому МоБ решило применить одномерный метод Бокса-Дженкинса. Получившаяся в результате модель АШМА(0,0,0)(0,1,1)12 с параметрами, определенными из того же самого обучающего множества данных, имеет следующий вид: (1-В12)1пг( = 0.04367+ (1-0.751 В12)аг. (4) Здесь В - оператор сдвига назад, а а - составляющая ошибки. Дисперсионный анализ РБ Сумма квадратов Средний квадрат Регрессия 9 .85000 .09444 Разность 35 .79126 .02261 F=4.17758 Значимость P =.0010 Переменная В SEB Beta T SigT RAIN -.023820 .110330 -.028191 -.216 .8303 SEA .152681 .104093 .206986 1.467 .1514 AIBOR -.064621 .153774 -.058243 -.420 .6769 CON -.222539 .239240 -.277351 -.930 .3586 CAL .111763 .079241 .213171 1.410 .1672 ТЕМ .111333 .100348 .157154 1.109 .2748 CYC .081578 .092620 .128230 .881 .3844 DAY .188244 .126605 .246653 1.487 .1460 ANNUAL .349709 .173124 .575489 2.020 .0511 (КОНСТАНТА) .060655 .125002 .485 .6305 Значение теста ДарбинаЧУотсона = 2.94431 Таблица 4.2. Сводные результаты регрессионного анализа Сравнительные характеристики всех трех методов видны из сопоставления соответствующих значений АКУ (средней относительной дисперсии): Регрессия АШМА Сеть Обучение 0.4821 4.621 0.3165 Проверка 0.8972 3.845 0.7049 Рис. 4.2. Общая сумма налогов: оценки и действительность И регрессия, и сеть имеют лучшие характеристики, чем АММА. Причина этого в том, что АММА является одномерной моделью, где в принципе не могут учитываться календарные эффекты или число рабочих дней. Совокупное действие этих эффектов, начиная с сентября 1991 г., вызывает колебания уровня поступлений налогов от месяца к месяцу и внутри месяцев. Далее, сеть дает более точную оценку, чем регрессия. Причина может быть связана с присутствующей в данных нелинейностью. Значения 9?-отношения Вигенда1 0.705 и 0.743, соответственно, для обучающего и тестового множеств также свидетельствуют о наличии (возможно, слабых) нелинейных связей. Коль скоро сеть имеет лучшие характеристики, чем модель АММА и регрессия, попробуем разобраться в ее внутренней структуре и рассмотрим вклад каждой из девяти фазовых переменных. |
|
<< Предыдушая | Следующая >> |
= К содержанию = | |
Похожие документы: "НЕЙРОННО-СЕТЕВАЯ МОДЕЛЬ" |
|
|