Банковское дело / Доходы и расходы / Лизинг / Финансовая статистика / Финансовый анализ / Финансовый менеджмент / Финансы / Финансы и кредит / Финансы предприятий / Шпаргалки Главная Финансы Финансы
Д.Э. БЭСТЕНС, В.М. ВАН ДЕН БЕРГ, Д. ВУД. Нейронные сети и финансовые рынки: принятие решений в торговых операциях. - Москва: ТВП,1997. - хх, 236 с., 1997

НЕЙРОННО-СЕТЕВАЯ МОДЕЛЬ

Эта модель была построена на материале 45 ежемесячных промас- штабированных наблюдений за период с января 1989 г. по сентябрь 1992 г. Оставшиеся 6 наблюдений (с октября 1992 г. по март 1993 г.) использовались для проверки модели. К сожалению, MoF не смогло получить более объемную базу данных. В связи с тем, что относительно малый объем данных не позволял использовать подтверждающее множество, результаты, показанные на тестовом множестве, не являются максимально выверенными в смысле проверки на дополнительных примерах.
В итоге была выбрана модель сети МВРЫ (13-2-1) с одним скрытым слоем, содержащим два элемента, и прямыми связями между входом и выходом. Коэффициент обучения был взят равным 0.8, а крутизнаЧ равной 1. Далее мы приводим данные по среднеквадратичной ошибке на обучающем и тестовом множествах для различных конфигураций.
Для некоторых конфигураций количество весов явно превосходило число входных данных (наблюдений). Хотя недостаток степеней свободы делает оценку сомнительной, мы приводим здесь результаты работы 13-27-1 модели, чтобы проиллюстрировать доказанную Колмогоровым в 1957 г. и популяризованную Хехт-Нильсеном [137] теорему о существовании отображения. Эта теорема утверждает, что любая непрерывная функция может быть реализована трехслойной нейронной сетью, имеющей во входном слое т (в нашем случае 13) элементов, промасштабированных на [0,1], (2т -И) элементов-процессоров в единственном скрытом слое и м элементов в выходном слое. Таким образом, гарантируется, что иерархическая многослойная нейронная сеть может решить любую нелинейно отделимую задачу и может точно реализовать любое отображение т-мерных входных векторов в л-мерные выходные. При этом теорема ничего не говорит нам ни о возможности реализовать отображение посредством сети меньших размеров, ни о том, что для этого подойдут обычно используемые сигмоидные преобразования. Тип сети MSE при обучении MSE при проверке Число эпох Число весов NBIC 13-2-1 0.021 0.063 45 44 -0.231 13-3-1 0.019 0.066 55 59 0.9639 13-4-1 0.016 0.07 45 74 2.0338 13-5-1 0.019 0.065 55 89 3.4808 13-10-1 0.026 0.063 10 164 10.154 13-27-1 0.021 0.055 22 419 31.477 Таблица 4.1. Сводка результатов для сетей различной конфигурации
Для определения наилучшего размера сети мы пользовались известным правилом для временных рядов, которое называется байесовским информационным критерием (BIC). В случае, когда две модели давали одинаковое качество результатов, предпочтение отдавалось более простой из них, т.е. имеющей меньшее число параметров. Де Гроот и Вуртц [83] предложили модифицированный нормализованный BIC под названием NBIC в виде
( InN
NBIC = In
ло
У^ (Цел.перем.к - Прогнозк )2 N

где к = 1,2,NЧ число наблюдений в обучающем множестве р - число весов.
Первое слагаемое представляет собой логарифм среднеквадратич-ной ошибки на обучающем множестве. Второе слагаемое зависит от числа степеней свободы и растет линейно с ростом размера сети. Критерий действует так: сеть, имеющая наименьшее значение NBIC, обладает наилучшими способностями к прогнозу и обобщению. Видно, что из всех испробованных конфигураций наилучшей оказалась сеть 13-2-1.
При относительно простой конфигурации эта сеть имеет 44 потенциальных степени свободы при том, что в обучающем множестве имеются 45 наблюдений. Чтобы смягчить это несоответствие, мы убрали несколько переменных, сильно коррелированных либо с Миль- опен-нотой (V2), либо с потреблением (V5). Таким образом были исключены следующие переменные:
совокупные вложения в ценные бумаги с фиксированным доходом (V7),
уровень безработицы (V8), индекс курсов акций CBS (V9), предложение денег (V10).
0.07
0.06
0.05
И 0.04 сл
S о.оз 0.02 0.01

_L
_L

_L
о
270 500 1000
_L
1500 2000 2500 5000 7500 10000 12500 Число циклов (округленно)

ЧоЧ Обучение ЧжЧ Тестирование Рис. 4.1. МБЕ на обучающем и проверочном множествах
В результате получилась архитектура 9-2-1 с 32 параметрами, для которых была проделана повторная оценка. На диаграмме показана
MSE на обучающем и проверочном множествах. Оптимальная длительность обучения составляет примерно 7500 циклов. При дальнейшем увеличении числа эпох в обучении MSE па проверочном множестве начинала медленно расти.
По сравнению с 13-2-1 сетью значения MSE и на обучающем, и на проверочном множествах получаются чуть-чуть лучше. Перед тем, как делать выводы собственно о структуре сети, разумно сравнить ее результаты с такими классическими методами, как многомерная регрессия или модель ARIMA (собственной разработки MoF).
Наряду с таким хорошим критерием успеха, как MSE, можно пользоваться также так называемой средней относительной дисперсией ARV (см. [275]):
Y;V (Цел.перем . - Прогноз^)2 \Д С F
ARV = ^f- Ч Ч = (2)
У, (Цел перем.д. - Среднее)2 ст
где NЧ число наблюдений, СреднееЧ среднее значение целевого ряда, ст2 - дисперсия целевого ряда.
Нормировка MSE устраняет зависимость от динамического разброса данных и учитывает волатильность внутри базы данных. Оценка качества работы сети будет дана в сравнении с результатами регрессии и модели ARIMA. Оба этих метода будут вкратце изложены. Регрессионная модель была построена с использованием только 45 наблюдений из обучающего множества:
RECEIPT; = а -ьР0 CALt+p, ANNUAL,+Р2 SEA,
+ Р3 DAYt+p4 CON, з + р5 AIBORt+P6 CYCt + P7 RAIN,+ p8 ТЕМ,+ef. (3)
Одна из переменныхЧ ANNUAL, помесячная раскладка годового прогноза правительства, имеет здесь особенно большое значение. Это неудивительно, поскольку MoF рассматривает эту зависимую пе-ременную как цель и старается приблизить значение целевой переменной (RECEIPT) к правительственному прогнозу (это - пример так называемого условного прогнозирования). Число рабочих дней (DAY), календарные эффекты (CAL) и сезонность (SEA) также играют существенную роль. Погода (RAIN,ТЕМ), ожидаемая процентная ставка (AIBOR) и потребление (CON) существенного влияния на решение не оказывают.
Значение статистического показателя Дарбина-Уотсона указывает на наличие отрицательной корреляции разностей ряда. Поэтому было бы разумно перейти к разностям первого порядка или преобразовать регрессионную модель к такому виду, когда применима процедура OLS (например, итерационный процесс Кокрана-Оркутта). Однако, поскольку МоБ больше заинтересовано в прогнозировании уровня, а не тренда, разности тут плохо подходят. Обычный регрессионный ОЬБ-анализ в применении к прогнозу ежемесячных налоговых сборов дал неудовлетворительные результаты. Поэтому МоБ решило применить одномерный метод Бокса-Дженкинса. Получившаяся в результате модель АШМА(0,0,0)(0,1,1)12 с параметрами, определенными из того же самого обучающего множества данных, имеет следующий вид:
(1-В12)1пг( = 0.04367+ (1-0.751 В12)аг. (4)
Здесь В - оператор сдвига назад, а а - составляющая ошибки.
Дисперсионный анализ
РБ Сумма квадратов Средний квадрат Регрессия 9 .85000 .09444 Разность 35 .79126 .02261 F=4.17758 Значимость P =.0010 Переменная В SEB Beta T SigT RAIN -.023820 .110330 -.028191 -.216 .8303 SEA .152681 .104093 .206986 1.467 .1514 AIBOR -.064621 .153774 -.058243 -.420 .6769 CON -.222539 .239240 -.277351 -.930 .3586 CAL .111763 .079241 .213171 1.410 .1672 ТЕМ .111333 .100348 .157154 1.109 .2748 CYC .081578 .092620 .128230 .881 .3844 DAY .188244 .126605 .246653 1.487 .1460 ANNUAL .349709 .173124 .575489 2.020 .0511 (КОНСТАНТА) .060655 .125002 .485 .6305 Значение теста ДарбинаЧУотсона = 2.94431
Таблица 4.2. Сводные результаты регрессионного анализа
Сравнительные характеристики всех трех методов видны из сопоставления соответствующих значений АКУ (средней относительной дисперсии):
Регрессия АШМА Сеть
Обучение 0.4821 4.621 0.3165
Проверка 0.8972 3.845 0.7049

Рис. 4.2. Общая сумма налогов: оценки и действительность
И регрессия, и сеть имеют лучшие характеристики, чем АММА. Причина этого в том, что АММА является одномерной моделью, где в принципе не могут учитываться календарные эффекты или число рабочих дней. Совокупное действие этих эффектов, начиная с сентября 1991 г., вызывает колебания уровня поступлений налогов от месяца к месяцу и внутри месяцев. Далее, сеть дает более точную оценку, чем регрессия. Причина может быть связана с присутствующей в данных нелинейностью. Значения 9?-отношения Вигенда1 0.705 и 0.743, соответственно, для обучающего и тестового множеств также свидетельствуют о наличии (возможно, слабых) нелинейных связей.
Коль скоро сеть имеет лучшие характеристики, чем модель АММА и регрессия, попробуем разобраться в ее внутренней структуре и рассмотрим вклад каждой из девяти фазовых переменных.
<< Предыдушая Следующая >>
= К содержанию =
Похожие документы: "НЕЙРОННО-СЕТЕВАЯ МОДЕЛЬ"
  1. Введение
    нейронные сети (сети компьютерных процессоров, взаимодействие которых построено по образцу процессов обучения, происходящих в человеческом мозге) и генетические алгоритмы (методы, в которых, исходя из большого набора первоначальных предположений, вырабатывают все более правильные представления о поведении рынка и, в конечном счете, более содержательные рабочие гипотезы). Про методы обоих видов
  2. Нейронно-сетевые методы
    нейронно-сетевых моделей. Описаны принципы разработки, обучения и оценки эффективности. Показано, каким образом множество задач, сильно различающихся параметрами сложности и устойчивости, может быть охвачено единой сетевой
  3. Отбор и диагностика модели
    нейронно-сетевой моде-ли с наилучшим обобщением - это проверка критерия согласия (МБЕ, АЯУ и др.) на тестовом множестве, которое не использовалось при обучении. Если же данных мало, разбивать их на обучающее и подтверждающее множество нужно разными способами. Такое пере-крестное подтверждение может потребовать много времени, особенно для нейронных сетей с их длительным процессом обучения. В
  4. Результаты работы
    нейронные сети продемонстрировали примерно такую же эффективность, как и модель Бокса-Дженкинса, в шести случаях - лучшую, и только в одном - для доходов частных лиц - заметно худшую. Для семи из восьми рядов ежемесячных показателей сеть дала значительно лучшие результаты, чем модель Бокса-Дженкинса ARIMA, и в одном случае ошибки были одного порядка. Суммируя результаты по всем 18 рядам, можно
  5. СЕТЕВАЯ ОЦЕНКА В ДВУМЕРНОЙ ЗАДАЧЕ (ОТОБРАЖЕНИЕ ХЕНОНА)
    нейронными сетями, мы сначала выполнили линейную регрессию на первых 153 членах временного ряда. Результаты регрессии для х{ представлены в табл. 3.2. Коэффициенты регрессии, в том числе сдвиг, существенно отличны от нуля на 95-процентном уровне. Уточненный В.1 равен 0. П.6 Коэффициен Стандартная 1- -статистика Р-значение Нижний Верхний ты 1 ошибка 95%-й уровень 95%-й уровень
  6. ВЫВОДЫ
    нейронно-сетевой модели. Показатели работы сети могут улучшиться после разбиения целевой переменной на составные части, потому что, например, на размер налога с продаж влияют одни факторы, а на размер налогов на наследство - совсем другие. Другой способ состоит в том, чтобы свести целевую переменную к совокупности банковских счетов. Так как разные группы налогоплательщиков перечисляют налоги на
  7. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ
    нейронные сети, позволяют получать возможности для извлечения прибыли на ограниченных отрезках времени и/или на краткосрочных контрактах. Даже если предположить, что рынок рационален, т.е. что все индивидуальные инвесторы ведут себя в среднем рационально, это вовсе не значит, что не может существо-вать не замеченных ранее закономерностей в ценах и различных индикаторах рынка. Поскольку новые
  8. СПОСОБЫ ОЦЕНКИ РЕЗУЛЬТАТОВ
    нейронной сети. Первый вопрос касается базовой валюты. Очевидно, что американский инвестор измеряет доходы и капитал в долларах и будет заинтересован в долларовой прибыли, так что на доходе его портфеля будет отражаться валютный риск, свойственный любым заграничным инвестициям. Инвестор из другой страны может на полном основании совершенно иначе оценивать риск и доход от того же самого портфеля.
  9. ФОРМИРОВАНИЕ ПОРТФЕЛЯ: ЭКСПЕРТНОЕ МНЕНИЕ
    нейронно-сетевых моделях мирового рынка все прогнозы формулируются в терминах отдельных рынков. В тех случаях, когда формат данных не позволяет отслеживать эффективность действий реальных менеджеров на отдельном рынке, мы просто производили перераспределение портфеля. Таким образом, мы приходим к следующей, более узкой задаче: сравнить результаты нейронно-сетевой модели с ежеквартальным
  10. Оценка кредитного рискана основании данных нефинансового характера
    нейронные сети могут работать и с числовыми, и с нечисловыми данными, было предпринято очень мало попыток включить в рассмотрение данные качественного характера. В описанном далее исследовании мы ставили перед собой цель построить нейронно-сетевые классификаторы для двух задач. Первая задача состояла в оценке финансовых трудностей компаний в ситуации ex ante на основе информации, которой