Банковское дело / Доходы и расходы / Лизинг / Финансовая статистика / Финансовый анализ / Финансовый менеджмент / Финансы / Финансы и кредит / Финансы предприятий / Шпаргалки Главная Финансы Финансы
Д.Э. БЭСТЕНС, В.М. ВАН ДЕН БЕРГ, Д. ВУД. Нейронные сети и финансовые рынки: принятие решений в торговых операциях. - Москва: ТВП,1997. - хх, 236 с., 1997 | |
Отбор и диагностика модели |
|
Проверка свойств модели временного ряда - необходимое условие для надежного предсказания и для понимания природы имеющихся закономерностей. К сожалению, этот вопрос слабо освещен в литературе. время Разности между истинными и оцененными значениями должны подчиняться гауссовскому распределению с нулевым средним. Если оказалось, что распределение имеет слишком тяжелые хвосты или несимметрично, то нужно пересмотреть модель. Среди значений разностей могут выявиться закономерности или последовательные корреляции, тогда необходимо дополнительное обучение или улучшение модели. а1) [_ т ж т 1 1 ж V ж V 1 1 время а2) Ь Т 1 Т 1 ж | 1 Ш 1 I Н 1 | V V время Ь: обучающее Т: тестовое V: подтверждающее множество множество множество Ь) Исходное обучающее множество Шаг 1 Шаг 2 Шаг 3 Шаг 4 Рис. 2.6. Различные статические методы обучения (а) и обучение по меняющимся промежуткам времени (6) Оценка качества модели обычно основывается на критерии согласия типа средней квадратичной ошибки (МБЕ) или квадратного корня из нее (ЯМБЕ). Э ги критерии показывают, насколько предсказанные значения оказались близки к обучающему, подтверждающему или тестовому множествам. Для рядов с большим разбросом Лапедес [171] предложил критерий средней относительной вариации: У К-х()2 У е(2 агу(5)= ^ 2 (6) где 5 - временной ряд, е( - разность (истинное значение с1( минус х ) в момент (х,) - оценка для среднего значения ряда, NЧ число данных в ряде. Последующая нормализация с помощью оценки для вариации позволяет проводить более надежные сравнения для различных приложений. Используя предыдущее значение целевой переменной, можно оценить способность модели предсказывать на один шаг вперед. Подставляя предсказанные значения на место истинных, получим метод предсказания на к шагов вперед. Если через несколько шагов модель начинает отклоняться от настоящей траектории, это значит, что в ней присходит накопление и рост ошибки (см. [290], [275]). Самый распространенный метод выбора нейронно-сетевой моде-ли с наилучшим обобщением - это проверка критерия согласия (МБЕ, АЯУ и др.) на тестовом множестве, которое не использовалось при обучении. Если же данных мало, разбивать их на обучающее и подтверждающее множество нужно разными способами. Такое пере-крестное подтверждение может потребовать много времени, особенно для нейронных сетей с их длительным процессом обучения. В линейном анализе временных рядов можно получить несмещенную оценку способности к обобщению, исследуя результаты работы на обучающем множестве (МБЕ), число свободных параметров (VI/) и объем обучающего множества (Л/). Оценки такого типа называются информационными критериями (1С) и включают в себя ком-поненту, соответствующую критерию согласия, и компоненту штрафа, которая учитывает сложность модели. Барроном [30] были пред-ложены следующие информационные критерии: нормализованный 1С Акаике (ЫА1С), нормализованный байесовский 1С (ЫВ1С) и итоговая ошибка прогноза (БРЕ): ТМ ЫА1С=1п (М8Е) + ^г, IV/ ЫВ1С = 1п(М8Е) + 1п ЛГ, (7) N (^н'/лГ БРЕ = МБЕ Было показано [198], что БРЕ представляет собой несмещенную оценку способности к обобщению для нелинейных моделей, в частности, - для нейронных сетей. К сожалению, при этом предпо-лагается, что в нашем распоряжении имеется бесконечное число на-блюдений, - в этом случае оценка надежности модели, вообще, не представляет особых сложностей. Ясно, что информационные критерии дают информацию об аде-кватности модели и помогают выбрать модель подходящего уровня сложности. Другие методы диагностики позволяют, если такая задача стоит, избежать подхода к системе как к лчерному ящику. По-скольку основное отличие сети от линейной регрессии - это воз-можность применять нелинейные преобразователи, имеет смысл по-смотреть, насколько глубоко модель использует свои нелинейные возможности. Проще всего это сделать с помощью введенного Ви- гендом [275] отношения: вариация сетевых разностей , > 1Н = . (о,) вариация разностей регрессии Для более тщательной проверки нелинейных возможностей нужно изобразить распределение выходных значений для скрытых эле-ментов. Слишком большая доля крайних значений (0 или 1) говорит о том, что некоторые элементы попали в режим насыщения3. Еще один способ - построить совместное распределение линейного и нелинейного выходов и применить линейную регрессию. Отклонения от наклона с углом 45 говорят о том, что нелинейные возможности задействованы [84]. Между прочим, встречается точка зрения, что появление во время обучения резких изменений разностей говорит об использовании нелинейностей. К сожалению, это не соответ-ствует действительности. Следует также проверить, скоррелированны ли действия скрытых элементов. В многомерном регрессионном анализе при росте муль- тиколлинеарности значения коэффициентов регрессии становятся все менее надежными. Так же и здесь предпочтительно, чтобы выходы скрытых элементов одного слоя были некоррелированны. Нужно найти собственные значения корреляционной матрицы для выходов скрытых узлов по данным обработки всех обучающих примеров. При полной некоррелированности все собственные значения будут равны единице, а отличия от единицы говорят об избыточном числе скрытых элементов. Кроме того, для анализа внутреннего представления нейронно-сетевой модели часто применяются методы кластерного анализа (см. [127]). |
|
<< Предыдушая | Следующая >> |
= К содержанию = | |
Похожие документы: "Отбор и диагностика модели" |
|
|