Анализ временных рядов появился в эконометрии в середине 1980 год
Вид материала | Документы |
- Программа дисциплины Анализ финансово-экономических временных рядов для направления, 76.91kb.
- Модификация программного комплекса ас дрм для обработки временных рядов в технике, 125.29kb.
- Рабочая программа дисциплины экономический анализ временных рядов цели и задачи изучения, 118.03kb.
- Современный интеллектуальный анализ нечетких временных рядов, 141.75kb.
- Программа дисциплины Нелинейные модели временных рядов для направления 521600 Экономика, 66.64kb.
- Статистика временных рядов, 19.49kb.
- Пояснительная записка: Требования к студентам: необходимо знание курсов «Математического, 78.04kb.
- Пояснительная записка: Требования к студентам: необходимо знание курсов «Математического, 49.13kb.
- Анализ данных маркетинговых исследований: Корреляционно-регрессионный анализ и анализ, 91.98kb.
- Программа дисциплины Анализ временных рядов для направления 080100. 68 «Экономика», 259.15kb.
Коинтеграционный анализ временных рядов появился в эконометрии в середине 1980 годов и был воспринят многими эконометристами как наиболее важное из последних разработок в эмпирическом моделировании. Базовые идеи и выкладки применения коинтеграционного анализа требуют знания и применения лишь метода наименьших квадратов и опираются на понятия стационарных и нестационарных процессов.
Нестационарность временного ряда всегда была проблемой в эконометрическом анализе. Как было показано в ряде теоретических работ (Филлипс, 1986), в общем случае, статистические характеристики регрессионного анализа, используемые для нестационарных временных рядов, сомнительно.
Если переменные, включаемые в модель в качестве регрессоров, нестационарны, то полученные оценки будут очень плохими. Они не будут обладать свойством состоятельности, т.е. не будут сходиться по вероятности к истинным значениям параметров по мере увеличения выборки. Такие показатели, как коэффициент детерминации
![](images/374614-nomer-755678.png)
Проиллюстрировать этот эффект можно на довольно абсурдном примере:
Пусть
![](images/374614-nomer-m595cff91.png)
![](images/374614-nomer-7ddcb3c1.png)
![](images/374614-nomer-59cb41b5.png)
а
![](images/374614-nomer-62f2c269.png)
![](images/374614-nomer-m32160469.png)
![](images/374614-nomer-8bd2d83.png)
Для n=30 результат регрессии выглядит так:
![](images/374614-nomer-7aa16d9e.png)
в скобках приведены значения статистики Стьюдента,
![](images/374614-nomer-7d3a4eb.png)
Если не принимать во внимание статистику DW, уравнение регрессии выглядит вполне благополучно, хотя и демонстрирует совершенно ложную зависимость. Свидетельством того, что регрессия неверна, является очень низкий уровень DW.
Этот экстремальный вариант демонстрирует опасность интерпретации регрессии для двух детерминированных трендов.
Не лучше обстоит дело, когда переменные содержат стохастический тренд.
Предположим, что две переменные:
![](images/374614-nomer-m391ad44e.png)
![](images/374614-nomer-5dd22646.png)
где
![](images/374614-nomer-636b6f6f.png)
![](images/374614-nomer-m7a2436ae.png)
Рассмотрим два уравнения регрессии:
(a) Между
![](images/374614-nomer-m253d0821.png)
![](images/374614-nomer-1ac888c3.png)
(b)
![](images/374614-nomer-m777d338b.png)
Проведя достаточно много реализаций, например, 50 000, определенного размера (по 50 наблюдений, например, каждая), методом Монте-Карло придем к
![](images/374614-nomer-m253d0821.png)
В случае (а) эмпирическое распределение t-статистики для
![](images/374614-nomer-65f85d3a.png)
В случае (b) эмпирическое распределение t-статистики для
![](images/374614-nomer-7dc5bc52.png)
В итоге, если использовать привычные нам таблицы распределения Стьюдента для проверки значимости регрессий для рядов со стохастическими трендами, в 2/3 случаев можно получить, что регрессия будет «хорошей» (коэффициенты значимы). И примерно в 75% случаев будет отвергнута верная гипотеза об отсутствии связи.
Аналогично с другими коэффициентами. Хотя процессы
![](images/374614-nomer-4fb7a8dc.png)
Вышеприведенные два примера показывают, почему экономисты не любят строить регрессию для временных рядов со стахостическим или детерминированным трендом. Использование метода наименьших квадратов для оценивания параметров и проверки гипотез является эффективным лишь тогда, когда ряды (процессы) являются стационарными.
Многие экономические переменные перед использованием в регрессионном анализе, подвергаются преобразованиям. Наиболее удобным способом освобождения от тренда, с учетом сказанного, является переход к разностям такого порядка, который обеспечивает стационарность.
Для процессов со стохастическим трендом типа случайного блуждания стационарной будет первая разность:
![](images/374614-nomer-75447555.png)
Аналогичный вывод можно сделать для процесса случайного блуждания с дрейфом.
![](images/374614-nomer-m4d379acd.png)
Иногда необходимо переходить к разностям более высокого порядка, чтобы достичь стационарности.
Например, если
![](images/374614-nomer-m42fa9ee7.png)
![](images/374614-nomer-m4fed1c90.png)
![](images/374614-nomer-ea6f09a.png)
![](images/374614-nomer-6f6b2666.png)
то лишь вторая разность этого процесса будет стационарной:
![](images/374614-nomer-m2d29c339.png)
![](images/374614-nomer-164396a2.png)
С позиции этих результатов, особую важность приобретают так называемые интегрированные процессы. Это понятие связано с именами Энгл, Гренджер.
Нестационарный процесс, первые разности которого стационарны, называют интегрированным первого порядка и обозначают I(1).
Стационарный процесс обозначают I(0).
Если k-тые разности случайного процесса стационарны, то его называют интегрированным k-того порядка и обозначают I(k).
Процессы случайного блуждания и случайного блуждания с дрейфом – I(1),
Процесс (1) – интегрированный второго порядка I(2).
С осознанием опасности применения метода наименьших квадратов к нестационарным рядам, появилась необходимость в тестах, которые позволили бы отличить стационарный процесс от нестационарного.
Неформальные методы тестирования стационарности нам уже известны – визуальный анализ графиков автокорреляционной функции и спектральной плотности.
Среди формальных тестов самым известным в настоящее время является тест, разработанный Дики и Фуллером (DF = Dickey-Fuller integration test).
Но в начале о том, как соотносятся стационарность и единичные корни.
Рассмотрим AR(1), причем определим его так:
![](images/374614-nomer-48382ba4.png)
где
![](images/374614-nomer-m1f1a38be.png)
Этот процесс стационарен, если
![](images/374614-nomer-m194fddcb.png)
![](images/374614-nomer-m65a0299e.png)
Если
![](images/374614-nomer-m194fddcb.png)
![](images/374614-nomer-m6b7b0f5f.png)
Откуда легко видно, что
![](images/374614-nomer-m2d27f23b.png)
И математическое ожидание, и дисперсия, и автокорреляция не зависят от времени. То есть AR(1) стационарен, если
![](images/374614-nomer-m194fddcb.png)
Представим это условие стационарности по-другому: запишем уравнение AR(1) через оператор авторегрессии
![](images/374614-nomer-72e85e45.png)
Корнем характеристического уравнения
![](images/374614-nomer-38102726.png)
![](images/374614-nomer-m7b742fb4.png)
• И условие
![](images/374614-nomer-m194fddcb.png)
![](images/374614-nomer-m439bf6f4.png)
• Если
![](images/374614-nomer-9f0d598.png)
![](images/374614-nomer-69eb7324.png)
• Если же
![](images/374614-nomer-2865df3e.png)
![](images/374614-nomer-6bd198d4.png)
Тестирование стационарности, таким образом, напрямую связано с определением единичных корней.
3.1 Определение единичных корней методом Дики-Фуллера
Дики и Фуллер (1979,1981) рассматривают процесс AR(1)
![](images/374614-nomer-83cb595.png)
Нулевая гипотеза
![](images/374614-nomer-m4bb55716.png)
Против альтернативной
![](images/374614-nomer-7affa58e.png)
Т.е. нулевая гипотеза предполагает, что
![](images/374614-nomer-m2d33b440.png)
![](images/374614-nomer-m2d33b440.png)
![](images/374614-nomer-m5e8f6769.png)
На первый взгляд, можно построить уравнение авторегрессии и проверить гипотезу по критерию Стьюдента. Но, как уже отмечалось, процедура тестирования, базирующаяся на применении метода наименьших квадратов, к нестационарному ряду (а
![](images/374614-nomer-m595cff91.png)
![](images/374614-nomer-m7357a6ba.png)
Процедура тестирования должна базироваться на такой модели, которая будет стационарнй при принятии
![](images/374614-nomer-mf3acbdf.png)
Дики и Фуллер предложили приемлемый и простой метод тестирования
![](images/374614-nomer-m595cff91.png)
![](images/374614-nomer-m742ddb2a.png)
где
![](images/374614-nomer-m4ca3e5cf.png)
[действительно:
![](images/374614-nomer-m7468a20b.png)
И строго говоря, DF-тест в качестве
![](images/374614-nomer-mf3acbdf.png)
![](images/374614-nomer-6375061f.png)
Отсюда его название – unit root test – тест на единичный корень.
Уравнение (3) может быть представлено еще следующим образом:
![](images/374614-nomer-m131af826.png)
Если в уравнении (2)
![](images/374614-nomer-m3487b3c5.png)
![](images/374614-nomer-3903242d.png)
Тест DF состоит в проверке отрицательности
![](images/374614-nomer-1fc35dd1.png)
![](images/374614-nomer-m568e48df.png)
![](images/374614-nomer-m28ea31c.png)
![](images/374614-nomer-m3487b3c5.png)
Если
![](images/374614-nomer-m595cff91.png)
![](images/374614-nomer-m8e08caa.png)
![](images/374614-nomer-m7357a6ba.png)
В силу эмпирического скорее, чем теоретического, характера таблиц, они содержат элемент неопределенности – дается не одно, а два теоретических значений – верхнее и нижнее. Если расчетное значение
![](images/374614-nomer-m8e08caa.png)
![](images/374614-nomer-mf3acbdf.png)
![](images/374614-nomer-m595cff91.png)
![](images/374614-nomer-m8e08caa.png)
![](images/374614-nomer-mf3acbdf.png)
Тест Дики-Фуллера может быть использован для проверки стационарности процессов, порожденных случайным блужданием с дрейфом, т.е. путем проверки уравнения:
![](images/374614-nomer-m48d648aa.png)
Техника проверки аналогична. Эквивалентное (4) уравнение:
![](images/374614-nomer-m30a99448.png)
Но с учетом того, что распределение t-статистики для
![](images/374614-nomer-1fc35dd1.png)
![](images/374614-nomer-m4e24ded5.png)
Еще одна модификация уравнения DF – включение линейного детерминированного тренда.
![](images/374614-nomer-3da25102.png)
или
![](images/374614-nomer-86f54c6.png)
Это уравнение позволяет проверить отсутствие стохастического тренда (
![](images/374614-nomer-3903242d.png)
![](images/374614-nomer-m3ae65483.png)
![](images/374614-nomer-92f79ea.png)
Итак, если
![](images/374614-nomer-m3487b3c5.png)
•
![](images/374614-nomer-m3e32c511.png)
•
![](images/374614-nomer-7527192.png)
![](images/374614-nomer-43b100a4.png)
•
![](images/374614-nomer-m596ccc98.png)
![](images/374614-nomer-m3ae65483.png)
ü Если данные генерируются в соответствии с процессом
![](images/374614-nomer-m3e32c511.png)
![](images/374614-nomer-m7357a6ba.png)
![](images/374614-nomer-m2d33b440.png)
ü Если данные получены согласно
![](images/374614-nomer-7527192.png)
![](images/374614-nomer-m7357a6ba.png)
![](images/374614-nomer-m2f03a676.png)
![](images/374614-nomer-m2d33b440.png)
ü Если данные генерируются процессом
![](images/374614-nomer-m596ccc98.png)
![](images/374614-nomer-m7357a6ba.png)
![](images/374614-nomer-7dc5bc52.png)
![](images/374614-nomer-m2d33b440.png)
Если есть основания предполагать, что рассматриваемая переменная нестационарна и имеет тренд, то начать тестирование рекомендуется с регрессии
![](images/374614-nomer-m596ccc98.png)
![](images/374614-nomer-92f79ea.png)
Недостаток теста DF заключается в том, что тест Дики-Фуллера имеет ограничения:
1. Предположение о том, что переменная следует авторегрессионному процессу первого порядка;
2. Ошибки
![](images/374614-nomer-3fc7141f.png)
Дики и Фуллер предложили использовать в качестве дополнительных (экзогенных переменных) регрессоров переменную в левой части уравнения, взятую с различными лагами (лаги первой разности).
Модифицированный тест DF предусматривает авторегрессионные процессы более высоких порядков и носит название дополнительного (расширенного) теста Дики-Фуллера (AFD – augment Dickey-Fuller test).
Базовые уравнения принимают следующий вид:
![](images/374614-nomer-4cd423f9.png)
![](images/374614-nomer-m290c1e4c.png)
![](images/374614-nomer-279318b6.png)
Дополнительная авторегрессионная компонента вводится для того, чтобы убрать автокорреляцию остатков, к которой чувствителен DF-тест. Распределение тестов для этих уравнений асимптотически совпадают с соответствующими тестами DF и используют те же таблицы.
3.2 Концепция коинтеграции
Наличие трендов во временных рядах, пожалуй, можно рассматривать как главную проблему эмпирической эконометрии. Тренды, как стохастические, так и детерминированные, могут стать причиной ложных регрессий.
Но налицо неопровержимый факт: в экономике большая часть временных рядов содержит тренды какого-либо типа. Для избавления от тренда можно выполнить преобразования в виде перехода к разностям такого порядка, которые будут стационарными.
Но это не лучшее решение. Применение оператора взятия, например, первых разностей к переменным приводит к потере долгосрочных свойств процессов, т.к. модель в первых разностях не имеет долгосрочного решения.
Стремление получить модель, которая учитывала бы краткосрочные и долгосрочные особенности процессов и в то же время поддерживала бы стационарность всех переменных, подтолкнуло к пересмотру принципов построения регрессии.
Этот подход основывается на таких экономических данных, которые, будучи нестационарными, могут быть скомбинированы в один ряд, который будет уже стационарным. Ряды, обладающие такой особенностью, называются коинтегрированными рядами .
Если, например, оказывается, что переменные являются I(1) - интегрированными первого порядка и привычные методы регрессионного анализа к ним не подходят, то в этом случае используют так называемую коинтеграционную регрессию.
Процессы I(1) являются коинтегрированными первого порядка [С(1,0)], если существует их линейная комбинация, которая является I(0), т.е. стационарна.
То есть Y и X, являющиеся I(1), коинтегрированы, если существует множитель
![](images/374614-nomer-637e9765.png)
![](images/374614-nomer-6a92c.png)
Легко изобразить на рисунке два таких нестационарных I(1) процесса, которые связаны друг с другом стационарной линейной комбинацией с
![](images/374614-nomer-4a0bfacd.png)
![](images/374614-nomer-m391ad44e.png)
![](images/374614-nomer-74e907a5.png)
Пример рядов, линейная комбинация которых
![](images/374614-nomer-1b5cb15e.png)
![](images/374614-nomer-m255a84c1.png)
Однако во втором случае можно подобрать такое
![](images/374614-nomer-637e9765.png)
![](images/374614-nomer-m572c3ca3.png)
![](images/374614-nomer-8ef895f.png)
![](images/374614-nomer-7e5261ee.png)
Разность
![](images/374614-nomer-4c317c42.png)
![](images/374614-nomer-m34b94dbf.png)
Очевидно, что коинтегрированными могут быть только такие два временных ряда, которые интегрированы одинакового порядка. Если одна переменная I(1), а другая – I(2), они не могут быть коинтегрированными.
![](images/374614-nomer-2b210c94.png)
Формальное определение коинтеграции двух переменных, разработанное Энглом и Грейнджером (1987).
Временные ряды
![](images/374614-nomer-m15988088.png)
![](images/374614-nomer-m35d3e1fb.png)
![](images/374614-nomer-m37c26659.png)
Оба временных ряда интегрированы порядка d;
Существует линейная комбинация этих переменных
![](images/374614-nomer-m7b205c3b.png)
Вектор [
![](images/374614-nomer-de8ffaf.png)
Обобщим это определение для случае n переменных.
Пусть
![](images/374614-nomer-62f2c269.png)
![](images/374614-nomer-7259b218.png)
Каждая переменная
![](images/374614-nomer-3cad5f36.png)
Существует (
![](images/374614-nomer-55becdd4.png)
![](images/374614-nomer-m2f03a676.png)
![](images/374614-nomer-7d64c0a7.png)
![](images/374614-nomer-7d64c0a7.png)
На практике наиболее интересна ситуация, когда ряды трансформированные с помощью коинтегрирующего вектора, стационарны, и d = b, а коинтегрирующий коэффициенты, составляющие коинтегрирующий вектор, могут быть определены на основе долгосрочной зависимости между переменными.
Остановимся на ситуации, когда все
![](images/374614-nomer-m569a3ef9.png)
Если
![](images/374614-nomer-m391ad44e.png)
![](images/374614-nomer-m2a79d614.png)
то коинтегрирующий вектор [
![](images/374614-nomer-m3de0df2a.png)
![](images/374614-nomer-m595cff91.png)
![](images/374614-nomer-m515d24ce.png)
Здесь, на этом этапе важно показать, что линейная комбинация
![](images/374614-nomer-5fb553ba.png)
Тест Энгла-Грейнджера проводится с помощью регрессии
![](images/374614-nomer-7571f7b6.png)
Распределение t-статистики для гипотезы
![](images/374614-nomer-40de15ee.png)
Нулевой гипотезой, следовательно, является отсутствие коинтеграции (отсутствие стационарности,
![](images/374614-nomer-26890f3e.png)
Если гипотеза об отсутствии коинтеграции отвергается, то полученные результаты не являются ложной регрессией.
После этого можно оценить модель исправления ошибок, которая делает переменные коинтегрированными. В этой модели (регрессии) используются первые разности исходных переменных и остатки из коинтеграционной регрессии, которые будут представлять корректирующий член модели исправления ошибок.
![](images/374614-nomer-m3cb3ee81.png)
Здесь зависимая переменная
![](images/374614-nomer-m1a9da646.png)
![](images/374614-nomer-m44d16b0f.png)
![](images/374614-nomer-27530d69.png)
До появления метода Энгла-Грейрджера исследователи, не подозревая о том, часто получали ложные регрессии, или же оценивали регрессии в новых разностях, что, хотя и приводило к стационарности переменных, но не давало возможности учитывать стационарный корректирующий член, т.е. регрессионная модель была неверно специфицирована (проблема пропущенной переменной). Тем самым подчеркивается роль корректирующего элемента (предполагается, что если в предыдущий период переменная Y отклонилась от своего долгосрочного значения, то член
![](images/374614-nomer-27530d69.png)
Модель включает долгосрочное решение и механизм корректировки (исправления) ошибки, если
![](images/374614-nomer-m5788b3f8.png)
Возможны различные варианты сочетания и коинтеграции в рассмотренной модели (2).
1. Если
![](images/374614-nomer-m595cff91.png)
![](images/374614-nomer-62f2c269.png)
![](images/374614-nomer-m595cff91.png)
![](images/374614-nomer-62f2c269.png)
2. Если
![](images/374614-nomer-m595cff91.png)
![](images/374614-nomer-62f2c269.png)
![](images/374614-nomer-m595cff91.png)
![](images/374614-nomer-62f2c269.png)
3. Если
![](images/374614-nomer-m595cff91.png)
![](images/374614-nomer-62f2c269.png)
4. Если
![](images/374614-nomer-m595cff91.png)
![](images/374614-nomer-62f2c269.png)
![](images/374614-nomer-m595cff91.png)
![](images/374614-nomer-62f2c269.png)
Следовательно, в долгосрочной зависимости между двумя переменными обе должны быть интегрированы одного порядка, чтобы ряд ошибок был I(0).
Стационарность ошибок особенно важна, если строится модель, предусматривающая механизм исправления ошибки.
Задача существенно усложняется, если количество переменных, включаемых в долгосрочную зависимость, увеличиваются.
Рассмотрим случай трех переменных:
![](images/374614-nomer-m29ecd7ef.png)
В этом случае допускается, чтобы порядок интеграции у переменных был разным, а ряд ошибок был при этом стационарным.
Пусть
![](images/374614-nomer-m595cff91.png)
![](images/374614-nomer-m15fe8bf0.png)
![](images/374614-nomer-m1e0e3e47.png)
![](images/374614-nomer-38b63cc6.png)
![](images/374614-nomer-m15fe8bf0.png)
![](images/374614-nomer-m1e0e3e47.png)
![](images/374614-nomer-3c3ed60e.png)
![](images/374614-nomer-m15fe8bf0.png)
![](images/374614-nomer-m1e0e3e47.png)
![](images/374614-nomer-m1afe9ed3.png)
![](images/374614-nomer-m595cff91.png)
![](images/374614-nomer-3c3ed60e.png)
![](images/374614-nomer-m595cff91.png)
![](images/374614-nomer-m15fe8bf0.png)
![](images/374614-nomer-m1e0e3e47.png)
![](images/374614-nomer-3c3ed60e.png)
![](images/374614-nomer-m15fe8bf0.png)
![](images/374614-nomer-m1e0e3e47.png)
![](images/374614-nomer-38b63cc6.png)
3.3 Тестирование коинтеграции (Энгла-Грейнджера)
Алгоритм тестирования разработан Энглом и Грейнджером.
Шаг 1.
Проверка порядка интеграций, включаемых в предполагаемую нами долгосрочную зависимость (например, типа уравнения (1)).
Если долгосрочная зависимость связывает только две переменные, обе должны иметь одинаковый порядок интеграции.
Если количество объясняющих переменных больше, чем одна, порядок интеграции зависимой переменной не может быть выше, чем порядок интеграции любой из объясняющих переменных, порядок интеграции которых одинаков и выше, чем порядок интеграции зависимой переменной.
Шаг 2.
Выясняется, известен ли коинтеграционный вектор, или его нужно найти.
Иногда коинтеграционный вектор известен a priori (ситуация А). Но чаще долгосрочную зависимость представляют в форме (1) или (3), и коинтеграционный вектор [1, -λ] или
![](images/374614-nomer-m28b8a693.png)
В общем случае определяется долгосрочная зависимость:
![](images/374614-nomer-380a8311.png)
Коинтеграционный вектор
![](images/374614-nomer-7b28451f.png)
![](images/374614-nomer-m1afe9ed3.png)
![](images/374614-nomer-m107ae80d.png)
или расширенный тест D-F:
![](images/374614-nomer-m1252a415.png)
Важное различие между ситуацией A и ситуацией B состоит в том, что в ситуации B при расчете коинтеграционных коэффициентов распределение t-статистики Стьюдента зависит от количества оцениваемых коэффициентов.
В интеграционном и коинтеграционном тестах с известным вектором коинтеграции, количество коэффициентов, которые нужно оценить, равно нулю. Так критические значения теста можно взять в таблице 1 приложения.
Если нужно найти m коэффициентов коинтеграционного вектора, можно пользоваться таблицей 2 (или таблицей 3, если в уравнении есть константа).
Для быстрой проверки гипотезы тестирования коинтеграция может быть использовано довольно простое эмпирическое правило, предложенное Banerjee (1986). В основе этого теста (правила) лежит коинтеграционный тест Дарбина-Уотсона:
![](images/374614-nomer-2bc4aef5.png)
где
![](images/374614-nomer-m5392d96a.png)
![](images/374614-nomer-m1afe9ed3.png)
Если CIDW, рассчитанный для остатков уравнения (4), меньше, чем коэффициент детерминации
![](images/374614-nomer-755678.png)
![](images/374614-nomer-m6f424fb4.png)
Известен и широко распространен еще один метод нахождения стационарных комбинаций – метод Йохансена. Этот метод служит также для тестирования стационарности найденных линейных комбинаций, и, по сути, распространяет методику Дики-Фуллера на случай векторной авторегрессии, т.е. такой модели, в которой несколько зависимых переменных и зависят они от собственных лагов и от лагов других переменных.