Книги по разным темам Pages:     | 1 |   ...   | 24 | 25 | 26 | 27 | 28 |   ...   | 35 |

Все указанные признаки являются характерными чертами, присущими результатам оценивания линейной модели связи между переменными, имеющими стохастический (но не детерминированный !) тренд и порождаемыми статистически независимыми моделями. Теоретическое исследование подобной ситуации показывает следующее.

Пусть DGP: xt = xt - 1 + 1t, yt = yt - 1 + 2t, где x0 = 0, y0 = 0, а 1t и 2t - статистически независимые между собой последовательности одинаково распределенных случайных величин, 1t ~ N(0, 12), 2t ~ N(0, 22), так что Cov(xt, yt) = 0. Предположим, что по T наблюдениям (xt, yt), t = 1, 2, Е, T, производится оценивание статистической модели SM: yt = xt + ut, ut ~ i.i.d. N(0, u2), Cov(xt, ut) = 0.

Стандартная оценка наименьших квадратов для коэффициента в этой гипотетической модели имеет вид T T T = yt xt.

xt t = 1 t = При сделанных предположениях относительно DGP, T не сходится по вероятности при T ни к какой константе и имеет предельное распределение, отличное от нормального.

С другой стороны, при выбранной спецификации SM модели, в предположениях этой модели (а не DGP !) имеем:

Cov(xt, yt) = Cov(xt, xt + ut) = Cov(xt, xt ) = D(xt), т.е. оцениваемым параметром является = Cov(xt, yt ) / D(xt).

Поскольку же в действительности (в DGP) Cov(xt, yt ) = 0, то и это значение = 0, так что если бы гипотетическая модель (соответствующая SM) была верна, то тогда мы бы имели T 0 по вероятности.

Далее, при T значения t-статистики t для проверки гипотезы H0: = неограниченно возрастают по абсолютной величине, так что использование таблиц tраспределения будет практически всегда приводить к отклонению этой гипотезы, т.е. к выводу о том, что между переменными xt и yt существует линейная регрессионная связь. В действительности, нетривиальное предельное распределение имеет не статистика t, а статистика ( 1/ T ) t, причем предельное распределение последней является нестандартным.

Что касается статистики Дарбина - Уотсона (DW), то при T DW 0 по вероятности, www.iet.ru/mipt/2/text/curs_econometrics.htm Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru и это позволяет распознавать неправильную спецификацию статистической модели в форме паразитной регрессии. Последнее обстоятельство проявляется в поведении остатков от оцененной статистической модели, которое не соответствует поведению стационарного процесса.

Пример В предыдущем примере мы имели DGP: xt = xt - 1 + 1t, yt = yt - 1 + 2t, где 1t и 2t - последовательности независимых, одинаково распределенных случайных величин, имеющих стандартное нормальное распределение N(0, 1), и оценивали статистическую модель SM: yt = + xt + t.

При оценивании такой статистической модели по наблюдениям с 51 по 100 мы получили:

T = 0.598, t = 7.708, DW = 0.214.

При этом график остатков ---55 60 65 70 75 80 85 90 95 RESIDS не похож на график стационарного ряда.

Естественно было бы попытаться использовать для выявления такого УнеподобающегоФ поведения остатков не просто визуальное рассмотрение графика остатков, но и формальные статистические критерии, тем более, что критерии проверки интегрированности временных рядов мы уже обсуждали ранее (критерии Дики - Фуллера, Филлипса - Перрона и др.).

Дело, однако, в том, что теперь мы имеем дело не с УсырымФ рядом, а с рядом остатков, которые вычисляются после предварительного оценивания модели (коэффициентов и в последнем примере). Это обстоятельство существенно влияет на распределения соответствующих статистик и не дает возможности пользоваться таблицами, которые мы использовали ранее при анализе на интегрированность сырых рядов. С учетом этого обстоятельства, были построены таблицы, позволяющие производить анализ остатков в случае интегрированных объясняемой и объясняющих переменных, о чем мы поговорим в дальнейшем. Сейчас же только отметим, что дает применение соответствующих таблиц к только что рассмотренному примеру.

Пример (продолжение) При оценивании статистической модели SM: yt = + xt + t по наблюдениям с 51 по 100 мы получили оцененную модель yt = 8.616 +0.598 xt + e t.

www.iet.ru/mipt/2/text/curs_econometrics.htm Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru С полученным рядом остатков мы поступим так же, как и в случае применения критерия Дики - Фуллера к сырому ряду, т.е. оценим модель e t = e t - 1 + t и вычислим t- статистику t для проверки гипотезы H0: = 0, интерпретируя эту гипотезу как гипотезу единичного корня для ряда остатков.

Гипотеза H0 отвергается в пользу гипотезы HA: < 0 (интерпретируемой как гипотеза стационарности ряда остатков), если t < tкрит. Приближенные значения tкрит можно найти по формуле -1 - tкрит + 1T + 2T, где, 1, 2 зависят от выбранного уровня значимости и указаны в статье [MacKinnon (1991)]. Для 5% уровня значимости tкрит - 3.3377 + 5.967 T - 1 - 8.98 T - 2, что при T = 50 дает tкрит = - 3.46. Последнее значение существенно меньше 5% критического значения статистики Дики - Фуллера - 2.92, рассчитанного для случая сырого ряда.

В нашем примере оценивание тестового уравнения Дики - Фуллера дает значение t = - 2.01. Последнее существенно выше 5% критического уровня, и гипотеза единичного корня не отвергается.

Вообще говоря, вопрос о ложной (паразитной) или неложной (действительной) линейной регрессионной связи между двумя переменными xt и yt, представляющими интегрированные ряды первого порядка (xt, yt ~ I(1)), более точно формулируется следующим образом. Существует ли вообще такое значение, при котором ряд yt - xt стационарен Если ответ на этот вопрос положительный, то говорят что ряды xt и yt (переменные xt и yt ) коинтегрированы. Если же ответ оказывается отрицательным, то ряды xt и yt (переменные xt и yt ) не являются коинтегрированными.

В последнем случае непосредственное оценивание модели yt = + xt + ut бессмысленно, т.к. получаемая оценка T, собственно говоря, не является оценкой какого-либо теоретического параметра связи между переменными xt и yt. (См., впрочем, замечание в конце разд. 7.3.) Напротив, если переменные xt и yt коинтегрированы, то T является оценкой того единственного значения, при котором ряд yt - xt стационарен Заметим теперь, что если в DGP: xt = xt - 1 + 1t, yt = yt - 1 + 2t допустить коррелированность значений 1t и 2t в совпадающие моменты времени, т.е.

Cov(1t, 2t) 0, то коррелированность 1t и 2t вовсе не означает, что ряды xt и yt коинтегрированы. Предположим все же, что существует некоторое значение, при котором yt = xt + ut, где ut Цстационарный ряд. Тогда yt - 1 - xt - 1 = ut - 1, так что yt = xt + ut, а отсюда 2t = 1t + ut. Последнее можно записать в виде ut = ut - 1 + t, где t = 2t - 1t ~ i.i.d. N(0, 2).

Но это означает, что ut - нестационарный процесс.

www.iet.ru/mipt/2/text/curs_econometrics.htm Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru С другой стороны, если x0 = y0 = 0, то Cov(xt, yt ) = Cov(11 + Е + 1t, 21 + Е + 2t) = t Cov(11, 21), так что xt и yt - коррелированные, но не коинтегрированные случайные блуждания.

Существенно, что распределение статистики Дики - Фуллера в подобной ситуации не зависит от конкретного вида матрицы ковариаций = (Cov(k 1, s 1)), k, s = 1, 2.

Тем же свойством обладает и распределение статистики Дарбина - Уотсона, примененной к ряду остатков (CRDW - cointegrating regression DW):

et = yt - T - T xt.

При T = 50 5% критическое значение последней статистики равно 0.78. Гипотеза некоинтегрированности рядов отвергается, если наблюдаемое значение этой статистики превышает критическое значение.

В нашем последнем примере значение статистики Дарбина - Уотсона равно 0.214, так что гипотеза некоинтегрированности не отвергается и этим критерием.

Что следует делать в случае обнаружения паразитной связи между интегрированными порядка 1 переменными xt и yt Имеются три возможных пути обхода возникающих здесь трудностей:

1. Включить в правую часть уравнения запаздывающие значения обеих переменных, точнее, рассмотреть статистическую модель SM: yt = + xt + yt - 1 + xt - 1 + ut, где ut - стационарный ряд и переменная xt трактуется как экзогенная.

Последнее уравнение можно записать иначе в следующих двух формах:

(a) yt = + yt - 1 + xt + ( + ) xt - 1 + ut, (б) yt = + yt - 1 + ( + ) xt - xt + ut.

В обеих формах слева стоит интегрированная переменная yt ~ I(1).

В правой части (а) параметр является коэффициентом при стационарной переменной xt, имеющей нулевое математическое ожидание; yt - 1, xt - 1 ~ I(1), ut - стационарный ряд. Как было показано в работе [Sims, Stock, Watson (1990)], в такой ситуации оценки наименьших квадратов для всех коэффициентов SM состоятельны, оценка параметра асимптотически нормальна. Обычная tстатистика для проверки гипотезы H0: = 0 имеет асимптотически нормальное распределение N(0,1), если ut - белый шум. Аналогично, в правой части (б) параметр - является коэффициентом при стационарной переменной xt, имеющей нулевое математическое ожидание; yt Ц1, xt ~ I(1), ut - стационарный ряд.

Поэтому оценка параметра в рамках модели SM асимптотически нормальна, и tстатистика для проверки гипотезы H0: = 0 имеет асимптотически нормальное распределение N(0,1), если ut - белый шум. Оценки для и остаются асимптотически нормальными и если ut - стационарный ряд, не являющийся белым шумом. Однако при этом асимптотическое распределение N(0,1) имеют www.iet.ru/mipt/2/text/curs_econometrics.htm Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru скорректированные варианты t-статистик, в знаменателях которых стандартные оценки дисперсии ряда ut заменяются состоятельными оценками долговременной дисперсии этого ряда, определенной в разд. 6.8.1.

В то же время, статистика qF = 2F для проверки гипотезы H0: = = 0 не имеет асимптотического распределения 2(2), поскольку рассматриваемую SM не удается линейно репараметризовать таким образом, чтобы в правой части преобразованного уравнения и и одновременно стали коэффициентами при стационарных переменных, имеющих нулевые математические ожидания. (У нас они становятся таковыми при разных репараметризациях.) 2. Перед оцениванием модели связи продифференцировать ряды xt и yt, т.е. рассмотреть модель в разностях SM: yt = + xt + ut, где ut - стационарный ряд.

В этой модели оценки наименьших квадратов и для и для асимптотически нормальны. Обе t-статистики имеют асимптотически нормальное распределение N(0,1), если ut - белый шум. Если ut - стационарный ряд, не являющийся белым шумом, то необходимо произвести коррекцию t-статистик, как и в предыдущем пункте.

3. Использовать для оценивания модель регрессии с автокоррелированными остатками SM: yt = + xt + ut, ut = xt - 1 + t, ut ~ i.i.d. N(0, 2).

При этом предпочтительнее оценивать все три параметра,, одновременно, используя представление yt - yt - 1 = (1 - ) + (xt - xt - 1) + t.

В случае ложной регрессии 1 (по вероятности), так что, фактически, при больших T этот метод равносилен предварительному дифференцированию рядов.

Пример Применим указанные три подхода к анализу реализаций, смоделированных ранее в этом разделе в соответствии с DGP: xt = xt - 1 + 1t, yt = yt - 1 + 2t, где 1t и 2t - последовательности независимых, одинаково распределенных случайных величин, имеющих стандартное нормальное распределение N(0,1). Для анализа используем последние 50 наблюдений.

(1) Применяя первый подход, получаем оцененную модель Dependent Variable: Y Variable Coefficient Std. Error t-Statistic Prob.

C 0.447271 0.550358 0.812691 0.X -0.014458 0.123861 -0.116725 0.Y(-1) 0.970105 0.055989 17.32664 0.X(-1) 0.033532 0.120061 0.279290 0.Наблюдаемые P-значения для коэффициентов при переменных xt и xt - 1 указывают на то, что переменная xt фактически не объясняет изменчивость переменной yt.

(2) Применяя второй подход, получаем оцененную модель Dependent Variable: D(Y) www.iet.ru/mipt/2/text/curs_econometrics.htm Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru Variable Coefficient Std. Error t-Statistic Prob.

C 0.184523 0.117614 1.568884 0.D(X) -0.033386 0.116361 -0.286915 0.Оба коэффициента статистически незначимы, и это отражает некоррелированность рядов 1t и 2t.

(3) Применяя третий подход, оцениваем модель yt - yt - 1 = (1 - ) + (xt - xt - 1) + t, т.е.

yt = * + yt - 1 + (xt - xt - 1) + t.

При этом получаем:

Dependent Variable: Y Method: Least Squares Convergence achieved after 7 iterations Y=C(1)+C(2)*Y(-1)+C(3)*(X-C(2)*X(-1)) Coefficient Std. Error t-Statistic Prob.

C(1) 0.217398 0.159423 1.363650 0.C(2) 0.988791 0.035801 27.61920 0.C(3) -0.027306 0.119276 -0.228934 0.R-squared 0.940380 Mean dependent var 3.Как и ожидалось, коэффициент при yt - 1 оказался очень близким к 1, а два других коэффициента статистически незначимы. Проверка на одновременное зануление этих двух коэффициентов дает P-значение 0.367.

Пример Изменим процесс порождения данных, оставляя те же формулы для xt и yt, т.е.

xt = xt - 1 + 1t, yt = yt - 1 + 2t, но теперь пусть 1t - последовательность независимых, одинаково распределенных случайных величин, имеющих нормальное распределение N(0, 1.25), 2t - последовательность независимых, одинаково распределенных случайных величин, имеющих нормальное распределение N(0, 1.25), Cov(1t, 2s) = 0 для t s, Cov(1t, 2t) = 1.

Отсюда, в частности, следует, что Corr(1t, 2t) = 0.8.

Смоделированные реализации 1t и 2t имеют вид www.iet.ru/mipt/2/text/curs_econometrics.htm Эконометрика. Введение в регрессионный анализ временных рядов. В.П.Носко www.iet.ru ---10 20 30 40 50 60 70 80 90 NOISE_X NOISE_Y Траектории смоделированной пары рядов 1t и 2t ведут себя достаточно согласованным образом; оцененный коэффициент корреляции между этими рядам равен 0.789. Полученные при этом реализации рядов xt и yt ведут себя, как показано ниже на правом рисунке. Для сравнения на левом рисунке показано поведение реализаций рядов 1t и 2t при их полной статистической независимости.

10 5 0 -5 --10 --15 --20 -10 20 30 40 50 60 70 80 90 100 10 20 30 40 50 60 70 80 90 X Y X Y Для сопоставимости с ранее полученными результатами, опять обратимся ко второй части отрезка наблюдений; здесь оцененный коэффициент корреляции между рядами 1t и 2t равен 0.792.

Сначала оценим модель yt = + xt + ut. В результате получаем для ряда остатков значение статистики Дики - Фуллера, равное Ц2.112, которое выше 5% критического уровня Ц3.46. Соответственно, гипотеза о ложности регрессионной связи не отвергается.

Pages:     | 1 |   ...   | 24 | 25 | 26 | 27 | 28 |   ...   | 35 |    Книги по разным темам