Книги по разным темам Pages:     | 1 |   ...   | 18 | 19 | 20 | 21 | 22 |   ...   | 30 |

В правой части полученной модели оказались исключенными параметры 1,2,K,N. Это приводит к меньшей стандартной ошибке оценки для параметра, который обычно представляет первоочередной интерес. В рамках последней модели эта оценка вычисляется по формуле N T - xi )(yit - yi ) (xit i=1 t= =, N T - xi ) (xit i=1 t=и о ней говорят как о УвнутригрупповойФ оценке (Уwithin-groupФ estimate), имея в виду, что она строится только на основании отклонений значений переменных от их средних по времени и тем самым принимает во внимание только изменчивость в пределах каждого субъекта, не обращая внимание на изменчивость между субъектами. Точнее, конечно, следовало бы говорить о УвнутрисубъектнойФ оценке, но используемая здесь терминология исторически вышла из теории дисперсионного анализа, где субъекты исследования часто объединяются в некоторое количество групп, так что индекс i относится не к отдельному субъекту, а к группе субъектов. Впрочем, в последнее время в эконометрической литературе чаще стали говорить об указанной оценке просто как о УwithinФ-оценке. Соответственно, мы часто будем использовать термин УвнутриФ -оценка.

Получив в последней модели оценку наименьших квадратов, оценки для параметров 1,2,K,N можно вычислить следующим образом:

i = yi - xi, i = 1,K, N.

Полученные в итоге этих двух шагов оценки 1,,K,, N численно совпадают с оценками наименьших квадратов, 240 Глава N получаемыми в модели yit = dij + xit + uit. Следует только i j= учитывать, что стандартные ошибки оценок отличаются в этих двух моделях, а стандартные ошибки оценок i, получаемые в результате двухшаговой процедуры, нельзя вычислять по формулам для стандартных ошибок оценок наименьших квадратов.

Гипотеза H2 : i и i одинаковы для всех i. Ей соответствует модель M2 : yit = + xit + uit, i = 1,K, N, t = 1,K,T (пул - pool).

Оценки наименьших квадратов для параметров и вычисляются по формулам N T - x)(yit - y) (xit i=1 t= =, N T - x) (xit i=1 t= = y - x, где N T N T 1 y = yit, x = NT xit.

NT i=1 t=1 i=1 t=Обозначим остаточную сумму квадратов в модели М2 через S, N T S2 = (yit - - xit ).

i =1 t =Рассмотрим задачу проверки гипотез H и H в рамках модели 1 M0 при сделанных ранее предположениях.

Панельные данные Проверка гипотезы H. Используем F-статистику (S2 - S0) 2(N -1) F2 = ;

S0 (NT - 2N) если гипотеза H2 верна, то F2 ~ F2( N -1), NT -2N.

Если значение F2 статистически незначимо, то следует объединить данные в пул. Если же значение F2 статистически значимо, то следует искать источник гетерогенности параметров.

Проверка гипотезы H1. Используем F-статистику (S1 - S0) (N -1) F1 = ;

S0 (NT - 2N) если гипотеза H1 верна, F1~ FN -1, NT -2N.

Если значение F1 статистически значимо, то проверка прекращается. Если же значение F1 статистически незначимо, то гипотеза H1 (о совпадении всех i ) не отвергается.

Можно также применить условный критерий гетерогенности i, а именно, проверить гипотезу H3 : 1 = K = N при условии 1 = K = N, т.е. в рамках модели M1 : yit = i + xit + uit.

Для этой цели используем статистику (S2 - S1) (N -1) F3 =, S1 (NT - N -1) которая при гипотезе H3 имеет распределение FN -1, NT -N -1.

П р и м е р Продолжим расмотрение данных об инвестициях и прибыли трех предприятий.

242 Глава Выше мы уже проверили гипотезу H1 : У i одинаковы для всех i Ф в рамках модели M0 и не отвергли эту гипотезу. Проверим в рамках той же модели M0 гипотезу H2 : У i и i одинаковы для всех i Ф:

Wald Test:

F-statistic 3.595209 Probability 0.Эта гипотеза отвергается. Проверим теперь гипотезу H3 :

1 = K = N в рамках модели M1 : yit = i + xit + uit :

Wald Test:

F-statistic 6.810977 Probability 0.Эта гипотеза также отвергается.

Полученные результаты говорят в пользу модели M1 с одинаковыми i, но различными i.

3.2. Фиксированные эффекты Начиная с этого раздела, мы обращаемся к методам анализа панельных данных, предназначенным в основном для анализа данных {yit, xit ; i =1,K, N, t =1,K,T}, в которых количество субъектов исследования N велико, а количество наблюдений T над каждым субъектом мало. Вследствие малости T в таких ситуациях затруднительно использовать технику, интерпретирующую y1t, y2t,K, yNt как N временных рядов длины T (например, технику векторных авторегрессий и моделей коррекции ошибок для нестационарных временных рядов). Основная направленность методов, предполагающих малость T, - получение по возможности наиболее эффективных оценок коэффициентов.

Сначала мы сфокусируем внимание на модели, соответствующей гипотезе H со скалярной объясняющей переменной x :

Панельные данные y = + x + u, i = 1,K, N, t = 1,K,T, it i it it т.е.

N yit = dij + xit + uit, i j=где dij =1, если i = j и dij = 0 в противном случае, так что мы имеем здесь в правой части N дамми-переменных. Здесь i трактуются как неизвестные фиксированные параметры (фиксированные эффекты, fixed effects). Как и ранее, будем предполагать, что в этой модели uit ~ i.i.d. N(0,u ), i =1,K, N, t =1,K,T, и что E(xitu )= 0 для любых i, j =1,K, N, t,s = 1,K,T, js так что x является экзогенной переменной. Альтернативные названия этой модели:

1. OLS - дамми модель (LSDV - least squares dummy variables);

2. модель с фиксированными эффектами (FE - fixed effects model);

3. модель ковариационного анализа (CV - covariance analysis).

В этой модели оценка наименьших квадратов, как мы уже отмечали выше, имеет вид:

N T - xi )(yit - yi ) (xit i=1 t= CV = ;

N T - xi ) (xit i=1 t=при этом 244 Глава u D(CV )=.

N T it (x - xi ) i=1 t =Альтернативные названия для этой оценки 1. УвнутригрупповаяФ оценка (УвнутриФ-оценка, withinestimator), 2. оценка фиксированных эффектов, 3. ковариационная оценка.

Часто для этой оценки используют также обозначения W (индекс FE W - от within) и. Как мы уже отмечали выше, эта оценка теоретически имеет одно и то же значение при двух альтернативных методах ее получения: в рамках статистической модели N yit = dij + xit + uit с дамми-переменными и в рамках модели в i j=отклонениях от групповых средних yit - yi = (xit - xi)+ (uit - ui), i = 1,K, N, t = 1,K,T. Однако если количество субъектов анализа N велико, то в первой модели приходится обращать матрицу весьма большого размера ( N +1), тогда как во второй модели такой проблемы не возникает.

Оценки для фиксированных эффектов вычисляются по формуле:

i = yi - xi, i =1,K, N.

При сделанных предположениях CV является наилучшей линейной несмещенной оценкой (BLUE) для коэффициента, p lim CV =, p lim CV =, p limi = i, T N T но p limi i, хотя E(i )= i.

N Таким образом, CV является состоятельной оценкой и когда N и когда T, в то время как i состоятельна только, Панельные данные когда T. Последнее есть следствие того, что оценивание каждого i производится фактически лишь по T наблюдениям, так что при фиксированном T с ростом N происходит лишь увеличение количества параметров i, но это не приводит к возрастанию точности оценивания каждого конкретного i.

Заметим, что если нас интересует только состоятельность оценки CV, но не ее эффективность (т.е. свойство BLUE), то для этого не требуется строгая экзогенность x (т.е. не требуется, чтобы E(xitu )= 0 для любых i, j =1,K, N, t,s = 1,K,T ). В этом случае js достаточно выполнения соотношений E(xituis )= 0 для любых t, s = 1,K,T и i = 1,K, N (т.е. требуется лишь экзогенность x в рамках каждого отдельного субъекта исследования).

В модели с фиксированными эффектами получаемые выводы - условные по отношению к значениям эффектов i в выборке.

Такая интерпретация наиболее подходит для случаев, когда субъектами исследования являются страны, крупные компании или предприятия, т.е. каждый субъект Фимеет свое лицоФ.

Сами эффекты i по-существу отражают наличие у субъектов исследования некоторых индивидуальных характеристик, не изменяющихся со временем в процессе наблюдений, которые трудно или даже невозможно наблюдать или измерить. Если значения таких характеристик не наблюдаются, то эти характеристики невозможно непосредственно включить в правые части уравнений регрессии в качестве объясняющих переменных. Но тогда мы имеем дело с Упропущенными переменнымиФ - с ситуацией, которая может приводить к смещению оценок наименьших квадратов. Чтобы исключить такое смещение, в правые части уравнений вместо значений ненаблюдаемых индивидуальных характеристик как раз и вводятся ненаблюдаемые эффекты i. Проиллюстрируем возникновение указанного смещения следующим примером.

246 Глава П р и м е р На следующем графике представлено облако рассеяния точек (xit, yit ), порожденных моделью y = + x + u, i =1, 2, t =1,K,100, it i it it в которой 1 =150, 2 = 250, = 0.6, uit ~ i.i.d. N(0,102). Значения xit заданы (неслучайны); при i =1 значения x1t меньше 150, а при i = 2 значения x2t больше 150.

Группа Y y = 250 + 0.6 x y =150 + 0.6 x Группа y = 8.00 +1.88 x 0 50 100 150 200 X Облако точек распадается на две группы точек: в группе объединяются точки, соответствующие i =1, а в группе 2 - точки, соответствующие i = 2. Точки первой группы располагаются вдоль (теоретической) прямой y =150 + 0.6 x (нижняя пунктирная линия Панельные данные на графике), точки второй группы - вдоль (теоретической) прямой y = 250 + 0.6 x.

Если по имеющимся 100 наблюдениям оценивать статистическую модель yit = + xit + uit, i =1,2, t =1,K,100, (пул), не принимающую во внимание возможное наличие индивидуальных эффектов, то оцененная модель принимает вид it = 8.00 + 1.88 xit, так что оценка коэффициента оказывается завышенной втрое по сравнению со значением, использованным при моделировании.

В то же время, если перейти от переменных xit, yit к отклонениям от средних значений в группах xit - xi и yit - yi, то для новых переменных облако рассеяния концентрируется вокруг начала координат (на следующем графике соответствующие точки изображены черными квадратами) и вытянуто в правильном направлении:

y = 0.52 x -50 0 50 150 200 248 Глава Оцененная модель в отклонениях от средних в группах имеет вид:

it = 0.517 xit, и на этот раз оценка коэффициента оказывается близкой к значению = 0.6, использованному при моделировании.

Если оценивать модель с дамми-переменными yit = 1di1 + 2di2 + xit + uit, где dij =1, если j = i, и dij = 0 в противном случае, то результаты оценивания таковы:

Dependent Variable: Y Variable Coefficient Std. Error t-Statistic Prob.

D1 161.4615 7.260153 22.23940 0.D2 264.8593 10.46430 25.31074 0.X 0.517319 0.058229 8.884227 0. Полученные оценки 1 = 161.46, = 264.86, = 0.517 близки к значениям параметров, использованным при моделировании.

3.3. Случайные эффекты Запишем модель yit = i + xit + uit, i = 1,K, N, t = 1,K,T, соответствующую гипотезе H, в равносильном виде:

yit = + i + xit + uit, N где = 0 (при таком условии i называют i i=дифференциальными эффектами). В ряде ситуаций N субъектов, для которых имеются статистические данные, рассматриваются как случайная выборка из некоторой более широкой совокупности (популяции), и исследователя интересуют не конкретные субъекты, попавшие в выборку, а обезличенные субъекты, имеющие заданные Панельные данные характеристики. Соответственно, в таких ситуациях предполагается, что i являются случайными величинами, и мы говорим тогда о модели yit = + i + xit + uit как о модели со случайными эффектами (random effects). В такой модели i уже не интерпретируются как значения некоторых фиксированных параметров и не подлежат оцениванию. Вместо этого оцениваются параметры распределения случайных величин i.

Обозначая it = i + uit, получаем другую запись такой модели:

yit = + xit + (i + uit )= + xit +it.

В такой форме модели ошибка it состоит из двух компонент i и uit. Как и в модели с фиксированными эффектами, случайные эффекты i также отражают наличие у субъектов исследования некоторых индивидуальных характеристик, не изменяющихся со временем в процессе наблюдений, которые трудно или даже невозможно наблюдать или измерить. Однако теперь значения этих характеристик встраиваются в состав случайной ошибки, как это делается в классической модели регрессии, в которой наличие случайных ошибок интерпретируется как недостаточность включенных в модель объясняющих переменных для полного объяснения изменений объясняемой переменной.

К прежним предположениям о том, что uit ~ i.i.d. N(0,u ), i =1,K, N, t =1,K,T, и E(xitu )= 0 для любых i, j =1,K, N, t,s = 1,K,T, js добавим также следующие предположения:

E(i)= 0 (так что и E(it )= 0 ),,если i = j, E(i )= j 0, если i j 250 Глава (это означает, что последовательность значений 1,K,N представляет случайную выборку из распределения N(0,u )), E(xit )= 0, i, j = 1,K, N, t = 1,K,T, j (так что E(xit )= 0, и в модели со случайными ошибками it js переменная x является экзогенной переменной).

Если предположить еще, что E(uiti)= 0, то тогда условная относительно xit дисперсия случайной величины yit равна 2 D(yit xit )= D(it xit )= D(it )= D(i + uit )= + u.

Таким образом, дисперсия yit складывается из двух некоррелированных компонент; их называют компонентами дисперсии, а саму модель называют 1. моделью компонент дисперсии;

2. однофакторной моделью компонент дисперсии;

3. стандартной моделью со случайными эффектами (RE модель - random effects model).

В векторной форме эта модель имеет вид yi = [e xi ] +i, где yi1 1 xi1 i yi2 1 xi2 i yi =, e =, xi =, =, i =.

M M M M yiT 1 xiT iT Заметим, что 2 + u, если t = s, E(itis )= E(i + uit,i + uis )=, если t s, Панельные данные так что случайные величины it и is коррелированы даже если некоррелированы ошибки uit, и ковариационная матрица случайного вектора i имеет вид 2 V = E(iiT )= u IT + eeT.

Например, при T = 2 2 2 u + 2 2 2 V = u +.

2 2 2 u + При этом Corr(it,is ) = = для всех t s 2 + u (предположение равной коррелированности в модели компонент дисперсии).

Оценивание В RE-модели оценка N T - xi )(yit - yi ) (xit i=1 t = CV = N T it (x - xi ) i=1 t=остается несмещенной и состоятельной оценкой для. Однако она перестает быть эффективной оценкой (BLUE), как это было в модели с фиксированными эффектами, поскольку не учитывает коррелированность it во времени для субъекта i.

Pages:     | 1 |   ...   | 18 | 19 | 20 | 21 | 22 |   ...   | 30 |    Книги по разным темам