Книги по разным темам Pages:     | 1 |   ...   | 19 | 20 | 21 | 22 | 23 |   ...   | 30 |

Мы можем ожидать, что обобщенная оценка наименьших квадратов (GLS-оценка), учитывающая такую коррелированность, будет более эффективной. Заметим, что GLS-оценка для имеет вид 252 Глава -N T N T -1 -GLS = e V [e xi ] e V yi T T xi xi i=1 i= и что 1 eeT eeT - V = - +, u IT T T u где =. Чтобы не возникало путаницы с другими GLS2 u + T оценками, для GLS-оценки в стандартной модели со случайными RE эффектами используется также обозначение. Заметим, что 1- -1 диагональные элементы матрицы V равны 1- u, а T 1- недиагональные элементы равны -.

Tu RE Практически получить можно следующим образом.

Усредняя по t обе части уравнения yit = + xit +it, получаем соотношение yi = + xi +i.

Обозначив =1-, произведем преобразование yit = yit - yi, xit = xit - xi, it =it -i, = (1- ).

В результате получаем преобразованную модель yit = + xit + it с экзогенной переменной xit, в которой ковариационная матрица вектора ошибок it имеет вид:

Cov(it)= u IT.

Поэтому применение OLS к преобразованной модели дает BLUEоценку Панельные данные N T * * (xit - x )(yit - y) i=1 t = GLS =, N T (xit - x ) i=1 t=где N T N T 1 y = yit, x = NT xit.

NT i=1 t=1 i=1 t =Это выражение можно представить в виде GLS = wb + (1 - w)CV, где T - x)(yi - y) (xi i = b = - УмежгрупповаяФ оценка (междуT - x) (xi i =оценка, between-group estimate), соответствующая регрессии средних значений yi на константу и средние значения xi, т.е.

yi = + xi +i (Умодель для групповых среднихФ), и игнорирующая внутригрупповую изменчивость, N - x) (xi i =w =.

N T N 2 - xi ) + - x) (xit (xi i=1 t=1 i =Таким образом, обобщенная оценка наименьших квадратов GLS в RE-модели учитывает и внутригрупповую и межгрупповую изменчивость. Она является взвешенным средним УмежгрупповойФ оценки b (учитывающей только межгрупповую изменчивость) и 254 Глава УвнутригрупповойФ оценки CV (учитывающей только внутригрупповую изменчивость), а w измеряет вес, придаваемый межгрупповой изменчивости. При сделанных предположениях обе оценки b и CV состоятельны, так что состоятельна и сама GLS.

Если T, то 0, w 0 и GLS CV, так что при больших T оценки для, получаемые в рамках моделей фиксированных и случайных эффектов, эквивалентны.

2 T 2 2 Если 0, то 1 и V = E( )= IT + eeT IT.

i i u u Соответственно, при этом GLS-оценка переходит в OLS-оценку, т.е.

N T - x)(yit - y) (xit i=1 t= GLS = OLS N T - x) (xit i=1 t=(в пределе нет никаких эффектов).

Заметим далее, что u D(GLS )=.

N T N 2 - xi ) + - x) (xit (xi i=1 t =1 i =В то же время u D(CV )=.

N T - xi) (xit i=1 t =Поскольку > 0, то из двух последних соотношений следует, что D(GLS )< D(CV ), т.е. GLS-оценка эффективнее. Она эффективнее оценки CV именно потому, что использует как информацию о внутригрупповой изменчивости, так и информацию о межгрупповой изменчивости.

Панельные данные Чтобы реализовать эту GLS, т.е. получить доступную GLSоценку (FGLS - feasible GLS, или EGLS - estimated GLS), надо подставить в выражения для (и ) подходящие оценки для u и 2 u + T.

Оценить можно, используя внутригрупповые остатки u (yit - yi )- CV (xit - xi ), полученные при оценивании модели, скорректированной на индивидуальные средние:

N T [(yit - yi )- CV (xit - xi )] u i=1 t = = N(T -1)-(в знаменателе число степеней свободы равно количеству наблюдений NT минус количество оцениваемых параметров N +1 ).

2 Оценить дисперсию случайных эффектов = D(i) можно, заметив, что при оценивании модели yi = + xi +i, приводящей к межгрупповой оценке T - x)(yi - y) (xi i = b =, T - x) (xi i =дисперсия остатка для i -й группы равна 2 D(yi - b - b xi )= T +.

u 2 Состоятельной оценкой для u T + является 256 Глава N (yi - b - b xi) i =.

N - Поэтому состоятельной оценкой для служит N (yi - b - b xi) 2 i =1 u = - T ;

N - N (yi - b - b xi ) 2 i = + T = T u N - 2 является состоятельной оценкой для u + T. Эти две оценки используют межгрупповые остатки. Они являются также оценками максимального правдоподобия соответствующих дисперсий.

Следует только отметить, что, особенно при небольших значениях N и T, значение вычисленной указанным образом оценки дисперсии может оказаться отрицательным.

З а м е ч а н и е Внутригруповую и GLS-оценки можно получить в пакете STATA, используя команду xtreg (с опциями fe или re).

Как мы уже отмечали выше, GLS можно представить в виде GLS = wb + (1 - w)CV, так что GLS является линейной комбинацией УвнутриФ и УмеждуФ оценок. Эта линейная комбинация оптимальна. Поэтому, например, оценка OLS, также являющаяся линейной комбинацией этих двух оценок (при =1), хотя и состоятельна, но менее эффективна.

Панельные данные Критерий БройшаЦПагана для индивидуальных эффектов.

Это критерий для проверки в рамках RE-модели (со стандартными предположениями) гипотезы H0 : = 0 (сведение к модели пула).

Идея критерия основана на тождестве N T N T N = + uit, uit uit uis i =1 t =1 i =1 t =1 i =1 st из которого следует, что N T N uit uit uis i =1 t =1 i =1 st -1 =.

N T N T 2 uit uit i =1 t =1 i =1 t =При отсутствии автокоррелированности случайных ошибок uit правая часть последнего равенства мала. Поэтому статистику критерия можно основывать на выражении, стоящем в левой части, в которое вместо ненаблюдаемых значений uit подставляются остатки it, полученные при OLS-оценивании модели пула. Против гипотезы H0 говорят Услишком большиеФ значения N T it i =1 t =-1.

N T it i =1 t = Статистика критерия БройшаЦПагана 258 Глава 2 N T N 2 it i NT 1- T NT i =1 t =1 i =BP = -1 = N T N T 2(T -1) 2(T -1) 2 it it i =1 t =1 i =1 t= при гипотезе H0 имеет асимптотическое распределение (1).

Соответственно, гипотеза H0 отвергается, если наблюдаемое значение статистики BP превышает критическое значение, рассчитанное по распределению (1).

3.4. Коэффициенты детерминации, разложение полной суммы квадратов При анализе панельных данных возникают некоторые проблемы с определением коэффициента детерминации R2, так что во многих руководствах по эконометрике и монографиях, специально посвященных анализу панельных данных, вообще не упоминается о коэффициенте детерминации. В то же время в некоторых пакетах статистического анализа предусмотрено вычисление коэффициентов детерминации и для панельных данных.

Проблема с определением коэффициента детерминации в случае панельных данных связана с неопределенностью в отношении того, что считать полной суммой квадратов, подлежащей разложению на объясненную регрессией и остаточную суммы квадратов. Здесь мы имеем соотношение N T N T N 1 1 2 2 (yit - y ) = NT (yit - yi ) + N (yi - y ), NT i =1 t =1 i =1 t =1 i =и в качестве полной суммы квадратов может использоваться каждая из входящих в это выражение трех сумм квадратов.

Соответствующие этим полным суммам регрессионные модели объясняют:

Панельные данные Х отклонения наблюдаемых значений yit от их среднего по всем NT наблюдениям;

Х отклонения наблюдаемых значений yit в группах от их средних по группе;

Х отклонения средних по группам от среднего по всем NT наблюдениям.

Если мы используем оценку УпуФ, то она получается в результате применения метода наименьших квадратов к уравнению yit = + xit + uit, i =1,K, N, t =1,K,T.

При этом коэффициент детерминации равен квадрату (выборочного) коэффициента корреляции между переменными yit и it = + OLS xit, где OLS - OLS-оценка коэффициента в модели пула. Об этом коэффициенте детерминации говорят как о У R2 -полномФ ( R2 overall), 2 2 Roverall = corr (yit, + OLS xit )= corr (yit, OLS xit ).

Если мы используем оценку УмеждуФ, то она получается в результате применения метода наименьших квадратов к уравнению yi = + xi +i, i =1,K, N.

При этом коэффициент детерминации равен квадрату (выборочного) коэффициента корреляции между переменными yit и i = + b xi, где b - УмеждуФ-оценка для коэффициента. Об этом коэффициенте детерминации говорят как о У R2 -междуФ ( R2 between), 2 2 Rbetween = corr ( + b xi, yi )= corr (b xi, yi).

Если мы используем оценку УвнутриФ, то она получается в результате применения метода наименьших квадратов к уравнению 260 Глава yit - yi = (xit - xi)+ (uit - ui), i =1,K, N, t =1,K,T.

В правой части последнего уравнению отсутствует константа. А при OLS-оценивании уравнений вида zi = wi + vi коэффициент детерминации в общем случае не равен квадрату выборочного коэффициента корреляции между переменными i = wi и zi.

Однако если переменные zi и wi центрированы, так что z = w = 0, то такое равенство обеспечивается. В нашем случае переменные yit - yi и xit - xi центрированы, так что коэффициент детерминации, получаемый при оценивании уравнения в отклонениях от средних по группам равен квадрату (выборочного) ~ коэффициента корреляции между переменными yit = yit - yi и ~ it = CV (xit - xi ), i =1,K, N, t =1,K,T, где CV - УвнутриФ-оценка для коэффициента. Об этом коэффициенте детерминации говорят как о У R2 -внутриФ ( R2 within), 2 Rwithin = corr (CV (xit - xi ), yit - yi).

Каждый из этих трех вариантов R2 является обычным коэффициентом детерминации в соответствующей модели регрессии. В то же время при анализе различных моделей панельных данных часто сообщаются вычисленные значения всех трех вариантов R2, несмотря на то, что в модели с фиксированными эффектами используется оценка CV, в модели со случайными эффектами - оценка GLS, а в модели пула - оценка OLS.

Более точно, при анализе панельных данных принято сообщать 2 2 под названиями Rwithin, Rbetween, Roverall значения 2 Rwithin = corr (yit - yi, (xit - xi )), 2 Rbetween = corr (yi, xi), 2 Roverall = corr (yit, xit ), Панельные данные вне зависимости от того, каким образом была получена оценка.

Если является p -мерным вектором, то, соответственно, T 2 Rwithin = corr (yit - yi, (xit - xi ) ), 2 Rbetween = corr (yi, xiT ), 2 2 T Roverall = corr (yit, xit ).

При этом приводимое значение Rwithin является коэффициентом within детерминации в обычном смысле, если = ; приводимое значение Rbetween является коэффициентом детерминации в обычном смысле, если = between ; приводимое значение Roverall является коэффициентом детерминации в обычном смысле, если = OLS.

П р и м е р (продолжение) Приведем результаты оценивания в пакете Stata8 моделей с фиксированными и случайными эффектами для данных о трех предприятиях. При этом заметим, что в рамках этого пакета приняты обозначения, отличающиеся от используемых нами:

индивидуальные эффекты обозначаются как ui, а случайные ошибки - как eit. Чтобы избежать путаницы, в приводимые далее протоколы оценивания внесены соответствующие изменения.

Fixed-effects (within) regression R-sq:

within = 0.between = 0. overall = 0.Проверка значимости регрессии в целом:

F(1,26) = 472.26, Prob > F = 0.Оцененное значение коэффициента корреляции между индивидуальным эффектом и переменной x 262 Глава corr(_i, X) = -0.VARIABLE Coef. Std. Err. t

t x 1.102192.0507186 21.73 0. cons -1.394325.8230266 -1.69 0.sigma_lfa 1.sigma_u 1.rho.4184474 (fraction of variance due to _i) F test that all alfa_i=0:

F(2, 26) = 6.81, Prob > F = 0.Последний критерий соответствует гипотезе с двумя линейными ограничениями: поскольку в модель включена постоянная составляющая, то одно линейное ограничение накладывается заранее как идентифицирующее и не подлежащее проверке.

Random-effects GLS regression R-sq:

within=0.between=0. overall= 0.Random effects: u_i ~ Gaussian corr(_i, X) = 0 (предполагается) Критерий значимости регрессии в целом:

Wald chi2(1) = 325.94, Prob>chi2 = 0.sigma_alfa sigma_u 1.rho 0 (fraction of variance due to _i) Здесь полученная оценка для оказывается отрицательной;

поэтому ее значение полагается равным нулю. Однако тогда модель со случайными эффектами редуцируется к модели УпулаФ:

Панельные данные y Coef. Std. Err. z

z x 1.058959.0586557 18.05 0.cons -.7474755.955953 -0.78 0.В то же время, если в рамках модели со случайными эффектами применить критерий БройшаЦПагана для проверки гипотезы об отсутствии таковых эффектов, т.е. гипотезы H0 : = 0, то полученное значение статистики критерия равно 8.47. Этому значению соответствует рассчитанное по асимптотическому распределению хи-квадрат с 1 степенью свободы P-значение 0.0036. Но это говорит против гипотезы H0. И опять это можно объяснить малым количеством наблюдений - ведь распределение хи-квадрат здесь только асимптотическое.

В пакете Stata8 есть возможность оценить модель со случайными эффектами, не прибегая к GLS-оцениванию, а используя метод максимального правдоподобия. Это дает следующие результаты:

Random-effects ML regression Random effects: _i ~ Gaussian Log likelihood = -61.Критерий значимости регрессии в целом:

LR chi2(1) = 121.60, Prob > chi2 = 0.y Coef. Std. Err. z

z x 1.092893.0501518 21.79 0.cons -1.255205 1.019264 -1.23 0.sigma_ 1.064836.5552752 1.92 0.sigma_u 1.713621.2334960 7.34 0.rho.2785682. Likelihood-ratio test of sigma_alfa=0:

chibar2(01) = 4.70, Prob>=chibar2 = 0.По этому критерию гипотеза H0 : = 0 отвергается.

264 Глава Between regression (regression on group means) R-sq:

within = 0.between = 0. overall = 0.Проверка значимости регрессии в целом:

F(1,1) = 5.98, Prob > F = 0.y Coef. Std. Err. t

t x.3137715.1283133 2.45 0.cons 10.40202 1.929616 5.39 0.Здесь регрессия оказывается статистически незначимой, а близкое к 1 значение коэффициента детерминации Rbetween не должно вводить в заблуждение: для оценивания двух коэффициентов имеется всего наблюдения.

3.5. Выбор между моделями с фиксированными или случайными эффектами.

Прежде всего напомним уже отмеченные ранее особенности моделей с фиксированными или случайными эффектами.

Х FE: получаемые выводы - условные по отношению к значениям эффектов i в выборке; это соответствует ситуациям, в которых эти значения нельзя рассматривать как случайную выборку из некоторой более широкой совокупности (популяции). Такая интерпретация наиболее подходит для случаев, когда субъектами исследования являются страны, крупные компании или предприятия, т.е.

каждый субъект Фимеет свое лицоФ.

Х RE: получаемые выводы - безусловные относительно популяции всех эффектов i. Исследователя интересуют не Панельные данные конкретные субъекты, а обезличенные субъекты, имеющие заданные характеристики.

Pages:     | 1 |   ...   | 19 | 20 | 21 | 22 | 23 |   ...   | 30 |    Книги по разным темам