22 ББК 65в6 Н84 Носко В.П. Эконометрика для начинающих (Дополнительные главы). - М.: ИЭПП, 2005. С. 379. Агентство CIP РГБ В книге рассматриваются методы статистического анализа регрессионных моделей с ограниченной (цензурированной) зависимой

Книги по разным темам Pages: | 1 | ... | 20 | 21 | 22 | 23 | 24 | ... | 30 |

Заметим в этой связи, что Х в FE-модели E(yit xit )= E(i + xit + uit xit)= i + xit.

Х в RE-модели E(yit xit )= E( + i + xit + uit xit )= + xit Напомним, теперь, что RE модель предполагает, в частности, что E(ixit )= 0. Чтобы избавиться от этого условия ортогональности, предположим, что i = a xi + i, i ~ N(0, ), E(ixit )= 0.

Это приводит к Умодели МундлакаФ:

yit = + xit + a xi + i + uit, которая также является моделью компонент ошибки. Она отличается от предыдущей модели тем, что в правую часть добавляется переменная xi, изменяющаяся только от субъекта к субъекту и отражающая неоднородность субъектов. Эта переменная, в отличие от i, наблюдаема. Заметим, что в модели Мундлака E(ixit )= E((a xi + i)xit )= aE(xixit )= T T a a = xit )= E(xit)+ xit ), E(xis E(xis T T s=1 s=1, st так что если a 0, то условие E(ixit )= 0 в общем случае не выполняется ни для одного i =1,K, N.

Применение GLS к этой модели дает BLUE оценки для и a, имеющие вид:

GLS = CV, aGLS = b - CV, и 266 Глава GLS = y - xb.

Иначе говоря, BLUE оценкой для в этой модели является ковариационная (внутригрупповая) оценка, и из E(GLS )= a, E(GLS )= E(b)- E(CV ) и E(CV )=, получаем:

E(b)= a +.

Как было показано выше, в RE-модели (предполагающей выполнение условия E(ixit )= 0 ) RE = wb + (1- w)CV.

Если использовать эту же оценку в модели Мундлака, то для нее получим:

RE E( )= wE(b)+(1- w)E(CV )= w( + a)+ (1- w) = + wa, RE так что если a 0, то - смещенная оценка.

Критерии спецификации Речь здесь идет о том, совпадает ли условное распределение i при заданном xi с безусловным распределением i (в более слабой форме: выполняется ли соотношение E(i xi )= 0 - тогда и E(i xi )= 0 ). Если нет, то наилучшей оценкой является CV (FE).

Если да, то наилучшей оценкой является GLS (RE).

Критерий Используя формулировку Мундлака, проверяем гипотезу H0 : a = 0 против альтернативы H1 :a 0.

Критерий 2 - критерий Хауcмана (Hausman) Проверяемая гипотеза: H0 :E(i xi)= 0, альтернативная гипотеза:

H1 :E(i xi) 0.

Идея этого критерия основывается на следующих фактах:

Панельные данные Х При гипотезе H0 и оценка GLS, соответствующая RE- модели, и оценка CV, соответствующая FE-модели, - состоятельны.

Х При гипотезе H1 оценка GLS несостоятельна, а оценка CV состоятельна.

Соответственно, если гипотеза H0 верна, то между оценками GLS и CV не должно наблюдаться систематического расхождения, и эта гипотеза должна отвергаться при Услишком большихФ по абсолютной величине значениях разности CV - GLS (больших в сравнении со стандартной ошибкой этой разности).

Пусть q = CV - GLS ; тогда из общей формулы для дисперсии суммы двух случайных величин следует, что CV D(q) = D( - GLS )= CV GLS = D( )+ D( )- 2Cov(CV, GLS ).

Если выполняются предположения стандартной RE-модели, то как было указано выше, GLS является эффективной оценкой, а CV - неэффективной оценкой. Хаусман показал, что эффективная оценка не коррелирована с разностью ее и неэффективной оценки, так что если гипотеза H0 верна, то GLS Cov(GLS, GLS - CV )= D(GLS )- Cov(, CV )= 0, Cov(GLS, CV )= D(GLS ), и D(q) = D(CV )- D(GLS ).

Как уже говорилось выше, u D(GLS)=, N T N 2 - xi) + - x) (xit (xi i=1 t =1 i =268 Глава u CV D( )=.

N T it (x - xi ) i=1 t=Заменяя в этих выражениях неизвестные параметры их состоятельными оценками, указанными ранее, получаем состоятельную оценку D(q) для D(q).

Статистика критерия Хаусмана q m = D(q) имеет при гипотезе H0 асимптотическое (N ) распределение (1).

Для K регрессоров при гипотезе H0 статистика m = qT [Cv(q)]-1q имеет асимптотическое распределение (K).

Численно идентичный критерий для проверки гипотезы Hполучается с использованием расширенной модели регрессии yit = xit + (xit - xi) + it, где yit = yit - yi, xit = xit - xi, u =1- =1-.

2 u + T Гипотеза H0 означает в этой регрессии, что = 0. Можно показать, что здесь OLS OLS = b, = CV - b.

Гипотезу H0 можно также проверить, используя любую из следующих разностей:

Панельные данные q1 = GLS - CV, q2 = GLS - b, q3 = CV - b, q4 = GLS - OLS.

Это вытекает из соотношения GLS = wb + (1 - w)CV.

З а м е ч а н и е Все входящие в эти разности оценки параметра состоятельны при гипотезе H0 ; поэтому все эти разности должны сходиться при гипотезе H0 к нулю.

П р и м е р (продолжение примера с тремя предприятиями) Применим критерий Хаусмана.

Coefficients (b) fix (B) (b-B) S.E.

x 1.102192 1.058959. Здесь b = CV, B = GLS, (b-B) = q = CV - GLS.

Cтатистика критерия Хаусмана равна chi2(1) = (b-B)'[(V_b-V_B)^(-1)](b-B) =-2.15, где V_b и V_B - состоятельные оценки дисперсий оценок CV и GLS, соответственно. Поскольку значение этой статистики оказалось отрицательным, критерий Хаусмана применить не удается.

П р и м е р (объяснение размеров заработной платы) Статистические данные (из National Longitudinal Survey, Youth Sample, США) содержат сведения о 545 полностью занятых мужчинах, окончивших школу до 1980 г. и наблюдавшихся в 270 Глава течение 1980Ц1987 гг. В 1980 г. эти мужчины имели возраст в пределах от 17 до 23 лет и включились в рынок труда совсем недавно, так что на начало периода их трудовой стаж составлял в среднем около 3 лет. Логарифмы заработной платы объясняются здесь длительностью школьного обучения, трудовым стажем и его квадратом, а также дамми-переменными, указывающими на членство в профсоюзе, работу в государственном секторе, семейный статус (состоит ли в браке), а также на цвет кожи (чернокожий или нет) и испаноязычность.

Результаты оценивания:

Оценка Between FE OLS RE Переменная Const 0.490 _ -0.034 -0.(0.221) (0.065) (0.111) scooling 0.095 _ 0.099 0.(0.011) (0.005) (0.009) experience -0.050 0.116 0.089 0.(0.050) (0.008) (0.010) (0.008) experience2 0.005 -0.0043 -0.0028 -0.(0.003) (0.0006) (0.0007) (0.0006) Uniоn member 0.274 0.081 0.180 0.(0.047) (0.019) (0.017) (0.018) married 0.145 0.045 0.108 0.0.041 (0.018) (0.016) (0.017) black -0.139 _ -0.144 -0.(0.049) (0.024) (0.048) hispanic 0.005 _ 0.016 0.(0.043) (0.021) (0.043) Public sector -0.056 0.035 0.004 0.(0.109) (0.039) (0.037) (0.036) Within R2 0.0470 0.1782 0.1679 0.Between R2 0.2196 0.0006 0.2027 0.Overall R2 0.1371 0.0642 0.1866 0.Панельные данные RE=EGLS (FGLS) соответствует = 0.FE=CV соответствует = OLS соответствует = Значения RE и OLS заключены между Between и FE.

Если выполнены предположения модели со случайными эффектами, то все четыре оценки состоятельны. Если, однако, индивидуальные эффекты i коррелированы хотя бы с одной из объясняющих переменных, то состоятельной остается только FEоценка. Поэтому встает вопрос о проверке гипотезы H0 о том, что модель является RE-моделью. Для этого можно сравнивать оценки УвнутриФ (FE) и УмеждуФ или оценки УвнутриФ (FE) и RE (соответствующие критерии равносильны). Проще сравнивать вторую пару, используя критерий Хаусмана, описанный ранее.

Coefficients (b) (B) (b-B) sqrt(diag(V_b-V_B)) fix S.E.

EXPER.116457.1117851.0046718.EXPER2 -.0042886.0040575 -.0002311.MAR.0451061.0625465 -.0174403.PUB.0349267.0301555.0047713.UNION.081203.1064134 -.0252104.chi2(5) = (b-B)'[(V_b-V_B)^(-1)](b-B) = 31. Prob>chi2 = 0. Вычисленное значение статистики этого критерия равно 31.75 и отражает различия в FE- и RE-оценках коэффициентов при переменных: experience, experience2, Union member, married, Public sector. Для распределения (5) значение 31.75 соответствует P-значению 6.6 10, так что нулевая гипотеза (RE-модель) заведомо отвергается. Чем это может объясняться 272 Глава Ненаблюдаемая гетерогенность i может, например, коррелировать с семейным положением, что подтверждается данными приведенной таблицы. Если из модели выметаются индивидуальные эффекты и используется FE-оценка, то влияние этого фактора уменьшается до 4.5%, тогда как для УbetweenФ-оценки это влияние составляет 14.5%. Заметим, что влияние этого фактора идентифицируется только благодаря наличию в выборке индивидов, изменивших свое семейное положение в период наблюдений.

Аналогичные замечания справедливы и в отношении членства в профсоюзе.

Следует, впрочем, заметить, что все использованные оценки предполагают некоррелированность объясняющих переменных с uit, и при нарушении этого условия даже FE-оценка оказывается несостоятельной.

Приведенные в конце таблицы значения трех различных мер согласия показывает, что наибольшее значение within-R2 достигается для FE-оценки, т.е. именно она наилучшим образом объясняет внутригрупповую изменчивость. OLS-оценка максимизирует обычный overall-R2. RE-оценка дает близкие значения всем трем мерам согласия. Отметим еще, что стандартные ошибки OLS-оценки вообще-то говоря не соответствуют действительности, т.к. не принимают во внимание коррелированность ошибок между собой.

Правильные их значения должны быть больше стандартных ошибок EGLS-оценок, принимающих во внимание эту коррелированность.

3.6. Автокоррелированные ошибки Во всех рассмотренных выше ситуациях предполагалось, что случайные составляющие uit - взаимно независимые случайные величины, имеющие одинаковое распределение N(0,u ). Между тем, вполне возможно, что для i -го субъекта последовательные ошибки ui1,ui2,K,uiT не являются независимыми, а следуют, скажем, Панельные данные стационарному процессу авторегрессии первого порядка с нулевым средним.

Точнее говоря, пусть мы имеем дело с моделью yit = + i + xit + uit, i =1,K, N, t =1,K,T, в которой uit = ui,t -1 + it, где < 1, а случайные величины i1,i2,K,iT являются гауссовскими инновациями, так что они взаимно независимы и имеют одинаковое распределение N(0, ) и, кроме того, it не зависит от значений ui,t -k, k 1. Общий для всех субъектов коэффициент можно оценить различными способами. При этом в большинстве случаев сначала переходят к модели, скорректированной на групповые средние:

yit - yi = (xit - xi )+ (uit - ui), т.е.

~ ~ ~ yit = xit + uit, а затем поступают по-разному.

Можно, например, оценить (методом наименьших квадратов) последнюю модель без учета автокоррелированности ошибок, ~ ~ ~ получить последовательность остатков i1, i2,K, iT, вычислить значение статистики ДарбинаЦУотсона N T ~ ~ (it - i,t -1) i=1 t =d = N T ~ it i=1 t =и, используя приближенное соотношение 1- d 2, получить оценку DW 1 - d 2.

274 Глава Можно поступить иначе: получив последовательность остатков ~ ~ ~ i1, i2,K, iT, использовать оценку наименьших квадратов, получаемую при оценивании уравнения регрессии ~ ~ it = i,t-1 +it.

Искомая оценка вычисляется по формуле:

N T ~ ~ it i,t -i=1 t = =.

N T ~ it i=1 t = [В пакете Stata8 эта оценка обозначена как tscorr.] После получения оценки для производится преобразование переменных, призванное получить модель с независимыми ошибками. Наконец, в рамках преобразованной модели производится обычный анализ на фиксированные или случайные эффекты.

П р и м е р В примере с тремя предприятиями для модели с фиксированными эффектами получаем следующие результаты.

При использовании DW-оценки:

. xtregar y x, fe rhotype(dw) lbi - FE (within) regression with AR(1) disturbances Number of obs = R-sq:

within = 0.between = 0.overall = 0.F(1,23) = 510.54, Prob > F = 0.corr(_i, Xb) = -0.Панельные данные y Coef. Std. Err. t

t x 1.105796.0489398 22.60 0.cons -1.317209.6964634 -1.89 0.rho_ar.sigma_ 1.sigma_u 1.rho_fov.3917622 (доля дисперсии, соответствующей индивидуальным эффектам _i) F test that all alfa_i=0:

F(2,23)= 3.82, Prob > F = 0.modified Bhargava et al. Durbin-Watson = 1.Baltagi-Wu LBI = 1.Оценка коэффициента по сравнению со значением 1.102192, полученным ранее без учета возможной автокоррелированности ошибок, практически не изменилась. И это согласуется со значением статистики ДарбинаЦУотсона. Вывод об отсутствии индивидуальных эффектов также не изменяется.

При использовании tscorr-оценки:

. xtregar y x, fe rhotype(tscorr) FE (within) regression with AR(1) disturbances Number of obs = R-sq: within = 0.between = 0.overall = 0.F(1,23)= 476.47, Prob > F = 0.corr(_i, Xb) = -0.y Coef. Std. Err. t

t x 1.109267.050818 21.83 0.cons -1.392025.7698403 -1.81 0.276 Глава rho_ar.sigma_ 1.sigma_u 1.rho_fov.39426073 (доля дисперсии, соответствующей индивидуальным эффектам _i)) F test that all alfa_i=0:

F(2,23) = 4.66, Prob > F = 0.Оцененное значение коэффициента автокорреляции на этот раз почти в два раза меньше. Оценка коэффициента практически не изменилась.

3.7. Двухфакторные (двунаправленные) модели 3.7.1. Фиксированные эффекты Здесь мы рассматриваем модель, в которую помимо индивидуальных эффектов i включаются также и временные эффекты t :

yit = +i + t + xit + uit, i = 1,K, N, t = 1,K,T, N T где = 0, = 0, так что i и t - Удифференциальные i t i =1 t =эффектыФ. При этом и i и t интерпретируются как неизвестные постоянные.

Обозначая N yt = yit и т.д. (средние по субъектам), N i =T yi = yit и т.д. (средние по времени), T t =Панельные данные N T y = yit (среднее по всем наблюдениям), NT i =1 t =получаем:

(yit - yi - yt + y)= (xit - xi - xt + x) + (uit - ui - ut + u ).

Оценка наименьших квадратов для коэффициента в этом уравнении (двухфакторная внутригрупповая оценка) имеет вид N T - yi - yt + y)(xit - xi - xt + x) (yit Wxy i =1 t = CV = =.

N T Wxx - xi - xt + x) (xit i =1 t =На основании соотношений (yi - y)= i + (xi - x) + (ui - u ), (yt - y)= t + (xt - x) + (ut - u ) можно получить оценки для i и t :

i = (yi - y)- CV (xi - x), t = (yt - y)- CV (xt - x).

Для оценивания двунаправленной модели с фиксированными эффектами в пакете Stata применяется процедура xtreg, fe с включением дамми-переменных для временных периодов.

П р и м е р (объяснение размеров заработной платы, продолжение) Fixed-effects (within) regression R-sq:

Pages: | 1 | ... | 20 | 21 | 22 | 23 | 24 | ... | 30 |

Книги по разным темам