7 ББК 65в6 Н84 Носко В.П. Эконометрика для начинающих (Дополнительные главы). - М.: ИЭПП, 2005. С. 379. Агентство CIP РГБ В книге рассматриваются методы статистического анализа регрессионных моделей с ограниченной (цензурированной) зависимой

Книги по разным темам Pages: | 1 | ... | 5 | 6 | 7 | 8 | 9 | ... | 30 |

T T T xi w - xi dw xi E(yi xi)= 01- + = w T T xi xi T = xi +.

Оно отличается от выражения для E(yi xi) в усеченной модели T xi умножением последнего на, т.е. на величину, меньшую единицы. Раскрывая скобки в правой части, получаем представление T T T xi xi xi T E(yi xi)= xi + = Модели с дискретными объясняемыми переменнымиЕ xiT xiT T = xi +.

Предельный эффект изменения переменной xij равен T E(yi xi) xi =, xij j т.е. меньше значения коэффициента в исходной модели: он j получается умножением этого коэффициента на вероятность того, что yi > 0.

~ Заметим в связи с этим, что если E(yi xi) - условное математическое ожидание значения yi в усеченной модели, то для него ~ E(yi xi ) = [1 - z(z) - 2 (z)], xij j где T xi (z) = (z) (z), z =.

Продолжим рассмотрение смоделированной выборки, состоящей из 1000 семей, 582 из которых имеют автомобиль. Подберем к тем же данным усеченную и цензурированную модели.

Заметим, что если переменная yi = price - 2000 порождается i моделью y = + xi + i, i =1,K,1000, то сама переменная price i i порождается моделью price = ( + 2000) + xi + i. Поэтому i достаточно произвести оценивание коэффициентов модели y = + xi + i, опираясь на данные (xi, yi ). Такое оценивание i приводит к следующим результатам.

78 Глава Усеченная модель:

Coefficient Std. Error z-Statistic Prob.

C -5710.678 480.1485 -11.89357 0.X 8.103471 0.376079 21.54728 0. Error Distribution 1822.273 66.21537 27.52040 0.Цензурированная модель:

Coefficient Std. Error z-Statistic Prob.

C -6041.883 233.5302 -25.87195 0.X 8.363125 0.209276 39.96215 0. Error Distribution 1823.565 53.95272 33.79933 0.Это приводит к следующим оцененным моделям для прогноза значений переменной price :

i price = -3710.678 + 8.103471xi (усеченная модель), i price = -4041.883 + 8.363125 xi (цензурированная модель).

i Дисперсии случайных составляющих оцениваются, соответственно, как 1822.273 и 1823.565. Заметим, что УтеоретическаяФ модель, по которой генерировались данные, имела вид price = -3600 + 8 xi +1800ui, i где u1,K,u1000 - независимые случайные величины, имеющие одинаковое стандартное нормальное распределение N(0,1).

На следующем графике для сравнения показаны значения переменной price и прогнозные значения для этой переменной, i полученные по оцененной усеченной модели ( price _ starf _ trun ) и по оцененной цензурированной модели ( price _ starf _ cens ).

Модели с дискретными объясняемыми переменнымиЕ 0 ----PRIСE_STAR PRICE_STARF_CENS PRICE_STARF_TRUN Отметим, что прогнозные значения, полученные по двум оцененным моделям, весьма близки.

На следующем графике представлены значения переменной yi и ожидаемые значения переменной yi, рассчитанные по двум оцененным моделям.

80 Глава 0 600 1200 Y YF_TRUNC YF_CENSORED Отметим, что для значений xi 1330 ожидаемые значения yi, рассчитанные по цензурированной модели, больше ожидаемых значений yi, рассчитанных по модели; однако это различие практически незаметно. В то же время, для значений xi <ожидаемые значения yi, рассчитанные по цензурированной модели, меньше ожидаемых значений yi, рассчитанных по усеченной модели, причем это различие становится весьма заметным при уменьшении значений xi.

Заметим еще, что ожидаемые значения yi, рассчитанные и по усеченной и по цензурированной модели, положительны для всех 1000 наблюдений, тогда как это не выполняется для линейных моделей, подобранных методом наименьших квадратов Так, оценивание обычным методом наименьших квадратов модели yi = + xi + i по всем 1000 наблюдениям дает следующую картину:

Модели с дискретными объясняемыми переменнымиЕ Variable Coefficient Std. Error t-Statistic Prob.

C -2075.806 104.7679 -19.81338 0.X 5.130473 0.109904 46.68158 0.Для значений xi 470 подобранная модель прогнозирует отрицательные значения объясняемой переменной.

При подгонке такой модели методом наименьших квадратов по 582 наблюдениям получаем:

Variable Coefficient Std. Error t-Statistic Prob.

C -3037.189 274.4903 -11.06483 0.X 6.119677 0.233812 26.17353 0.Оцененная модель прогнозирует отрицательные значения объясняемой переменной для значений xi 498.

Это положение иллюстрирует следующий график:

-2000 0 600 1200 -X Y YF_OLS_1000 YF_OLS_Одним из показателей качества прогноза произвольного временного ряда zi, i =1,K, n, является средняя абсолютная процентная ошибка (MAPE - mean squared absolute error), 82 Глава определяемая следующим образом. Если i - прогнозное значение для zi, то n MAPE = 100 zi zi i.

n i=Cравним качество полученных альтернативных прогнозов для yi с точки зрения средней абсолютной процентной ошибки.

Модель OLS_582 OLS_1000 Truncated Censored MAPE % 118.46 99.86 126.69 71.Как видно из этой таблицы, наилучшее качество имеют прогнозы, полученные с использованием цензурированной модели регрессии.

Обратим внимание на еще одно обстоятельство. Мы уже отмечали, что T T xi xi xiT ~ T E(yi xi )= xi + = E(yi xi ), ~ где E(yi xi) - условное математическое ожидание значения yi в усеченной модели. Отсюда мы получаем следующее разложение:

xiT ~ T E(yi xi ) E(yi xi ) xi ~ = + E(yi xi ).

xij xij xij Первое слагаемое отражает изменение в ожидаемых значениях T xi yi > 0, взвешенное с весом = P{yi > 0}, а второе - изменение вероятности P{yi > 0}, взвешенное с весом, равным ~ E(yi xi). Заметим в этой связи, что Модели с дискретными объясняемыми переменнымиЕ T xi T P{yi > 0} 1 xi = =.

j xij xij ~ В нашем примере E(yi xi) изменяется следующим образом (по оси абсцисс на этом и на следующих 5 графиках откладываются значения среднемесячного дохода на одного члена семьи):

0 600 1200 E_Y E_Y>P{yi > 0} изменяется следующим образом:

Производная xij 84 Глава 0.0.0.0.0.0.0 600 1200 D_PROB E(yi xi) слагаемые имеют вид:

Входящие в разложение для xij 0 600 1200 TERMМодели с дискретными объясняемыми переменнымиЕ 2.1.0.0 600 1200 TERMT E(yi xi) xi В сумме они дают функцию = :

xij j 0 600 1200 D_EXPECTED_Y 86 Глава Следующий график позволяет сравнить влияние единичного возрастания дохода на ожидаемые значения yi во всей популяции (D_EXPECTED_Y) и среди семей с yi > 0 (D_E_Y>0).

0 600 1200 D_EXPECTED_Y D_E_Y>1.8. Модель Тобит-II В предыдущем разделе мы рассмотрели линейную модель наблюдений price = + xi + i, i =1,K, n, i в которой price - цена, которую уплатила за покупку автомобиля i (автомобилей) i-я семья, если эта семья имеет автомобиль, или цена, которую уплатила бы за покупку автомобиля i-я семья, не имеющая автомобиля, если бы эта семья решила приобрести автомобиль. При Модели с дискретными объясняемыми переменнымиЕ этом мы предполагали, что i-я семья покупает автомобиль по цене price, если price >. Таким образом, в этой модели решение о i i приобретении или неприобретении собственного автомобиля определяется самой ценой, по которой предполагается приобрести автомобиль. В то же время мы могли бы рассмотреть и другую модель, в которой процесс принятия решения о стоимости покупаемого автомобиля отделен от процесса принятия решения о покупке автомобиля.

Пусть мы имеем дело с некоторым показателем yi, значения которого наблюдаются не для всех i. Значение yi наблюдается, если выполнено условие hi > 0, где hi - некоторая функция полезности. Мы будем предполагать, что T y = x1i1 + 1i, i =1,K, n, i T h = x2i2 + 2i, i =1,K, n, i где T x1i =(x11,i, K, x1p1,i) - вектор значений p1 объясняющих переменных в уравнении для y, i T 1 = (11,K,1p1) - вектор коэффициентов при этих переменных, T x2i =(x21,i, K, x2 p2,i) - вектор значений p2 объясняющих переменных в уравнении для hi, T 2 = (21,K,2 p2 ) - вектор коэффициентов при этих переменных.

Случайные составляющие 1i и 2i могут быть коррелированными, так что Cov(1i,2i) 0. Следуя обычной практике, мы будем предполагать, что двумерные случайные 88 Глава векторы (1i,2i)T, i =1,K, n, независимы в совокупности и имеют одинаковое двумерное нормальное распределение N2(0,) с нулевым вектором математических ожиданий и ковариационной матрицей 1 =, 12 т.е.

1i 1 ~ i.i.d. N20, 2.

2i 12 Для нормализации функции полезности полагаем =1.

Наблюдаемыми являются Х значения объясняющих переменных x1 j,i, x2 j,i, j =1,K, p, i =1,K, n ;

Х значения переменной hi, 1, если h 0, > i hi = 0, если h 0;

i Х значения переменной yi, y, если hi =1, i yi = 0, если hi = 0.

Определенную таким образом модель называют стандартной Тобит-II моделью. Соответственно, о модели рассмотренной в предыдущем разделе, в этом контексте говорят как о стандартной Тобит-I модели.

Модели с дискретными объясняемыми переменнымиЕ З а м е ч а н и е Объясняющие переменные в уравнениях для yi и hi могут быть как одинаковыми, так и различными. В ряде ситуаций экономическая аргументация указывает на необходимость включения в правую часть уравнения для hi (уравнение выбора) всех переменных, включенных в правую часть уравнения для yi.

При этом коэффициенты при одной и той же переменной в уравнениях для yi и hi могут быть различными.

T T Если предположить, что x1i1 = x2i2 и 1i = 2i, то мы возвращаемся к стандартной Тобит-модели, рассмотренной в предыдущем разделе (модель Тобит-I).

Обращаясь опять к примеру с автомобилями, мы могли бы расмотреть, например, модели, в которых значение price i определяется по той же формуле price = + xi + i, i =1,K, n, i но наличие автомобиля соответствует выполнению соотношения hi > 0, в котором h = + xi +ui, i или, например, h = + xi + dman + ui, i где dman =1, если главой семьи является мужчина, и dman = 0, если главой семьи является женщина.

Прежде всего заметим, что (при фиксированных значениях x1i, x2i ) T T T E{yi hi =1}= x1i1 + E{1i hi =1}= x1i1 + E{1i 2i > -x2i2}= 90 Глава T T T T = x1i1 + E{1i 2i > -x2i2}= x1i1 +12(x2i2), где, как и ранее, (z) = (z) (z).

Если 12 = 0, то T E{yi hi = 1}= x1i1.

Это означает, что если 1i и 2i не коррелированы, то можно, игнорируя уравнение для hi, производить непосредственное оценивание уравнения регрессии T yi = x1i1 + 1i методом наименьших квадратов по наблюдениям с hi =1. Это T приводит к состоятельному оцениванию значений x1i1.

Однако если 12 0, то при таком оценивании возникает T T смещение оценки x1i1, пропорциональное величине (x2i2), которую называют в этом контексте лямбдой Хекмана.

Получить состоятельные и асимптотически эффективные оценки параметров модели Тобит-II можно, используя метод максимального правдоподобия, при котором соответствующая функция правдоподобия максимизируется по всем возможным значениям параметров модели 1,2,1,12. Однако чаще такую модель оценивают, используя двухшаговую процедуру Хекмана. Она проста в вычислительном отношении и дает хорошие стартовые значения для итерационной процедуры максимизации функции правдоподобия.

Идея Хекмана состоит в использовании уже приводившегося выше соотношения T T E{yi hi =1}= x1i1 +12(x2i2) и построения на его основе модели регрессии Модели с дискретными объясняемыми переменнымиЕ T yi = x1i1 +12i +i, где i - переменная, определяемая соотношением T T T i = (x2i2)= (x2i2) (x2i2).

Если 1i не коррелирована с x1i и x2i, то i не коррелирована с x1i и i, так что эту модель регрессии можно оценивать методом наименьших квадратов. Проблема, однако, в том, что значения i не наблюдаются, поскольку неизвестен вектор коэффициентов 2 в модели выбора.

Оценивание вектора 2 производится в рамках пробит-модели бинарного выбора. При этом получаем оцененные значения T i = (x2i2) (первый шаг процедуры Хекмана). Эти оцененные значения используются затем на втором шаге процедуры вместо i.

T Модель yi = x1i1 + 12i + оценивается методом наименьших i квадратов; в результате получаем состоятельные (хотя и не эффективные) оценки для 1 и 12. Используя эти оценки, мы получаем оцененное ожидаемое значение yi при заданных x1i, x2i и hi =1 в виде T 12 T {yi x1i, x2i, hi = 1}= x1i1 + (x2i2).

Если же нас интересует ожидаемое значение yi при заданных x1i, x2i без условия hi =1, то оно оценивается величиной T {yi x1i, x2i}= x1i1.

Поскольку смещение при оценивании уравнения для yi методом наименьших квадратов вызывается коррелированностью 1i и 2i, представляет интерес проверка гипотезы H0 : 12 = 92 Глава об отсутствии такой коррелированности в рамках модели, оцененной на втором шаге. Отметим только, что при проверке этой гипотезы следует производить коррекцию значений стандартных ошибок оценок, учитывающую гетероскедастичность модели и тот факт, что вместо переменной i на втором шаге используется предварительно оцененная переменная i.

Заметим, наконец, что в описанной выше стандартной Тобит-II модели функция правдоподобия имеет вид n hi i L(1,2,1,12)= = 0})1-h (P{hi =1} f (yi hi =1)), (P{hi i=где f (yi hi =1) - условная плотность распределения случайной величины yi при hi =1. Здесь T P{hi = 0}=1- (x2i2), P{hi =1} f (yi hi =1)= P{hi =1 yi} f (yi ), T 2 T x2i2 +(12 1 )(yi - x1i1) P{hi =1 yi}=, 1-12 T 1 (yi - x1i1) f (yi )= exp -.

1 2 Для начала итерационной процедуры в качестве стартовых можно взять значения оценок параметров, полученные в процессе реализации двухшаговой процедуры Хекмана.

Модели с дискретными объясняемыми переменнымиЕ П р и м е р Пусть в примере с автомобилями наличие у семьи собственного автомобиля определяется условием w > 2000, где i w = -3600 + 8 xi +18002i, 21,K,2,1000 ~ i.i.d. N(0,1).

i Обозначив hi = wi - 2000, запишем это условие в виде hi > 0, где h = -5600 + 8 xi +18002i, i и нормализуем функцию полезности, разделив обе части последнего равенства на 1800:

h = -3.111+ 0.00445 xi +2i.

i Пусть Употенциальная ценаФ автомобиля для i-й семьи определяется уравнением price = 4000 + 6xi +1i, 11,K,1,1000 ~ i.i.d. N(0,10002).

i В смоделированной выборке пары (11,21),K,(1,1000,2,1000) взаимно независимы, но Cov(1i,2i )= 707, так что коэффициент корреляции случайных величин 1i,2i равен 12 = 0.707.

В принятых выше общих обозначениях модели Тобит-II получаем:

* yi = 11x11,i +12x12,i +1i, h = 21x21,i +22 x22,i + 2i, i где x11,i = x21,i =1, x12,i = x22,i = xi, 11 = 4000, 12 = 6, 21 = -3.111, 22 = 0.00445 ; при этом 1 =1000, =1, 12 = 707.

Применяя к смоделированным данным двухшаговую процедуру Хекмана, получаем на первом шаге оцененное уравнение hi = -3.450 + 0.00476 xi, а на втором шаге - оцененное уравнение price = 3936.2 + 5.995xi.

Pages: | 1 | ... | 5 | 6 | 7 | 8 | 9 | ... | 30 |

Книги по разным темам