Книги по разным темам Pages:     | 1 |   ...   | 15 | 16 | 17 | 18 | 19 |   ...   | 20 |
  • Оценка дисперсии случайныхошибок смещена вниз в случаеположительной и смещенавверх в случае отрицательной автокоррелированностиошибок.
  • Оценки дисперсий случайных величин (оценок коэффициентов линейной модели)оказываются заниженными в случаеположительной и завышенными в случае отрицательнойавтокоррелированности ошибок.
  • Построенные доверительныеинтервалы для несоответствуют заявленным уровням значимости: вслучае положительной автокоррелированности ошибокпостроенные интервалы неоправденно узки, а в случае отрицательной автокоррелированности ошибок неоправданно широки.
  • Вычисленные значения - и- отношений нельзя рассматривать как наблюдаемые значенияслучайных величин,имеющих - и -распределения, соответствующие стандартным предположениям.Поэтому сравнение вычисленных значений - и- отношений с квантилями указанных- и -распределений может приводить к ошибочным статистическим выводамв отношении гипотез означениях коэффициентов линейной модели. Вычисленные значения - и - отношений завышены в случае положительной изанижены в случае отрицательнойавтокоррелированности ошибок.

При обнаружении нарушений стандартныхпредположений следует либо улучшить спецификацию модели, привлекая подходящиедополнительные объясняющие переменные, либо использовать для оцениваниякоэффициентов и оценивания дисперсий коэффициентов модели специальные методыоценивания, принимающие во внимание обнаруженные нарушения (далее мы рассмотримдва таких метода: взвешенный метод наименьшихквадратов и авторегрессионное преобразование переменных).

3.4. КОРРЕКЦИЯ СТАТИСТИЧЕСКИХ ВЫВОДОВ ПРИНАЛИЧИИ ГЕТЕРОСКЕДАСТИЧНОСТИ (НЕОДНОРОДНОСТИ ДИСПЕРСИЙОШИБОК)

Пример. Дляисследования вопроса о зависимости количества руководящих работников от размерапредприятия были собраны статистические данные по 27апромышленным предприятиям.Далее обозначено:

— численность персонала наi-мпредприятии,

— количество руководителей наi-мпредприятии.

Оцениваем линейную модельнаблюдений

Регрессионный анализ дает следующиерезультаты: R2= 0.776 и

Variable

Coefficient

Std. Error

t-Statistic

P-value.

1

14.448

9.562

1.511

0.1433

X

0.105

0.011

9.303

0.0000

Следующие два графика демонстрируютдиаграмму рассеяния с подобранной прямой (левый график) и зависимостьстандартизованных остатков от значений (правый график).

Похоже, что имеет место тенденция линейноговозрастания абсолютных величин остатков с ростом, соответствующая наличиюприближенной зависимости вида для дисперсий ошибок. Чтобы погасить такуюнеоднородность дисперсий, разделим обе части соотношения на :

т. е. перейдем к моделинаблюдений

где

Если действительно выполняется соотношение,то тогда в преобразованной модели

т. е. неоднородность дисперсий ошибокпреодолевается.

Результаты оценивания преобразованноймодели:

Variable

Coefficient

Std. Error

t-Statistic

P-value.

1

0.121

0.009

13.445

0.0000

1/x

3.803

4.570

0.832

0.4131

В исходных переменных это соответствуетмодели линейной связи

Отметим уменьшение оцененных стандартныхошибок оценок обоих параметров и. Именно на эти значения следуетопираться при построении доверительных интервалов для этих параметров. Среднимиточками этих интервалов будут, соответственно, и. Следующий графикпоказывает характер зависимости стандартизованных остатков в преобразованноймодели от.

На сей раз неоднородности дисперсийостатков (по крайней мере явной) необнаруживается.

Рассмотрим внимательнее наши действия приоценивании преобразованной модели. Оценки коэффициентов, приведенные впоследней таблице, получены применением метода наименьших квадратов к моделинаблюдений т. е. путем минимизации суммы квадратов

которую, вспоминая, что обозначаютпеременные со звездочками, можно записать в виде

Обозначая теперь

получаем, что задача минимизации суммыквадратов отклонений в преобразованной модели равносильна задаче минимизациивзвешенной суммы квадратов отклонений в исходной (непреобразованной) модели. Величина интерпретируется в этомконтексте как вес,приписываемый квадрату отклонения в - м наблюдении. Этот вес будет тем меньше,чем больше значение, которое в силу наших предположений пропорциональнодисперсии случайной ошибки в -м наблюдении. Следовательно, чем большедисперсия случайной ошибки, тем меньше вес, с которым входит квадратотклонения в -м наблюдении в минимизируемую сумму.

Имея в виду, что оценивание преобразованноймодели наблюдений сводится к минимизации суммы

рассмотренный метод оценивания называютвзвешенным методом наименьших квадратов (хотя точнее его следовало бы называть методом наименьших взвешенных квадратов).

Замечание. Внекоторых руководствах по эконометрике и в некоторых пакетах статистическогоанализа данных (например, в пакете EVIEWS) используется несколько иноеравносильное представление минимизируемой суммы квадратов в преобразованноймодели наблюдений:

В этом случае вес приписываетсяне квадрату отклонения, асамому отклонениюРазумеется, в рассмотренном примере при таком определении веса последний будетравен

На это обстоятельство следует обратитьвнимание при спецификации весов в процедурах, реализующих взвешенный методнаименьших квадратов.

Обратим теперь внимание на то, в каком видевыдается информация о результатах применения взвешенного метода наименьшихквадратов на примере пакета EVIEWS. При этом используем данные израссмотренного выше примера. Согласно сказанному в Замечании, при обращении кпроцедуре оценивания взвешенным методом наименьших квадратов в условиях нашегопримера мы специфицируем веса как.

Протокол оценивания имеет следующийвид:

DependentVariable: Y

Method: LeastSquares

Date:Time:

Sample:1а27

Includedobservations: 27

Weighting series: 1/X

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

3.803296

4.569745

0.832277

0.4131

X

0.120990

0.008999

13.44540

0.0000

Weighted Statistics

R-squared

0.026960

Mean dependentvar

74.04946

Adjusted R-squared

–0.011961

S. D. dependentvar

13.08103

S. E. of regression

13.15902

Akaike infocriterion

8.063280

Sum squared resid

4328.998

Schwarzcriterion

8.159268

Log likelihood

-106.8543

F-statistic

180.7789

Durbin-Watson stat

2.272111

Prob (F-statistic)

0.000000

Unweighted Statistics

R-squared

0.758034

Mean dependentvar

94.44444

Adjusted R-squared

0.748355

S. D. dependentvar

45.00712

S. E. of regression

22.57746

Sum squaredresid

12743.54

Durbin-Watson stat

2.444541

В этом протоколе приводятся значения двухвидов статистик:

  • Weighted Statistics (взвешенные статистики) — этостатистики, основанные на остатках, получаемых по взвешенным данным, т. е. наостатках в преобразованной модели.
  • Unweighted Statistics (невзвешенные статистики) — этостатистики, основанные на лостатках т. е. на отклонениях наблюдаемыхзначений объясняемой переменной от значений, предсказываемых линейноймоделью связи, в качестве параметров которой берутся их оценки полученныев преобразованноймодели.

Отметим весьма низкое (0.2696) значение коэффициентадетерминации в преобразованной модели. Однако это обстоятельство не должно насволновать — линейнаясвязь в преобразованной модели значима, о чем говорит весьма высокое значение -статистики, равное180.7789, и соответствующееему -значение 0.0000 (см.Weighted Statistics).Вконечном счете нас интересует значение, находящееся в части протокола,соответствующей невзвешенным статистикам, а это значение достаточно велико (0.7580).

Отметим еще, что приведенные в началетаблицы значения оценок параметров, их стандартных ошибок и -статистик, а также-значения соответствуют величинам, полученным на стадии оценивания преобразованной модели.

Заметим, наконец, что значение, указанноев числе невзвешенныхстатистик, отличается от значения, полученного нами при оценивании исходной(непреобразованной) модели наблюдений. Причина этого, разумеется, в том, чтопри вычислении значения использовались остатки

где — оценки наименьших квадратовпараметров исходной модели, полученные безиспользования взвешивания отклонений.

Мы уже отмечали выше, что результатомнеоднородности дисперсий случайных ошибок в модели наблюдений являетсясмещение оценокдисперсий случайных величин. В то же время, наличие такого нарушения стандартных предположенийоставляет оценкинесмещенными. В связи сэтим, один из методов коррекции статистических выводов при неоднородностидисперсий ошибок состоит в использовании обычных оценок наименьших квадратов(OLS-оценок, Ordinary Least Squaresestimates) коэффициентов вместе соскорректированными на гетероскедастичностьоценками стандартных ошибок. Один из вариантовполучения скорректированных на гетероскедастичность значений былпредложен Уайтом (White) иреализован в ряде пакетов статистического анализа данных, в том числе и впакете EVIEWS. При этом удовлетворительные свойства оценки Уайта гарантируютсятолько при большомколичестве наблюдений. Мы не будем приводить здесь детали получения оценкиУайта, а просто воспользуемся пакетом EVIEWS для анализа данных из только чторассмотренного примера.

Пример. Используем данные из предыдущего примера, но применим для иханализа последнюю процедуру. Согласно этой процедуре, мы оцениваем коэффициенты и обычным методом наименьших квадратов,так что в качестве оценок берутся значения и. В качестве же оценокстандартных ошибоки вместо значений и, полученных выше при оценивании модели обычнымметодом наименьших квадратов, берем значения оценок Уайта и.

Бросающееся в глаза значительное различиеоценок для параметра при применении двух рассмотренных методов ( и ) вдействительности не столь уж удивительно, поскольку оценки стандартной ошибкидля, полученные каждым из двух методов довольно высоки (и,соответственно).

Избавиться от неоднородности дисперсийошибок в ряде случаев позволяет переход к логарифмамобъясняемой переменной.

Пример. Поданным, использованным в двух предыдущих примерах, оценим модельнаблюдений

График зависимости стандартизованныхостатков, полученных при оценивании этой модели, от предсказанныхзначений (левый график)

Pages:     | 1 |   ...   | 15 | 16 | 17 | 18 | 19 |   ...   | 20 |    Книги по разным темам