При таком способе вычисления прогнозногозначения для учитывается тенденция сохранения знака остатков: если в последнемнаблюдении наблюдавшееся значение превышало значение предсказываемоелинейной моделью связи то и последующее значение прогнозируется с превышениемзначения предсказываемого этой линейной моделью связи при. Если же значение меньше, чем то тогда будущее значение прогнозируетсяменьшим значения
Пример. Продолжимрассмотрение предыдущего примера. В этом примере,. Наблюдавшимсязначениям можно сопоставить:
- наблюдавшиеся значения ;
- значения
получаемые по модели, построеннойбез учетаавтокоррелированности ошибок;
- значения
получаемые по модели, параметры которойскорректированы с учетом автокоррелированности ошибок;
- значения
отличающиеся от значений, указанных впредыдущем пункте, учетом значенияостатка в предшествующем наблюдении.
Ниже приведены графики значений,получаемых указанными тремя методами, и графики соответствующих им расхождений. Индексы 1, 2, 3ауказывают на один из трех способов получения значений, в томпорядке, в котором они были перечислены выше).
Сравним средние квадраты расхождений прииспользовании указанных трех методов вычисления значений. Эти средние квадратыравны, соответственно,
что говорит о большей гибкости прогноза,построенного по последнему (третьему) методу.
Рассмотрим еще одно важное следствиеавтокоррелированности ошибок в линейной модели
с Преобразование
приводит к модели наблюдений
на основании которой получаемсоотношение
Вспомним теперь о нашем предположении, что, и преобразуем последнее соотношение следующим образом:
или
Здесь, и. Второе слагаемое в правойчасти по-существу поддерживает долговременную линейную связь(тенденцию)
Если в момент отклонениеот положительно, товторое слагаемое будет отрицательным, действуя в сторону уменьшения приращения. Если жеотклонение от отрицательно, то второе слагаемое будет положительным, действуя в сторонуувеличения приращения.
Указанная модель коррекции приращенийпеременной использует листинные значения параметров. Поскольку этизначения нам не известны, мы в состоянии построить только аппроксимацию такой модели,использующую оценкипараметров. При этом естественно воспользоваться оценкой и уточненнымиоценками, полученными на базе преобразованной модели.
В рассмотренном примере аппроксимирующаямодель коррекции приращений принимает вид
3.6. КОРРЕКЦИЯ СТАТИСТИЧЕСКИХ ВЫВОДОВ ПРИНАЛИЧИИ СЕЗОННОСТИ. ФИКТИВНЫЕ ПЕРЕМЕННЫЕ
Приведенный ниже график показывает динамикуизменения совокупного располагаемого дохода DPIи объемов продаж SALES лыжного инвентаря в США(квартальные данные; DPI — вмлрд долларов, SALES — в млндолларов, в ценах 1972аг.).
Оценивание линейной модели связи указанныхпеременных дает следующие результаты.
DependentVariable: SALES | ||||
Method: LeastSquares | ||||
Sample:1964:1а1973:4 | ||||
Included observations: 40 | ||||
Variable | Coefficient | Std. Error | t-Statistic | Prob. |
C | 29.97613 | 6.463626 | 4.637665 | 0.0000 |
DPI | 0.108402 | 0.036799 | 2.945768 | 0.0055 |
R-squared | 0.185904 | Mean dependentvar | 48.94571 | |
Adjusted R-squared | 0.164481 | S. D. dependentvar | 3.852032 | |
S. E. of regression | 3.521017 | Akaike infocriterion | 5.404084 | |
Sum squared resid | 471.1074 | Schwarzcriterion | 5.488528 | |
Log likelihood | –106.0817 | F-statistic | 8.677546 | |
Durbin-Watson stat | 1.874403 | Prob (F-statistic) | 0.005475 |
Коэффициент при переменнойстатистически значим. Однако график стандартизованных остатков (приведенный дляудобства в двух формах)
обнаруживает явную неадекватностьпостроенной модели имеющимся наблюдениям. Однако характер этой неадекватноститаков, что он не улавливается критерием Дарбина-Уотсона: значениестатистики Дарбина-Уотсона близко к. И это не удивительно: за положительнымиостатками с равным успехом следуют как положительные, так и отрицательныеостатки, что соответствует практическому отсутствию корреляции между соседнимиошибками и подтверждается диаграммой рассеяния
(Здесь — переменная, образованнаяостатками от подобранной модели линейной связи, а — переменная, образованнаязапаздывающими на один квартал значениями переменной.)
В то же время, налицо отрицательнаякоррелированность остатков для наблюдений, отстоящих на два квартала, иположительная — длянаблюдений, отстоящих на четыре квартала:
В отличие от критерия Дарбина-Уотсона,критерий Бройша-Годфри замечает такую коррелированность: допускаякоррелированность ошибок для наблюдений, разделенных двумя кварталами, получаем, что ведет к безусловному отклонению гипотезы о независимостиошибок.
Обратим теперь внимание на весьмаспецифическое поведение остатков. Все остатки, соответствуюшие первому ичетвертому кварталам, положительны, а все (за исключением двух) остатки, соответствующие второму итретьему кварталам, отрицательны. Такое положение, конечно, просто отражает тот факт, что спрос назимний спортивный инвентарь возрастает в осенне-зимний период и снижается ввесенне-летний период года, т. е. имеет сезонныйхарактер.
Построенная нами модель не учитывает фактор сезонности спроса ипотому оказывается неадекватной. Вследствие этого, такая модель не может, вчастности, использоваться для прогнозирования объема спроса в зависимости отвеличины совокупного располагаемого дохода.
Для коррекции моделей связи в подобныхситуациях часто привлекают искусственно построенные переменные — фиктивные переменные (лdummy variables). В нашем случае вкачестве такой дополнительной переменной можно взять, например, переменную,значение которой равно для первого и четвертого кварталов и равнодля второго и третьего кварталов. Добавление такой переменной в качествеобъясняющей позволяет учесть сезонные колебания спроса. Оценивание расширенноймодели дает следующие результаты.
Dependent Variable: SALES | ||||
Variable | Coefficient | Std. Error | t-Statistic | Prob. |
C | 26.21787 | 3.152042 | 8.317742 | 0.0000 |
DPI | 0.112653 | 0.017847 | 6.312227 | 0.0000 |
DUMMY | 6.028524 | 0.539997 | 11.16399 | 0.0000 |
R-squared | 0.813644 | Mean dependentvar | 48.94571 | |
Adjusted R-squared | 0.803571 | S. D. dependentvar | 3.852032 | |
S. E. of regression | 1.707233 | Akaike infocriterion | 3.979663 | |
Sum squared resid | 107.8419 | Schwarzcriterion | 4.106329 | |
Log likelihood | -76.59327 | F-statistic | 80.77244 | |
Durbin-Watson stat | 1.452616 | Prob(F-statistic) | 0.000000 | |
Оцененное значение коэффициента припеременной фактически означает, что спрос на лыжный инвентарь в течениепервого и четвертого кварталов возрастает по сравнению со спросом в течениевторого и четвертого кварталов в среднем примерно на млн долларов (в ценах 1972аг.).Следующий график иллюстрирует качество подобранной расширенноймодели.
На сей раз значение для статистики критерияБройша-Годфри равно против прежнего значения, так что этот критерийтеперь не отвергаетгипотезу независимости случайных ошибок.
По-существу, мы подобрали две различныемодели линейной связи между и :
модель
для весенне-летнего периода;
модель
для осенне-зимнего периода.
При этом, предельная склонность к закупкелыжного инвентаря в обеих моделях остается одинаковой и оценивается величиной.
Замечание. Вместоподбора отдельных моделей для осенне-зимнего и весенне-летнего периодов можнобыло бы заняться подбором отдельных моделей для каждого из четырех кварталовгода. С этой целью в качестве дополнительных объясняющих переменных можновзять, например, переменные, принимающие значение, соответственно, вчетвертом, первом и втором кварталах, и равные нулю в остальных кварталах. Приоценивании такой расширенной модели для наших данных оказывается незначимымкоэффициент при, что означает близость в среднем уровней продаж во втором и втретьем кварталах. Более того, оказываются близкими оценки коэффициентов припеременных и. Гипотеза о совпадении двух последних коэффициентов неотвергается, и в итоге мы возвращаемся к модели с одной фиктивной переменной,которую мы уже оценили ранее.
Использование фиктивных переменных полезнопри анализе агрегированных (объединенных)данных, полученных при объединении наблюдений,относящихся к различным полам (мужчины и женщины), к различным возрастным,языковым и социальным группам, к различным периодам времени. В таких ситуацияхмодели, построенные по отдельным группам, могут существенно различаться, итогда модель, построенная по объединенным данным, не учитывает этого различия.Привлечение фиктивных переменных позволяет оценить значимость такого различия ипо результатам этой оценки остановиться на модели с агрегированными данными илина модели, в которой учитывается различие параметров связи для различных групп(периодов времени).
В качестве примера, попробуем построитьмодель связи между переменными и, которые в 15анаблюдениях имели следующие значения:
X | Z | X | Z | X | Z |
1 | 1.257 | 6 | 0.865 | 11 | 1.804 |
2 | 1.812 | 7 | 1.930 | 12 | 1.956 |
3 | 3.641 | 8 | 2.944 | 13 | 3.134 |
4 Pages: | 1 | ... | 17 | 18 | 19 | 20 | Книги по разным темам |