Южный федеральный университет, г.Ростов-на-Дону Sviatoslav.Zarutskiy@gmail.com Снижение роста цен ежегодно объявляется одной из главных, а сейчас даже первоочередной задачей правительства. В этом случае уровень инфляции традиционно выступает как показатель качества работы ЦБ, а его прогнозы выполняют важную роль в определении государственной монетарной политики. Кроме того, помимо использования при принятии государственных решений, прогнозы инфляции оказывают значительное влияние на рынок. Информация о будущих флуктуациях цен оптимизирует, например, ставку процента, а также другие условно-фиксированные элементы контрактов, заключаемых на перспективу. Безусловно, все это возможно лишь при наличии самого прогноза и при достаточном его качестве.
Соответственно, интерес представляет исследование возможности и точности прогноза инфляции в России.
В качестве исходных данных использовались официальные значения общих индексов потребительских цен Росстата с января 1991 г по июнь 2008 г. На основе первичного анализа описательных статистик и графика распределения, временной ряд был условно разделен на 3 кластера: начало девяностых годов, середина девяностых - кризис 1998 и после кризиса 98го. Первый период был практически сразу исключен из рассмотрения, как не отражающий современных закономерностей. Как и предполагалось, дестабилизированная экономическая ситуация во время становления новых экономических институтов приводила к хаотичной инфляции с довольно высоким средним и волатильностью, близкой к чистому случайному блужданию. Относительно двух других периодов было намерение объединить данные для увеличения количества наблюдений, лишь исключив значимые выбросы. Однако более тщательный анализ показал, что мы имеем на каждом из них различные распределения: заметно различаются эксцесс и дисперсия (проверка гипотезы о различие дисперсий дала положительный результат на уровне значимости менее 1%). Кроме того периоды показывают различный характер сезонной составляющей. На этом основании второй период также был отброшен и оставшиеся рассуждения справедливы для отрезка с октября 1998 по июнь года.
Коррелограмма ряда показывала поведение похожее на модель AR(1) - экспоненциальное убывание значений автокорреляционной функции (АКФ) и единственный сильный всплеск при единичном лаге у частной автокорреляционной функции. Кроме того наблюдались всплески АКФ на лагах равных 12 и 24. Поэтому предполагалось составить модель из элементов AR(1) (возможно AR(2)), AR (12), AR (24) или близких к ним, с соответствующими MA-частями, если они потребуется. В общей сложности было перебрано около 50ти моделей, включающих эти элементы в различных комбинациях.
В результате сравнение как по критерию Акаике, так и по критерию Шварца, привело нас к следующему уравнению:
ModelDS - SAR 12,24 x ARMA 1,24 :
1 - 1L 1 - 12L12 1 - 24L24 yt = (1 - 24L24)t Оценка коэффициентов осуществлялась на основе значений ряда до 12.2006 включительно.
Дополнительные эксперименты с моделью показали, что 1. Аналогичная регрессия на логарифмы ИП - дает почти идентичные результаты и оценки коэффициентов 2. Остатки модели не автокоррелированы и близки к белому шуму 3. Удаление члена AR(1) приводит к появлению слабой коррелированности остатков, но почти не ухудшает качество подгонки Учитывая, что мы уже оцениваем 4 коэффициента по 111 (после корректировки) значениям, добавление дополнительных регрессоров приведет к сверхподгонке модели и неадекватности оценок. Поэтому в случае необходимости добавления нового фактора, появляется возможность избавиться от AR(1) члена, заменив стохастический тренд межфакторной связью.
Качество прогноза проверялось посредством сравнения полугодового прогноза с последними значениями ряда. Средняя абсолютная ошибка (MAE) при этом составляла 0,5%, что при прогнозе на год даст ошибку до 6% ((100 + 0,5)12 - 100). Очевидно, что прогноз с ошибкой порядка среднего ряда можно назвать плохим прогнозом, и необходим другой подход к прогнозированию.
До этого мы строили регрессию на последовательность цепных индексов, представляющих темы роста, вида it = Pt/Pt-1 или на последовательность их логарифмов ln it = ln Pt - ln Pt-1. А значит, по сути оценивали ARIMA модель для последовательности lnPt, т.е.
огарифмов уровней цен, которые получаются перемножением темпов Pt = P1 t i. Однако при этом мы (как и другие =исследователи) не проверяли, относится ли ряд Pt к стационарным, а если нет - то какого он типа TS или DS, а сразу проводили его дифференцирование, т.е. метод стационаризации, оптимальный для DS ряда. При этом в случае неправильного выбора стационаризации, мы получаем рост дисперсии (в том числе и остаточной), возможность необратимости процесса и неточности оценки ARMA коэффициентов. [1] 5,000,Модель MAE MSE 4,000,DS 0,50 0,TS_1 0,46 0,3,000,TS_2 0,32 0,TS_1a 0,22 0,2,000,TS_2a 0,17 0,1,000,000 Точность прогноза по исследуемым моделям MAE - средняя абсолютная ошибка MSE - средняя квадратичная ошибка 99 00 01 02 03 04 05 06 Уровни цен 1998:10 - 2008:Более тщательное изучение этого вопроса показало, что хотя ряд и является нестационарным, применение к нему ADF теста дает отрицательный результат. Гипотеза о наличии единичного корня отвергается при уровне значимости превышающем 1%, а значит ряд относится к типу TS и его следует прогнозировать не с помощью дифференцирования ряда, а с помощью выделения тренда от времени.
Для получения спецификации модели нового типа опять было проведено сравнение набора моделей, похожего на предыдущий, с тем лишь исключением, что вместо AR(1) ставился тренд t. В результате, мы получили две модели, заслуживающие внимания:
ModelTS_1: yt = t + t, где t = 12t-12 + ut ModelTS_2: yt = t + t, где 1 - 12L12 1 - 24L24 t = (1 - 24L12)ut Первое уравнение демонстрирует регрессию на линейный тренд и сезонную компоненту. Здесь оценивается всего два коэффициента, а значит их оценки довольно стабильны. При этом MSE=0,46%, что уже несколько лучше, чем в DS модели. Второе уравнение представляет аналог рассмотренного нами ранее - снова оценивается 4 коэффициента - однако MSE=0,32%.
Годовой прогноз при проверке качества моделей делался на январь - декабря 2007 года. При проверке тех же моделей на имеющихся данных за 2008 год качество прогноза ухудшалось в 1,5-раза. Поэтому для новой группы данных был проведен повторный ADF-тест, который на этот раз указал на необходимость принятия гипотезы о наличия единичного корня при значимости 12% или меньше. Откуда такой результат, ведь мы добавили всего наблюдений Если посмотреть на график уровней цен, то видно, что он представляет собой кривую, очень хорошо аппроксимируемую прямой. Однако в 3м квартале 2007 года кривая меняет свой наклон на более резкий. Особенно хорошо это заметно при увеличении, ввиду небольшой длины отрезка с измененным наклоном относительно всего периода наблюдений. Именно в этот момент (в сентябре-начале октября 2007 года) произошло резкое повышение цен на ряд основных продуктов питания. Теперь уже невозможно адекватно описать тренд простой линейной моделью, но возможно кусочно-линейной с одним структурным изменением. Проблема заключается в том, что мы до сих пор не можем быть уверены относительно типа ряда. Возможность изменение наклона тренда делает результаты ADF теста, вообще говоря, ошибочными.
Базовый тест на наличие единичного корня для ряда со структурным скачком предложил Пьер Перрон [2,3]. В зависимости от типа скачка (в нашем случае, изменение наклона) следует оценить одну из трех моделей. При этом, проверка гипотезы эквивалентна проверке t-статистики на значимость коэффициента при AR(1) члене с той лишь разницей, что сама эта статистика имеет иное распределение. В нашем случае оценивалась модель вида:
k yt = c + t + dt + du + yt-1 + ciyt-i, i=1, t num(2007: 09) где du = 0, t < (2007: 09) и t - num(2007: 09), t num(2007: 09) dt = - фиктивные переменные 0, t < (2007: 09) Значение t-статистики для равняется -4,56, что меньше, чем 5%-ное значение из таблиц Перрона -4,24. А значит, полный ряд относится к типу TS и имеет детерминированный тренд со скачком.
Добавим переменную dt в уравнение моделей, применяемых нами выше. Получим:
ModelTS_1a: yt = t + dt + t, где t = 12t-12 + ut ModelTS_2a: yt = c + t + dt + t, где 1 - 12L12 1 24L24 t = (1 - 24L12)ut Теперь мы оцениваем модель по значениям до 2007:включительно. И делаем прогноз на 6 месяцев вперед - до 2008:06.
Результаты представлены в таблице.
Видно, что лучший прогноз дает последняя модель. Однако, оценивается слишком много коэффициентов и результат может быть очень неустойчив. При этом точность лишь незначительно больше, по сравнению с моделью 1a. Поэтому хотя рекомендуется использовать обе модели, первую стоит рассматривать в качестве основной.
Помимо точности, особый интерес представляет интервальные оценки прогноза. И здесь, конечно, требуется дополнительный анализ для определения типа распределения и его квантилей. Однако, для первичной оценки можно использовать известный по нормальному распределению принцип расчета ширины доверительного интервала, как 2-кратного значения стандартных ошибок. Тогда получим, что реальная инфляция за первую половину 2008 года составляла 8,7%.
Тогда как по модели 1а она должна лежать в интервале (8,2%; 9,3%).
Что уже можно считать адекватным прогнозом. Таким образом, хотя мы и не можем предсказать скачки, определяемые внешними факторами (в рамках чисто авторегрессионных моделей - возможно, учет связей с другими макроэкономическими переменными значительно улучшит свойства прогноза). Мы можем относительно эффективно предсказывать поведение инфляции при их отсутствии.
При этом стоит заметить, что это не очень сильное допущение, учитывая, что за 10 лет такой скачок произошел лишь однажды.
итература:
1. Канторович Г.Г. Анализ временных рядов - Экономический журнал ВШЭ №3 2. Pierre Perron УThe Great Crash, the Oil Price Shock, and the Unit Root HypothesisФ Econometrica, №57 (1989), стр. 1361-3. Pierre Perron УFurther evidence on breaking trend functions in macroeconomic variablesФ Journal of Econometrics, №80 (1997), стр. 355-4. Glynn J., Perera N., Verma R. УUnit Root Tests and Structural Breaks A Survey with ApplicationsФ Journal of Quantitative Methods for Economics and Business Administration №3 (2007) стр 63Ц79.
5. Moser G., Rumler F., Scharler J. УForecasting Austrian inflationФ Economic Modelling №24 (2007) стр. 470Ц6. Цыплаков А.А. Означает ли более низкая инфляция меньшую неопределенность Научные Доклады РПЭИ Книги по разным темам