Применение некоторых аналитических методов в анализе и прогнозах макроэкономических временных рядов

Вид материалаДокументы

Содержание


Прогнозирование временного ряда с помощью дискретного вейвлет преобразования (технология SDWT)
Реализация модели ARIMA
Statgraphics Plus
Метод стохастической оптимизации
NS используя инварианту Римана, рассмотреть прямоугольный треугольник KNM
Подобный материал:
УДК 519.21

519.23

ПРИМЕНЕНИЕ НЕКОТОРЫХ АНАЛИТИЧЕСКИХ МЕТОДОВ В АНАЛИЗЕ И ПРОГНОЗАХ МАКРОЭКОНОМИЧЕСКИХ ВРЕМЕННЫХ РЯДОВ

А.Л. Арутюнов

Институт проблем управления им. В.А. Трапезникова РАН, г. Москва, РФ

arsenrea@mail.ru


Введение

Отраслевые сектора национальной экономики можно рассматривать как сложные динамические системы, информация о динамике которых известны частично или не известны. Основная информация о таких экономических системах содержится в одномерных временных рядах экономических показателей с некоторым временным интервалом или шагом дискретизации (в данной статье будут рассмотрены статистические показатели экономической деятельности АПК России с временным интервалом равным году) которые в дальнейшем будем называть просто временными рядами (ВР).

Для количественного прогноза экономических показателей необходимо, в том или ином виде, сформировать модель динамической системы. В простейшем случае – по ее одномерной реализации. В терминах нелинейной динамики задача формирования математической модели известна как задача реконструкции динамической системы. Проблема реконструкции динамических систем относится к классу обратных задач, а такие задачи, как правило, не имеют однозначного решения.

Поэтому проблема прогнозирования ВР также не имеет однозначного решения. Это означает, что при известных ошибках измерения исходных показателей, определить однозначно ошибку прогноза невозможно. При стохастическом подходе данные проблемы остаются, но только формулируются в других терминах. А достоверность или надежность прогноза связана с тремя факторами: адекватностью модели системы текущим экономическим реалиям, точностью определения характерных параметров модели и принципиальными неопределенностями, возникающими в ходе формирования прогноза.

Иногда ошибку прогноза можно оценить, если изначально задать максимальный интервал погрешностей измерения исходных уровней ВР. Тогда характерные параметры модели расположены в некотором интервале значений и отсюда можно вычислить ошибку прогноза. Однако для коротких нестационарных рядов такой подход становится достаточно проблематичным по многим причинам.

Сделать прогноз более точным – означает учесть большее количество факторов, влияющих на заданный показатель, т.е. чем большее число факторов учитываем, тем точнее будет прогноз. Но некоторые исследования Нобелевского лауреата Клива Гранжера показали, что даже простые модели могут демонстрировать очень сложную динамику (детерминированный хаос в одномерных отображениях), прогноз которой из-за конечной точности измерения начальных данных и параметров модели не возможен.

Для важных экономических показателей эффективным способом их анализа и прогноза представляется формирование нескольких типов прогнозов (в использовании нескольких метод прогноза), основанных на разных моделях динамики показателей. В случае прогноза экономических показателей методы моделирования должны корректироваться в

соответствии с существенно меняющейся экономической картиной.

Например, некоторые методы, развитые для моделирования и прогноза квазистационарной экономической динамики становятся мало пригодными при анализе существенно нестационарных процессов. Причем усложнение моделей не гарантирует повышение точности прогнозов. Поэтому возникает вопрос: как моделировать и прогнозировать нестационарное поведение одномерных ВР?

А также, к примеру в простых полиномиальных моделях возникает противоречие между точностью учета нелинейной динамики и устойчивостью прогноза. Чем точнее приближаются изменения показателя на интервале аппроксимации, тем сильнее погрешности измерения исходных данных влияют на экстраполяционные, прогнозные значения показателя. Действительно, если используются аппроксимационные полиномы первой или второй степени, то ошибки в исходных данных не могут изменить число экстремумов полинома. Тогда как для кубического полинома число экстремумов может меняться от нуля до двух. Появление новых особенностей ведет к неустойчивости прогноза. Однако в ряде важных случаев это противоречие можно обойти с помощью специального представления исходного временного ряда.

Реальная процедура разложения исходного ряда на составляющие основана на выделении циклических компонент ряда со всеми возможными для заданной длины ряда периодами. Основное отличие циклических компонент от периодических состоит в том, что они не инвариантны к временным сдвигам. Отсюда, циклическая компонента с заданным некоторым периодом допускает изменение своей формы от периода к периоду и поэтому возможен ее компонентный прогноз в будущее. Для периодической компоненты возможен только тривиальный прогноз – трансляция стационарных циклов на прогнозный период.

После выделения всех циклических компонент из исходного ряда, остается «нециклическая» компонента, которую можно рассматривать как эволюционную динамику модели. В случае бесконечных периодических рядов, для которых возможно их

корректное представление в виде ряда Фурье, эволюционной компоненте соответствует постоянная.

Помимо аналогий между предлагаемым представлением исходного ряда и вейвлет – преобразованиями, существуют значительные отличия. Циклические компоненты выделяются на основе вариационных (оптимизационных) принципов и для каждого ряда имеют свою, уникальную форму. В общем случае они не ортогональны. Поэтому представление исходного ряда в виде циклических и эволюционной компонент более экономно с точки зрения численных процедур. Такой подход имеет тесную связь с алгоритмами сжатия графической информации на основе вейвлет-преобразования.

Допущение о возможности изменения формы отдельных циклов от периода к периоду позволяет выделить линейную или квадратичную часть их динамики и на ее основе построить экстраполяцию отдельной циклической компоненты. В сумме экстраполированные части циклических компонент прогнозируют нестационарную и нелинейную динамику исходных показателей. Причем по степени отклонения изменений циклов от линейного закона можно оценить ошибку экстраполяции.

Целью настоящей работы является изложение нескольких различных способ, в том числе и аналитических подходов к анализу и прогнозированию макроэкономических временных рядов с помощью дискретного вейвлет преобразования (для стационарных временных рядов) при использовании модели авторегрессии, а также методов стохастической оптимизации (момента “марковской остановки”) с определением оптимальных “моментов остановки”. И получения при помощи изложенных методов комбинированных значений прогнозных оценок финансово-экономической деятельности сельскохозяйственных организаций (СХО) в структуре АПК России до 2030 года.

Схему прогноза показателя можно представить следующем образом:
  • исходный ряд сезонно корректируется и выделяется тренд;
  • определяется спектр мощности циклов со всеми периодами, которые могут иметь место при заданной длине ряда, и выделяются «значимые» циклические компоненты (по локальным экстремумам);
  • исходный ряд «очищается» от «значимых» циклических компонент и выделяется эволюционная компонента;
  • осуществляется линейная экстраполяция всех выделенных компонент и они суммируются.


Прогнозирование временного ряда с помощью дискретного вейвлет преобразования (технология SDWT)


Согласно эконометрическим методам, прогнозирование макро и – микроэкономических временных рядов разделяют на две группы. К первой группе относятся методы, основанные на авторегрессионной модели временных рядов, а ко второй – на экспоненциальном сглаживании. Обе группы методов имеют ограниченную применимость, которая становится критической при существенно нестационарной экономике [1]. Основным и главным фактором при анализе макроэкономических временных рядов является природа генезиса наблюдений, образующих временной ряд, т.е. речь идет о структуре и классификации основных факторов, под воздействием которых формируются значения элементов временного ряда. Обычно выделяют 4 типа таких факторов [2]:
  • Долговременные, формирующие общую тенденцию в изменении анализируемого признака. Данную функцию называют функцией тренда.
  • Сезонные, формирующие периодически повторяющиеся в определенные промежутки времени колебания анализируемого признака.
  • Циклические (конъюнктурные), формирующие изменения анализируемого признака, обусловленные действием долговременных циклов.
  • Случайные (нерегулярные), не поддающиеся учету и регистрации. Их воздействие на формирование значений временного ряда обуславливает стохастическую природу элементов.

В эконометрике, принято считать, что при прогнозировании экономических временных рядов, данный ряд следует представить в виде суммы составляющих – тренда, сезонных колебаний и “белого” шума [3]. Главный фактор любого экономического процесса – её эволюция во времени. Тем самым, частота сезонных колебаний также зависит от времени. Поэтому, применение стандартных приемов из «гауссовской статистики» - метод наименьших квадратов, модели ARIMA или АРСС (т.е. авторегрессионные модели со скользящими средними в остатках) [4] и т.п. при прогнозировании временных рядов, часто не дают искомых адекватных результатов из-за постоянно растущей ошибки прогноза при увеличении либо генеральной совокупности (N) либо периода прогноза. Таким образом, перед тем как применять стандартные методы прогнозирования, необходима обработка значения исходного временного ряда для того, чтобы «фиксировать» возникающие периодические изменения со временем характеристик составляющего ряда. Поэтому, в данной работе предлагается использовать метод - (SDWT) stationary discrete wavelet transform (стационарного дискретного вейвлет преобразования для стационарных временных рядов) [5]. При помощи технологии SDWT временной ряд разделяется на компоненты (кластеры), каждый из которых содержит информацию об определенных составляющих временного ряда и изменении характеристик этих составляющих. Далее, по каждой компоненте делается прогноз (в принципе, на этом этапе применяются и стандартные методы прогнозов, но только, чтобы выбранный метод был подходящим для данной решаемой задачи). Затем, подсчитывается обратная “задача” SDWT и таким образом, получается прогноз будущих значений исходного временного ряда.

Рассмотрим некоторые свойства и основное определение SDWT – технологии.

Пусть и - масштабный и вейвлет фильтры (в физических науках эти фильтры делятся на низкие и высокочастотные). При действии С фильтра на последовательность , то получается последовательность с элементами . Если x – конечная последовательность, то её необходимо продолжить периодически. Пусть Ω - оператор, который добавляет в последовательность нули, т.е. для всех целых n и . Далее определим фильтры и

. Пусть - временной ряд с расстоянием между отсчетами равным , т.е. частота дискретизации составит (в физике данная частота выражена в Гц). Далее фиксируем некое целое и положим . Для определим векторы коэффициентов и . Векторы и имеют ту же длину, что и вектор y. Квадрат вейвлет коэффициента характеризует сколько энергии временного ряда приходится на отрезок частот (частоты выражены в Гц) в момент времени , а квадрат масштабного коэффициента характеризует, сколько энергии временного ряда приходится на отрезок частот в момент времени . Временной ряд y можно воссоздать по векторам коэффициентов при помощи обратного SDWT. Как раз векторы являются теми компонентами, которые могут быть использованы для построения прогноза. Допустим, что во временном ряду присутствует гармоника S с частотой , зависящей от времени, причем при следует, что , а при . В этом случае, информация о гармонике S при будет содержаться в коэффициентах , а при - в коэффициентах . Далее используем модель ARIMA.


Реализация модели ARIMA


Пакет модулей прикладной программы Statgraphics Рlus* для операционных систем Windows и Unix является многопла-
новым инструментом проведения разнообразных процедур оценки и про-
гнозирования статистической информации, включая временные ряды. Statgraphics Plus позволяет- легко осуществлять необходимые процедуры обработки данных в различных модулях типа: Simple Regression
(простая регрессия), Polynomial Regression (полинимиальная регрессия)
Multiple Regression
(множественная регрессия) и т.д. Для получения долгосрочных прогнозных оценок воспользуемся функцией -Forecasting (прогнозирование).

При прогнозировании воспользуемся моделью ARIMA (Auto regression Integrated Moving Avarage) являющейся наиболее сложной моделью адаптивного типа, позволяющей учесть как трендовую компоненту, так и сезонные факторы. Модель имеет 4 основных и 2 дополнительных параметра. К основным параметрам относят: AR(i) – несезонный авторегрессионный параметр i – го порядка;

MA(i) – несезонный параметр скользящего среднего значения i-го порядка

SAR(i) – сезонный авторегрессионный параметр i-го порядка;

SMA(i) – параметр сезонного скользящего среднего i-го порядка.

Дополнительные параметры связаны с предварительным разностным дифференцированием ряда. Это порядки несезонного и сезонного дифференцирования.


______________

*Примечание: программный продукт Statgraphics Рlus применялся автором для получения расчетных данных по моделям, примененных для получения долгосрочных прогнозных оценок показателей развития АПК РФ и упоминание программы в данной статье не является рекламой


Процесс авторегрессии (AR) n-го порядка



Процесс скользящего среднего (МА) n-го порядка



Где и - коэффициенты процессов AR и МА. Для прогнозирования шумового тренда (“белого шума”) целесообразно применить модель ARIMA.

А процесс прогнозирования временного ряда состоит из нескольких этапов:

1. Подсчитываем SDWT ряда у для целого Далее ряд делится на отдельные отрезки:

2. Векторы коэффициентов и при содержат информацию о тренде низкочастотных колебаниях временного ряда. Прогнозируем данный ряд с помощью модели Тейла-Вейджа (усложненная модель Хольта [6], учитывающая сезонность и аддитивный тренд и в отличии от модели Хольта-Уинтерса (здесь учитываются мультипликативный тренд и сезонность) аддитивно включает линейный тренд, что позволительно при решении некоторых задач.) [7, 8].

3. Векторы коэффициентов при содержат информацию о сезонных колебаниях временного ряда, поэтому прогнозируем ряды с помощью тригонометрической регрессии.

4. Векторы коэффициентов при содержат информацию о шумавой составляющей временного ряда, поэтому прогнозируем данный ряд коэффициентов с помощью модели ARIMA (в программной среде Statgraphics Рlus ).

5. Собираем вместе все векторы коэффициентов . Подсчитываем обратное SDWT , а полученный временной ряд и является искомым прогнозным значением.

Данный прием, по получению прогнозных оценок, наиболее эффективен (согласно закону больших чисел (теорема Чебышева) [9]) при большой выборке


Метод стохастической оптимизации


Суть данного метода заключается в оптимизации выбора рационального момента “момента марковской остановки” [10] для принятия того или иного управляющего воздействия. Данный метод позволяет выбрать наиболее рациональную прогнозную оценку среди прочих.

последовательно наблюдаемый непрерывный процесс,

θ – (непредсказуемое) положение максимума .





Рис.1. Непрерывный случайный процесс


Наша задача состоит в нахождении максимального значения процесса X (или рационального / оптимального “момента остановки”).

Требуется, последовательно наблюдая процесс X, найти среди моментов со значениями в [0;1] (моменты остановки, или марковские моменты события [] или [] зависят лишь от "прошлых периодов" {}, но не зависят от будущих периодов) такой момент что или т.е.

или

Требуется найти таким образом, чтобы он был ближе к максимальному значению.

В случае когда X=B - стандартное броуновское движение,



где - корень уравнения

с и [11]. Уравнение имеет аналитическое и численное решение. Вкладом автора в развитии данной методики является нахождение графического решения данного уравнения при помощи геометрических методов построения, используя теоремы и аксиомы о сумм углов треугольника, взаимное расположение точки и прямой треугольника, взаимное расположение прямых, содержащих высоты треугольника, вычисления площадей вырожденного треугольника с одной, двумя или тремя несобственными вершинами в евклидовой геометрии и геометрии Лобачевского.



Рис.2. Методика графического решения

Для решения уравнения достаточно вычислить длину ломанной (дуги) NS используя инварианту Римана, рассмотреть прямоугольный треугольник KNM и вычислить KM. При этом W – некий винеровский процесс на временном интервале [0;T]. Искомая точка M, момент остановки на интервале [0;T].

Литература
  1. Губанов В.А. Оценка и прогноз конъюнктурных циклов в трендах экономических временных рядов // Научные труды Института народнохозяйственного прогнозирования РАН. М.: МаксПресс 2006. С. 173
  2. Айвазян С.А. Основы эконометрики. Т.2. М.: ЮНИТИ, 2001
  3. Дженкинс Г., Ваттс Д. Спектральный анализ и его приложения. М.: Мир, 1971
  4. Айвазян С.А. Основы эконометрики. Т.1. М.: ЮНИТИ, 2001
  5. Nason G.P., Silverman B.W. The stationary wavelet transform and some statistical applications. N.Y.: Springer, 1995. P.281-299
  6. Лукашин Ю.П. Адаптивные методы краткосрочного прогнозирования временных рядов. М.: Финансы и Статистика, 2003
  7. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогнозирование и управление. М.: Мир, 1974
  8. Theil H., Wage S. Some observations on adaptive forecasting // Management Science. – 1964. Vol. 10
  9. Ширяев А.Н. Вероятность. М.: МГУ 1979. С. 57
  10. Ширяев А.Н. О мартингальных методах в задачах о пересечении границ броуновским движением. Выпуск 8. М.: МИАН, 2007
  11. Арутюнов А.Л. Прогнозирование экономических показателей с помощью броуновского движения // Сборник XXI Международных Плехановских чтений. М.: РЭА, 2008. С. 116