Universitatea liberă internaţională din moldova факультет экономических знаний Слесаренко Ольга, мастерат тема: Прогнозирование (Лабораторная работа)

Вид материалаЛабораторная работа

Содержание


1. Виды временных рядов
1.1. Временные интервалы пересмотра и уточнения прогноза.
1.2. Методы прогнозирования .
2. Исходные данные
2.2. Исключение выбросов
2.3. Преобразование исходных данных
2.4. Помехи, остатки и ошибки
2.5. Условие стационарности процесса
3.1. Полиномиальное представление временных рядов
3.2. Сезонные модели
3.3. Анализ временных рядов.
З.4 Вероятностные модели
4. Система сглаживающих весовых множителей
4.1. Одинаковые весовые множители
4.2. Оптимальные весовые множители
4.3. Весовые множители с экспоненциальным затуханием
4.4. Байесовские прогнозы
5. Ошибки прогноза
5.1. Вид распределения вероятностей
5.2. Дисперсия ошибок прогноза
...
Полное содержание
Подобный материал:
  1   2   3

UNIVERSITATEA LIBERĂ INTERNAŢIONALĂ DIN MOLDOVA


Факультет экономических знаний


Слесаренко Ольга, мастерат


тема: Прогнозирование

(Лабораторная работа)


Научный руководитель,

профессор: С.Максимилиан


Кишинёв, 2011


Часть I

ПРИМЕНЕНИЕ МЕТОДОВ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ К ОРГАНИЗАЦИОННО ЭКОНОМИЧЕСКИМ СИСТЕМАМ.




Прогнозирование


ВВЕДЕНИЕ


В данной главе дается краткий обзор методов многократного уточнения значений некоторого параметра системы, который используется в качестве выходной переменной модели. В отличие от случая, когда оценка основана только на имеющихся данных и потому проводится лишь один раз, ниже рассматриваются различные случаи оценок, пересматриваемых по мере поступления новой информации, с тем чтобы получать новые значения выходной переменной системы и корректировать выбор варианта решения. Пересмотр и уточнение оценок (прогнозов) могут проводиться либо через одинаковые интервалы времени (например, через неделю или месяц), либо через разные интервалы времени (например, в аналоговых системах, применяемых для контроля за пожароопасными объектами, используются специальные методы последовательной проверки наличия или отсутствия опасности).


1. ВИДЫ ВРЕМЕННЫХ РЯДОВ

Можно выделить два вида прогнозируемых характеристик системы, зависящих от времени: переменные состояния и переменные интенсивности. Переменная состояния определяется периодически и ее значение в течение небольшого интервала времени не зависит от времени, прошедшего с момента начала наблюдения. Переменная интенсивности также определяется периодически, но ее значение пропорционально времени, прошедшему с момента предыдущего наблюдения. Такие характеристики системы, как температура, скорость, число подписчиков на журнал или цена, являются примерами переменных состояния. В качестве примера переменной интенсивности можно привести количество выпавших осадков, количество проданных экземпляров или спрос. Если переменная состояния характеризует количество, то переменная интенсивности – скорость его изменения.

Процессы прогнозирования переменных состояния и интенсивности отличаются друг от друга следующими особенностями:

— если измерения характеристик системы проводятся через разные интервалы времени, то величину интервала необходимо учитывать при оценке переменных интенсивности, в то время как при оценке переменных состояния эта величина не имеет значения;

— так как прогнозы обычно осуществляются для нескольких последовательных интервалов времени в пределах некоторого времени упреждения, по истечении которого становятся важными результаты реализации принятых решений, то правильный прогноз переменной состояния должен определять ее значение в конце времени упреждения, а прогноз переменной интенсивности должен представлять собой сумму прогнозов на протяжении времени упреждения;

— функция распределения во времени вероятностей ошибок прогноза для переменной состояния должна соответствовать функции распределения вероятностей ошибок в исходных данных, тогда как для переменной интенсивности закон распределения вероятностей ошибок прогноза во времени стремится к нормальному при любом законе распределения вероятностей ошибок в исходных данных, поскольку эти ошибки представляют собой сумму ошибок прогноза в отдельные интервалы времени.


1.1. Временные интервалы пересмотра и уточнения прогноза.

Величина промежутков времени между измерениями входных переменных системы с целью проверки и уточнения ранее сделанных прогнозов о выходных переменных зависит главным образом от длительности времени упреждения и наибольшей частоты циклических изменений в системе, которые должна отражать модель. Поэтому временные интервалы пересмотров прогнозов могут изменяться в широких пределах и измеряются, например, как часами, так и годами. Однако эти интервалы должны быть достаточно велики, чтобы обеспечивалась вероятность осуществления ожидаемых изменений системы.

В течение времени упреждения прогноз чаще всего проверяется один-два раза, но иногда возникает необходимость увеличить количество проверок до десяти. Так, прогнозируемые сроки возобновления лесозаготовок на участке леса с периодом восстановления 80 лет могут уточняться один раз в десятилетие, а изменение потребления электроэнергии в данной местности в зависимости от погодных условий можно наблюдать каждый час.

Когда имеют место какие-то периодические процессы, как, например, при месячных изменениях температуры или изменениях объема корреспонденции, получаемой почтовым отделением в течение недели, частота наблюдений должна быть по крайней мере вдвое больше частоты изучаемого процесса. Очевидно, что наблюдения с интервалами в один месяц не будут способствовать правильной организации работы почты по понедельникам в отличие от ее работы по средам, а наблюдения с интервалами в сутки не дадут возможности обнаружить различие в интенсивностях работы первой и второй смен.

Если случайная ошибка при определении входных переменных велика по сравнению с измеряемой величиной, интервал уточнения прогноза для переменной интенсивности целесообразно увеличить, усредняя таким образом случайную ошибку. Однако для переменной состояния в аналогичном случае интервал уточнения прогноза лучше уменьшить, что позволяет для выделения полезного сигнала использовать соответствующие методы фильтрации.

1.2. Методы прогнозирования .

Методы прогнозирования могут быть разделены на три большие группы: статистические (описательные), причинно-следственные и комбинированные. Для изучения исследуемого процесса следует задать закон изменения входных переменных X во времени. Выходные переменные системы могут быть описаны с помощью некоторой модели, значения коэффициентов которой определяются подбором. При этом различные наблюдения учитываются с различными весовыми множителями. По таким моделям, включающим описание предыстории системы, прогноз можно составить путем расчета состояния системы для некоторого будущего момента времени.

В разд. 1—5 настоящей главы рассматриваются различные вопросы, связанные с процессом прогнозирования: исходные данные, модели, методы сглаживания и ошибки прогноза. В разд. 6 показано, что если требуется точный прогноз, то дисперсии ошибок прогноза не всегда являются единственным или даже основным критерием выбора того или иного способа статистического описания временных рядов.

Если удается построить модель окружающей среды, позволяющую выявить причины изменений в системе (вторая группа методов), то прогноз, полученный с помощью такой модели, объясняет будущее системы. Подобные методы охватывают широкий круг моделей от формальных моделей экономики, объясняющих, например, почему большое количество товаров покупается при распродаже, до очень субъективных моделей типа вербальной модели рынка, обсуждаемой в разд. 7. Статистический прогноз в лучшем случае позволяет делать вероятностные утверждения о возможных появлениях и моментах появления экстремумов в рассматриваемой временной зависимости переменных системы, а также о значениях переменных в экстремальных точках. Существуют, однако, некоторые очень мощные средства обнаружения экстремумов сразу после того, как они появились. С другой стороны, прогнозы на основе анализа причинно-следственных связей предназначены главным образом как раз для предсказания моментов появления экстремумов и значений переменных в экстремальных точках. Пример такого прогноза представляют кривые жизненного цикла любой продукции. Спрос на любую продукцию имеет фазы начального роста, наивысшего уровня и спада. Во время последней фазы продукция исчезает с рынка. Хотя подобные модели точно описывают историю спроса на продукцию, тем не менее они не дают достаточно твердой основы для предсказания перехода из одной фазы спроса в другую.

Прогнозирование научно-технического прогресса становится все более необходимым и полезным в целях предвидения основных факторов, оказывающих воздействие на окружающую среду. Однако прогнозирование в области экономики не привело пока к созданию эффективного прогноза, который позволил бы предсказать мировой дефицит какой-то продукции, обусловленный противоречиями между возможностями окружающей среды и требованиями экономики.

Если установлен сводный план выпуска определенной продукции, то его можно представить в виде простой суммы отдельных планов, определяющих, например, число и сроки подачи заявок на оборудование, запасные части и сырье. Однако между прогнозируемыми данными и некоторыми основными показателями может существовать и причинная связь. Например, колебание числа заявлений, подаваемых в разные годы в приемные комиссии колледжей, непосредственно связано с изменениями рождаемости, имевшей место соответственно 17 лет назад. В приведенном примере ясно видна причинная взаимосвязь двух показателей, и поэтому упреждающий показатель может быть использован для составления прогноза при правильно выбранном времени упреждения.

Между двумя любыми автокоррелированными временными рядами всегда существует статистическая корреляция. Следовательно, существует серьезная опасность бессмысленного использования множественной регрессии в поисках «хорошего» коэффициента корреляции между прогнозируемыми (выходными) переменными и различными потенциально информативными входными переменными. Известная предыстория представляет собой только элемент полного временного ряда, и, если искать достаточно долго, связь между переменными будет найдена. Однако, если с увеличением объема информации коэффициенты модели становятся равными нулю, то модель не пригодна для принятия правильного решения, так как именно в критический момент основные показатели перестали быть таковыми.

В последующих разделах данной главы основное внимание уделяется статистическим методам прогнозирования, которые используются при уточнении принятых решений, распространяющихся на относительно короткие промежутки времени (обычно эти промежутки в десять раз больше интервалов между уточнениями предсказаний). Исследование операций включает методы отыскания подходящих моделей и методы уточнения прогнозов по новым наблюдениям. Следует отметить, что наилучшие результаты получаются при использовании комбинации статистических и причинно-следственных методов прогнозирования, что иллюстрируется на примере исследования состояния рынка.


2. ИСХОДНЫЕ ДАННЫЕ


2.1. Выборочные наблюдения


Исходные данные обычно представляют собой результаты выборочных наблюдений либо переменной интенсивности, такой как спрос на продукцию, либо переменной состояния, такой как цена. Решения, которые должны приниматься в данный момент времени, скажутся в дальнейшем по прошествии некоторого промежутка времени — времени упреждения. Величина этого промежутка времени может быть прогнозируемой переменной.

2.2. Исключение выбросов


Результаты наблюдений регистрируются с большим количеством ошибок, которые возникают как при наблюдениях, так и при регистрации данных. Кроме того, изучаемый процесс может иметь стохастическую природу. Результаты наблюдений могут содержать и аномальные эффекты, например необычайно высокий спрос на продукцию во время забастовок или чрезмерно высокую температуру в помещении в случае перегрева термостата. Поэтому не каждую совокупность зарегистрированных по мере поступлении реальных данных следует считать подходящим временным рядом, на основании которого можно составлять прогноз. Перед тем: как подобрать коэффициенты модели но исходным данным, из последних должны быть исключены выбросы, т. е. результаты наблюдений, которые не характеризуют прогнозируемый процесс. Простой и надежный способ такого исключения выбросов может быть проиллюстрирован при помощи рис. 1. Так как наибольший и наименьший результаты наблюдений могут представлять собой выбросы, эти два результата временно исключаются из имеющейся выборки данных.




Рис. 1. Схема, иллюстрирующая способ исключения выбросов на исходных данных.


Интервал между крайними оставшимися результатами наблюдений позволяет быстро оценить область нормального изменения исходных данных. Величина интервала между максимальными и следующими по величине (или минимальным и ближайшим к нему) значениями входной переменной может служить индикатором того, что экстремальные результаты являются представительными. Для отрезков временного ряда, содержащих от 20 до 100 наблюдений и превышающих 0,4 ряда, целесообразно проверять исходные данные более тщательно. Очевидно, этот простой тест не позволит исключить ни двух выбросов одного знака, если оба они достаточно велики, ни отклонений в данных, имеющих чисто гармоническую природу при значимом негармоническом периоде. Если разброс данных превышает, например, 4а, то требуется более тщательный отбор входных переменных, с тем чтобы после подбора коэффициентов получить статистическую модель, правильно описывающую исследуемый процесс.

2.3. Преобразование исходных данных

Экономические данные часто подчиняются экспоненциальным зависимостям, и в таких случаях при построении моделей процесса удобно пользоваться логарифмическим масштабом. Другим видом преобразований является разбиение исходного ряда данных на составные части. Например, полный спрос на какую-либо продукцию трудно прогнозировать с помощью одной общей модели. Поэтому соответствующий временной ряд целесообразно разбить на отдельные составные ряды, каждый из которых легко описать. Так, хотя решения о пополнении запаса принимаются на основе полного спроса, тем не менее прогнозировать новые заказы, прибыли от продажи, требования, налагаемые сводным планом, правительственные и экспортные заказы, спрос, порождаемый специальными фондами, и т. д. удобнее, используя отдельные компоненты ряда данных.

2.4. Помехи, остатки и ошибки

Для описания стохастических элементов временных рядов и их прогноза используются три различных понятия — помехи, остатки и ошибки. Понятие помехи связано с собственной изменчивостью процесса и неопределенностью, вносимой при наблюдении за ним. Следовательнo, помеха является составной частью используемых данных. Под остатками понимается разность между результатами наблюдений и соответствующими значениями, вычисленными с помощью прогнозирующей их модели. Таким образом, остатки связаны с прошлыми данными и моделью, которая использовалась для их оценок. Ошибки прогноза представляют собой разницу между прогнозом, сделанным в настоящее время, и тем, что будет наблюдаться позднее в момент времени, для которого составлен прогноз.

2.5. Условие стационарности процесса

Любой процесс, представленный рядом результатов наблюдений, можно по крайней мере схематически описать набором разностных уравнений (когда процесс дискретен) или дифференциальных уравнений (когда он непрерывен). Если в этих уравнениях коэффициенты не зависят от времени, процесс называется стационарным, если же зависят, то нестационарным. Эта зависимость может носить вероятностный или регулярный характер. Очевидно, что регулярное изменение коэффициентов во времени может быть описано дополнительными уравнениями. Для достаточно больших интервалов времени большинство протезируемых рядов является нестационарным. Однако их все же можно считать квазистационарными, если прогноз составлять для какого-то одного момента времени.


3. МОДЕЛИ

Пусть в момент времени Т задана последовательность результатов наблюдений Хt для некоторого множества моментов времени t, которые могут быть выражены в векторной форме (время т >0). В общем виде выражение для модели записывается как , где вектор представляет собой коэффициенты модели, получаемые по результатам наблюдений до момента Т включительно, а матрица F — набор аппроксимирующих функций. Строки матрицы соответствуют элементам модели, а столбцы — моментам времени. В большинстве практических приложений F определяет время относительно момента самого последнего наблюдения, а значения коэффициентов а зависят от выбора начала отсчета времени.

3.1. Полиномиальное представление временных рядов

Весьма общий класс моделей процесса составляют модели, которые могут быть представлены с помощью вещественных полиномов и т. д. Применение различных методов прогнозирования позволяет получить различные модели, например, за счет использования разностей или суммы функций Ft. Поскольку, однако, решенилинейного дифференциального уравнения может быть представлено в виде вещественного полинома, то различные математические описания моделей означают для нас лишь возможность выбора удобной формы анализа, а не фактическое различие в математических свойствах таких моделей.

Довольно часто для анализа локальных изменений в наблюдаемых данных достаточно использовать полином первой степени (прямую линию). Заметим, что константа, т. е. полином нулевой степени, является частным случаем полинома первой степени, в котором коэффициент при линейном члене равен нулю. Подгонка прямой линии для конкретного ряда прогнозируемых данных производится путем варьирования величины второго коэффициента, отражающего тенденцию изменения временного ряда за длительный период времени (вековой тренд). Если величина этого коэффициента мала, то его можно исключить из модели. Следует, однако, заметить, что величины коэффициентов, которые могут быть исключены из модели, в соответствии со статистическим критерием настолько малы, что их исключение не оказывает никакого влияния на краткосрочный прогноз. Затраты па осуществление статистического теста могут быть больше, чем затраты на использование такой малой величины в прогнозе, даже в случае, когда в ее использовании нет никакой необходимости. Если время упреждения более чем в 10 раз превышает величину интервала времени между уточнениями прогноза, исключение трендов из модели становится более важным. Математические методы позволяют представить прогнозирующую модель в виде полинома любого порядка . Однако, если нет необходимости в использовании полиномов более высокого порядка (как, например, при отслеживании траектории баллистической ракеты), применение полиномов второго и более высоких порядков для описания прогнозируемых рядов оказывается излишним.

3.2. Сезонные модели

Уровень воды в море изменяется дважды в сутки за счет приливов; температура в области высоких широт ежегодно меняется от высокой до низкой и обратно; потребление электроэнергии ежедневно изменяется по более сложным зависимостям (исключая большие праздники и годовой цикл); спрос на запасаемую продукцию может меняться по циклам, повторяющимся каждый торговый сезон. С точки зрения выработки правильного решения включение подобных периодических (сезонных) колебаний в общую модель может повысить эффективность прогноза и позволит предсказывать ожидаемые высокие и низкие значения прогнозируемых переменных.

Однако не все ряды, имеющие высокие и низкие значения переменных, обязательно цикличны в указанном смысле. Деловые или экономические «циклы» не повторяются с достаточной воспроизводимостью, позволяющей на практике, исходя из анализа прошлого, делать выводы о каких-то будущих подъемах и спадах.

Для описания сезонных моделей существуют два совершенно разных подхода, каждый из которых имеет множество вариантов.

Если дано N результатов наблюдений за какой-то период времени (например, N = 12 для годового цикла или N — 1 для недельного цикла), то можно записать N поправочных членов (положительных и отрицательных) или N коэффициентов (каждый из которых больше или меньше единицы), которые затем либо суммируются с результатами прогноза, либо умножаются на него. Значения этих поправочных коэффициентов можно определить по результатам наблюдений в соответствующие моменты времени в прошлых циклах. Например, в некоторых простейших методах такие значения, скажем для сентября месяца, определяются на основе данных для этого же месяца в прошлые годы. В более сложных методах осуществляются усреднение и учет результатов наблюдений, которые предшествовали данному.

При анализе розничной продажи товаров широкого потребления сезонные коэффициенты часто используются в качестве кумулятивных характеристик, которые представляют процентное выражение сделанного к настоящему времени по отношению к тому, что должно быть сделано в течение полного периода.

В любом из названных подходов весь ряд поправочных членов или коэффициентов может быть назван сезонным «сечением». Во многих случаях оказывается, что существует небольшое семейство сечений, и тогда прогнозы для отдельных временных рядов могут быть получены путем выбора наиболее подходящего представления этого семейства.

Сечения, бесспорно, играют важную роль в методике прогнозирования, так как их сущность легко объяснить, а эффективность их использования легко оценить на практике. Однако существенным недостатком применения сечений является связанная с ними нестабильность прогноза. Если случайная величина х имеет дисперсию o2, то дисперсия обратной величины (у = 1/х) порядка о4. В большинстве методов, использующих сезонные или циклические сечения, на некотором этапе вычислений проводится деление па случайную переменную (или ее оценку, имеющую отличную от нуля дисперсию). Если при этом знаменатель имеет тот же порядок величины, что и помеха, то относительно малые колебания исходных данных могут привести к большим изменениям прогноза. К сожалению, подобная нестабильность обычно проявляется как раз тогда, когда принимаемые решения могут иметь самые серьезные последствия (т. е. перед началом следующего цикла).

В работе для уменьшения подобной нестабильности используется предположение, согласно которому дисперсия помехи является функцией только среднего по всем наблюдениям за цикл и не зависит от сезонных изменений. При этом чувствительность метода к колебаниям данных в точках наивысших и наинизших значений прогнозируемых переменных соответственно повышается и понижается.

Пример. Рассмотрим выраженный в процентах прогноз производства товаров широкого потребления. В начале каждого торгового сезона необходимо определить полный объем выпуска товаров и знать положение дел, если не с большей частью имеющихся товаров, то хотя бы с сырьем. Допустим, что 10%-ный уровень сезонной продажи достигается в среднем за первые три недели торговли, в течение которых должен быть заключен окончательный договор на поставки дорогостоящего сырья. Если какой-нибудь оптовый покупатель, как правило, поздно заказывающий товары, в текущем году разместит свой заказ раньше обычного, то учет такого заказа при прогнозировании может привести к значительному завышению оценки общих потребностей в данном сезоне. Так фактически и случилось в США, когда впервые за несколько лет рождественская торговля началась раньше, чем обычно. Другой подход заключается в представлении циклических изменений прогнозируемой переменной рядами Фурье, т. е. . Здесь и — коэффициенты, полученные по исходным данным с помощью соответствующей регрессии, — основная частота, f — число наблюдений в одном сезонном цикле, t — время, за которое должен быть вычислен прогноз, к = 1, 2, . . ., N и суммирование ведется по всем частотам вплоть до частоты Найквиста (наивысшей частоты гармонического разложения дискретного ряда, которая определяется половиной интервала между наблюдениями).

Достоинство такой модели состоит в том, что она обеспечивает стабильность прогноза даже в точках цикла с наименьшими значениями прогнозируемой переменной, так как коэффициенты вычисляются путем усреднения всего набора имеющихся данных, а не только результатов наблюдений в пределах одного цикла. На практике, однако, подобная модель оказывается сложной для пользователя. Поэтому были разработаны пакеты программ для ЭВМ, с помощью которых редактирование входных и интерпретация выходных данных осуществляются таким образом, что большинство пользователей не испытывает необходимости в понимании существа методов обработки процесса.

Если для составления прогноза используются только первые члены разложения Фурье, то сезонное сечение представляет собой простую синусоиду с некоторой амплитудой и фазой, зависящими от коэффициентов с1 и s1. При увеличении числа членов разложения форма сечения может измениться. В соответствии с теоремой Фурье, если в дискретных рядах величина переменной повторяется через каждые f наблюдений, то такие ряды могут быть представлены точно f членами гармонического разложения.

Амплитуда j-й гармоники, включенной в модель, равна Аj= (квадрат амплитуды иногда называют мощностью данной гармоники). Пусть o2 — дисперсия остаточных разностей между исходными данными и результатами расчетов по модели, включающей гармоники вплоть до j-й. Тогда модель будет соответствовать предыстории, охватывающей от 3 до 6 предыдущих циклов, если удовлетворяется соотношение . Проверка на соответствие предыстории обычно проводится по критерию наименьших квадратов. Отметим, что при вычислении о2 необходимо учесть потерю степеней свободы некоторым числом переменных в модели. Это означает, что можно достичь минимальной дисперсии, используя модель с числом перемеипых, которое меньше f. Однако такая модель будет неверной, если мощность включенной в нее высшей гармоники не будет достаточно большой посравнению с остаточной дисперсией.