Книги по разным темам Pages:     | 1 | 2 | 3 | 4 | 5 |

yt =y1 fТР (t) +y s(t) +y3c(t) + e(t),t =1, N (2.3.0), м где y =, подразумевая при этом, что единица учитывает участие j-го н j о фактора в формировании детерминированной составляющей временного yt, j =1,ряда,, а нулевое значение параметра отражает факт его отсутствия.

Окончательные выводы о том, участвуют или нет факторы данного типа в yt формировании значений, могут базироваться как на анализе содержательной сущности задачи, т.е. быть априорно экспертными по своей природе, так и на специальном статистическом анализе исследуемого временного ряда. Состав основных этапов общей процедуры прогноза на основе моделей временных рядов можно увидеть на рис.В связи с этим, исходя из приведенного выше аддитивного разложения yt временного ряда, можно сформулировать основные этапы построения генератора прогнозной информации с целью предсказания динамики ряда социально-экономических показателей следующим образом:

- определить, какие из детерминированных составляющих присутствуют в исследуемом временном ряду;

- определить оценки параметров моделей обнаруженных во временном ряду;

- для остатков, получившихся как результат разности фактических уровней ряда и значений, моделируемых детерминированной составляющей, выбрать модель, адекватно описывающую поведение этих остатков;

- получить прогноз на построенной модели временного ряда.

Каждый из этапов предполагает трудоемкие исследования статистических данных и проверки статистических гипотез, с целью выявления в них наличия или отсутствия тех или иных свойств и обоснования выбора окончательного типа модели, позволяющей эффективно решить задачи кратко- и среднесрочного прогноза значений временного ряда.

1. Выявление проблемы 2. Поиск и сбор данных 12. Сезонность или цикличность обнаружена 3.Качественная и количественная оценка временного ряда 13. Идентификация компонент сезонности и цикличности 4. Результат удовлетворяет 14.Информационная пригодность удовлетворительна 5. Тренд присутствует 15. Прогностическая 6. Построение модели способность временного ряда удовлетворительна 7. Информационная 16. Окончательный выбор пригодность модели остатков удовлетворительна 17. Тестирование остатков 8. Прогностическая 18. Построение окончательной способность формы прогностической модели удовлетворительна 19. Задание переменной управления 9. Окончательный выбор модели тренда 20. Построение точечного и интервального прогноза 10. Центрирование 11. Тестирование остатков ряда данных на сезонность и цикличность Рисунок 2. Состав основных этапов общей процедуры прогноза на основе моделей временных рядов.

2.3.2. Основы тестирования временных рядов Согласно общей методике анализа временных рядов исходным моментом в построении модели прогнозирования является определение возможности вычленения в структуре ряда его систематической составляющей и, прежде всего трендовой. В связи с этим исследователь должен определить:

a) присутствует ли во временном ряду долговременная тенденция;

b) если тенденция обнаруживается, какой характер она имеет;

c) какие дополнительные закономерности прослеживаются в динамических рядах.

Ответить сразу на все вопросы можно попытаться визуально, проанализировав графическое представление распределения изучаемого показателя во времени, например на экране дисплея компьютера. Этот способ, безусловно, привлекателен, однако также, безусловно, субъективен, так как напрямую зависит от масштаба представления информации на экране, а так же характера восприятия этой информации субъектом.

Другим вариантом является метод исчисления последовательных разностей в уровнях исследуемого ряда. Расчет ведется пока разности практически не сравняются. В этом случае порядок исчисляемых разностей принимается за степень аппроксимирующего полинома. Однако понятно, что основным недостатком названного подхода является возможность подбора кривой описываемой только лишь многочленами, что мало привлекательно для практических исследований. В некоторых случаях, при исследовании временного ряда на наличие долговременных тенденций, полезным может оказаться изучение не только абсолютного цепного прироста, но и абсолютных ускорений в ряду.

Однако наиболее распространенным в практике тестирования рядов на наличие тенденций является использование статистической проверки гипотез о неизменности тенденций по ряду. Если формулировать более строго следует проверить ряд на случайность распределения. Наиболее часто используемыми в этих целях являются: t-критерий, критерий Аббе, критерий серий, основанный на медиане выборки, критерий восходящих и нисходящих серий, смежный с последним метод Фостера-Стюарта и др [3, 31, 32, 49, 56, 70].

Проверка гипотезы о постоянстве средних значений ряда на основе tкритерия Стьюдента Процедура проверки гипотезы о постоянстве средних значений по двум выборкам ряда определяется предположением относительно дисперсии распределения. Пусть имеются две выборки: и.

x1i,i =1, n x2 j, j = 1,n Предполагаем, что они получены из одной и той же генеральной совокупности. Проверим гипотезу о равенстве средних по выборкам (иногда гипотеза формулируется, как равенства нулю разницы между средними). На практике для проверки гипотезы о двух средних нормальных генеральных совокупностей используется t-критерий Стьюдента. Однако математические выражения для вычисления t-критерия будут различны при различных гипотезах относительно имеющиеся данных о дисперсии по выборкам [3, 23, 31, 39, 40, 49 и др.].

Для общего описания проверочных и расчетных статистик введем следующие общие обозначения. Пусть m s xi xi, - математические ожидания и дисперсии величины х генеральных совокупностей соответственно i=1,2;

m - заданную постоянную величину;

siхi, - выборочные средние и дисперсии;

n - число степеней свободы;

ni - величина I-й выборки;

H0 - формулировка основной тестовой гипотезы;

H1 - формулировка альтернативной тестовой гипотезы;

Сформулируем несколько вариантов проверочных гипотез.

Вариант 1:

H0 : mx2 = m0, H1 : mx2 № mmxхi Пусть - оценка и полагаем n1=1. Вычисляем t-статистику:

x2 - mt = n2, sn = n2 -степень свободы.

Вариант 2:

2 H : m = m s = s и H1 : m № m 0 x1 x2, x1 x2 х1 хВычисляем t-статистику:

x2 - x1 t = Ч, где s 1/ n1 +1/ n2 (n1 -1)s1 + (n2 -1)ss =, n1 + n2 - n = n1 + n2 - степень свободы Вариант 3.

2 H : mx1 = m s № s и H1 : m № m 0 x2, x1 x2 х1 хВычисляем t-статистику:

x2 - xt =, 2 s1 / n1 + s2 / nстепень свободы 2 й щ (s1 / n1 + s2 / n2 )n = к(s2 / n1)2 /(n1 +1) + (s2 / n2 )2 /(n2 +1)ъ, где л 1 ы [x] - целая часть числа х, значение n округлено.

Вариант 4:

H0 : mx1 = mx2, никакого предположения о 2 H1 : m № m s n1 = n2.

, х1 хВычисляем t-статистику:

t = y n2 / sy, где y = x2 - x, n- x1i - y)е(x2i i=sy =, n2 -n = n2 -степень свободы.

В условиях справедливости гипотезы Н0 статистика критерия t подчинена t t1-a / 2 (n ) t-распределению Стьюдента с n степенями свободы. Если, то p гипотеза о равенстве средних двух нормальных генеральных совокупностей отвергается, в противном случае гипотеза принимается.

Из приведенных выше соображения ясно, что практически всегда для исследователя необходимы дополнительные исследования свойства однородности двух выборок. Для этого чаще всего рекомендуется применять Fкритерий Фишера или Кокрена.

Проверка однородности двух выборок на основе F-критерия Фишера Пусть в условиях рассматриваемых ранее двух выборок сформулированы нулевая и альтернативная гипотезы:

2 H0 :s1 = s 2 H1 : s1 № s Рассчитаем F-критерий (для больших и очень больших объемов выборок, n1,n2>100).

s2 - sFp = 2 s1 s+ 2n1 2nСтатистика F в условиях справедливости гипотезы Н0 подчинена нормальному распределению N(0,1).

Если F г F, то мы принимаем нулевую гипотезу, т.е. принимаем p кр гипотезу об однородности ряда.

Проверка однородности выборок на основе критерия Кокрена 2 2 Н0 : s1 =... = sк = s значения дисперсии неизвестны и 2 2 s1 №... № s № s Н1 :

к.

Критерий Кокрена применяется при одинаковых объемах выборок, т.е.:

n1=Еnk=n.

Статистика критерия Кокрена для проверки гипотезы Н0 при заданном уровне значимости имеет вид smax G = 2 s1 +...+ sk smax = max{si2} i Вычислим F1-a / k (n, (k -1)n ) Gз (k,n ) = k -1+ F1-a / k (n, (k -1)n ) n = n -.

Gp > G1-a / k (k,n ) Если вычисленное значение статистики Кокрена, то гипотеза о равенстве дисперсий отвергается.

Критерий квадратов последовательных разностей (критерий Аббе) Если есть основания полагать, что случайный разброс наблюдений х(1),х(2),..., х(n) относительно своих средних значений подчиняется нормальному закону распределения вероятностей, то для выяснения вопроса о возможном систематическом смещении среднего в ходе выборочного обследования целесообразнее воспользоваться критерием квадратов последовательных разностей.

Н0: Мx(t) = a = const, Н1: Мx(t) № const По имеющейся выборке хi, I=1Еn, оценим s двумя способами. Сначала рассмотрим несмещенную оценку:

n s2 = - x)е(xi n -i=d Во втором способе для оценки s примем величину, где n d = - xi )е(xi+n -i=n x = xi е n i=Для проверки гипотезы с помощью данного критерия подсчитываем величину d / (n) g = s(n) min (n) g г g Если окажется, что, то Н0 отвергается. При этом величина a min (n) g для n>60 подсчитывается по формуле a ua min (n) g = 1+, a n + 0.5(1+ ua ) ua где - a-квантиль нормированного нормального распределения.

min (n) g Величины при nг60 для трех наиболее употребительных значений a уровня значимости a приведены в таблице 3 [3].

Таблица 3.

a n 0,05 0,01 0,4 0,390 0,313 0,5 0,410 0,269 0,6 0,445 0,281 0,7 0,468 0,307 0,8 0,491 0,331 0,9 0,512 0,354 0,10 0,531 0,376 0,11 0,548 0,369 0,12 0,564 0,414 0,13 0,578 0,431 0,14 0,591 0,447 0,15 0,603 0,461 0,16 0,614 0,475 0,17 0,624 0,487 0,18 0,633 0,499 0,19 0,642 0,510 0,20 0,650 0,520 0,30 0,709 0,598 0,40 0,746 0,647 0,50 0,772 0,681 0, Критерий серий, основанный на медиане выборки х1,х2,..., хn Пусть имеется выборка из некоторой генеральной совокупности. Расположим элементы выборки в порядке возрастания, т.е. в так х(1),х(2),..., х(n) (так что, например, - это х(1) называемый вариационный ряд х1,х2,..., хn ; х(n) - наибольшее из наименьшее из всех выборочных значений всех выборочных данных).

n xmed (n) В качестве выборочного значения медианы берется средний (по расположению) элемент вариационного ряда, т.е.

м п2 (x n ) + x n ),если n четно ( ( +1) п (n) 2 xmed = н x,если n нечетно п n+( ) п о х1,х2,..., хn и будем вместо каждого Затем возвращаемся к исходной выборке n xi ставить плюс, если n xi < xmed (n) xi > xmed (n), и минус, если (члены n xmed (n) выборки, равные в полученной таким образом последовательности плюсов и минусов опускаются). Полученная нами последовательность плюсов и минусов характеризуется общим числом серий n (n) и протяженностью самой длинной серии t (n), где под серией понимается последовательность подряд идущих плюсов или подряд идущих минусов. Очевидно, что если наблюдения стохастически независимы, то чередование плюсов и минусов в последовательности должно быть более или менее случайным, т.е. эта последовательность не должна содержать слишком длинных серий подряд идущих плюсов или минусов. В данном критерии рассматривается {n (n);t (n)} одновременно пара критических статистик, причем распределение n (n) в предположении справедливости гипотезы стохастической независимости результатов наблюдения оказывается приблизительно нормальным со средним n + Mn (n) = и дисперсией Dn (n) (n -1).

t (n) Что касается, то оно изучено и затабулировано. Мы возьмем соотношение для определенной величины уровня значимости a = 0,05.

При данном уровне значимости получаем следующие неравенства:

t (n) < [3,3Ч log10 n +1] max n (n) > [ Ч (n +1-1,96 Ч n -1)] В случае если хотя бы одно из неравенств окажется нарушенным, то гипотеза о том, что исходные результаты наблюдения являются стохастически независимыми, отвергается.

Критерий восходящих и нисходящих серий Этот критерий лулавливает постепенное смещение среднего в исследуемом распределении не только монотонного, но и более общего характера, например, периодического и является одним из самых надежных признаков обнаружения тенденций скрытых в динамических рядах.

х1,х2,..., хn Пусть имеется выборка, отобразим ее свойства в символьном множестве из (n+1) элемента, где на i-ом месте ставится плюс, если xi+1 - xi > 0 xi+1 - xi <, и минус, если (если два или несколько следующих друг за другом наблюдений равны между собой, то принимается во внимание только одно из них). Очевидно, последовательность подряд идущих плюсов будет соответствовать тогда количественному возрастанию результатов наблюдения, а последовательность минусов - их убыванию. Если же рассматриваемая выборка окажется случайной, то в образованной таким образом последовательности знаков общее число серий однотипных символов не может быть слишком малым, а их протяженность - слишком большой.

При уровне значимости a = 0,05 расчетное количественное выражение 1 16n - n (n) > [ Ч (2n -1) -1,96 Ч )] этого правила имеет вид:, 3 t (n) < t (n), n (n) t (n) где под и понимается соответственно фактическое общее число серий и количество подряд идущих полюсов или минусов в самой длинной t (n) полученной серии, а величина табулируется и определяется на основе следующий таблицы.

t (n) n n<=26 26

2.3.3. Моделирование и прогноз временных рядов методами сглаживания Следующим шагом в исследовании свойств ряда динамики является обнаружение характера его тенденций с последующей пролонгацией таковой в будущее, если конечно тенденция существует. При решении такого рода задач исследователь может воспользоваться хорошо разработанным инструментарием сглаживания временных рядов, методы которого условно можно разделить на две группы:

- аналитические, при использовании которых заранее предполагается вид зависимости, описывающей тенденцию ряда, с последующей оценкой параметров модели сглаживания;

- алгоритмические, которые не предполагают априорных знаний сглаживающей кривой, ориентируясь лишь на алгоритм расчета сглаженных уровней ряда.

Pages:     | 1 | 2 | 3 | 4 | 5 |    Книги по разным темам