Теоретико-прикладные аспекты политического прогнозирования с использованием современных информационных технологий (на примере взаимоотношений между Россией и Украиной)
Дипломная работа - Политология
Другие дипломы по предмету Политология
реимущественно использовался линейный тренд.
Проверка гипотезы о наличии / отсутствии тренда.
После графической интерпретации данных с 2000 по 2009 гг. и построения линии тренда с помощью компьютерной программы Microsoft Excel необходимо проверить гипотезу о наличии либо отсутствии тренда. Один из способов проверки гипотезы - критерий серий, основанный на медиане выборки.
Рассмотрим применимость этой гипотезы на примере графика, отображающего показатели товарооборотами между Российской Федерацией и Украиной с 2000 по 2009 гг. (Таблица 1)
Таблица 1. Товарооборот между Россией и Украиной, млн.$.
200020012002200320042005200620072008200993419494950612957177012033921529295053981225012
Цифровой ряд в этом случае выглядит следующим образом:
93419494950612957177012033921529295053981225012
Критерий серий, основанный на медиане выборки, реализуется в виде следующей последовательности шагов:
) Из исходного числового ряда образуется ранжированный (вариационный) ряд y (t): y (1), y (2),…, y (n), где y (1) - наименьшее значение ряда y (t). Таким образом, цифровой ряд приобретает следующий вид:
93419494950612957177012033921529250122950539812
2) Определяется медиана этого вариационного ряда. Медиана (ее расчет осуществляется в программе Microsoft Excel 2007 автоматически (Вставка - Формулы - МЕДИАНА)) в анализируемом случае равна 19020.
) Образуется последовательность ?i из плюсов и минусов по следующему правилу:
1) +, если y (t) >Me, t=1, 2,…, n
?i= 2) -, если y (t) <Me, t=1, 2,…, n
-----+++++
4) Подсчитывается v(n) - число серий в совокупности ?i, где под серией понимается последовательность идущих подряд плюсов или минусов. Один плюс или один минус тоже будет считаться серией. Определяется t max(n) - протяженность самой длинной серии.
В данном случае всего 2 серии, протяженность самой длинной серии равна 5.
)Проверка гипотезы основывается на том, что при условии случайности ряда (при отсутствии систематической составляющей) протяженность самой длинной серии не должна быть слишком большой, а общее число серий - слишком маленьким. Поэтому для того, чтобы не была отвергнута гипотеза о случайности исходного ряда (об отсутствии систематической составляющей) должны выполняться следующие неравенства (для 5% уровня значимости):
t max(n) [0,5 (n+1-1,96 ?n-1)]
5<6,449
>2,5
Если хотя бы одно из неравенств нарушается, то гипотеза об отсутствии тренда отвергается. В данном случае нарушается второе неравенство, значит, с вероятностью 95% можно сделать вывод о наличии тренда в анализируемом массиве данных.
Использование простой скользящей средней.
В практике прогнозирования часто используется понятие скользящей средней. Распространенным приемом при выявлении тенденции развития является сглаживание временного ряда. Суть различных приемов сглаживания сводится к замене фактических уровней временного ряда расчетными уровнями, которые подвержены колебаниям в меньшей степени. Это способствует более четкому проявлению тенденции развития.
Скользящие средние позволяют сгладить как случайные, так и периодические колебания, выявить имеющуюся тенденцию в развитии процесса, и поэтому являются важным инструментом при фильтрации компонентов временного ряда.
Метод простой скользящей средней применим, если графическое изображение динамического ряда напоминает прямую. Когда тренд выравниваемого ряда имеет изгибы, и для исследователя желательно сохранить мелкие волны, применение простой скользящей средней нецелесообразно.
Алгоритм сглаживания по простой скользящей средней может быть представлен в виде следующей последовательности шагов:
. Сначала необходимо определить длину интервала сглаживания, включающего в себя определенное число последовательных уровней ряда. При этом надо иметь в виду, что чем шире интервал сглаживания, тем в большей степени взаимопогашаются колебания, и тенденция развития носит более плавный, сглаженный характер. Чем сильнее колебания, тем шире должен быть интервал сглаживания.
Таблица 11. Степень удовлетворенности населения Украины отношениями с Россией (%).
Степень удовлетворенности населения Украины отношениями с Россией (%).2000200120022003200420052006200720082009довольны54678072555772717169недовольны231291823209191719затруднились с ответом (безразлично)2321111022231911919
В данном случае анализируемый числовой ряд состоит всего из 10 значений:
200020012002200320042005200620072008200954678072555772717169
. Заменить фактические значения ряда, стоящие в центре каждого участка, на соответствующие средние значения. Процедура сглаживания приводит к полному устранению периодических колебаний во временном ряду, если длина интервала сглаживания берется равной или кратной циклу, периоду колебаний.
ГодДовольны (%)Средний прирост для g 3Сглаживание по 3Пошаговый алгоритм200054x= 2654(2000 г.+2001 г.+2002 г.)/3 - x200167y= -167(2000 г.+2001 г.+2002 г.)/320028073(2001 г.+2002 г.+2003 г.)/320037269(2002 г.+2003 г.+2004 г.)/320045561,33(2003 г.+2004 г.+2005 г.)/320055761,33(2004 г.+2005 г.+2006 г.)/320067266,67(2005 г.+2006 г.+2007 г.)/320077171,33(2006 г.+2007 г.+2008 г.)/320087170,33(2007 г.+2008 г.+2009 г.)/320096969,33(2007 г.+2008 г.+2009 г.)/3 + y
Скользящая средняя делает график плавным, временной ряд становится более однообразным, и тенденцию в таком случае выявить значительно проще.
Выше приведено описание применения простой скользящей средней (ПСС) по 3 параметрам, что связано с размером временного ряда. Нецелесообразно анализировать массив данных из 10 цифровых показателей по 5 или 7 параметрам. Та же ситуация наблюдается в случае с гипотетическим применением взвешенной скользящей средней (ВСС).
Построение линей