Решаем систему уравнений И Уравнение yt =-0,59 + 0,7xt + 0,32t может исполь80 = a 10 + b 100 + c зоваться для разработки прогнозов. Вначале следует опре- 820 = a 100 + b 1012 + c делить ожидаемое значение переменной xt на предстоя 492 = a 55 + b 580 + c щий период, например, при помощи временного тренда, и получаем параметры a = -0,6;b = 0,7;c = 0,32. Уравнеуравнения авторегрессии или экспертных оценок.
ние регрессии совпадает с уравнением, найденным по втоПредположим, t = 11, тогда xt=11 =7,7+0,411=12,1, рому методу при расчете отклонений t и. Сравнение t yt=11 = -0,59 + 0,7 12,1+ 0,32 11 = 11,4.
рассмотренных процедур расчета параметров парных уравМетод Фриша-Воу. Метод основан на непосредстнений регрессии для целей прогноза приводит к выводу, времени t в виде линейного венном включении фактора что при прочих равных условиях менее трудоемким являИ члена в уравнение регрессии yt = f (xt,t). Так же, как в ется последний способ.
предыдущем методе, включение времени наряду с другими Несмотря на совпадение параметров во втором и независимыми переменными позволяет выделить регрес- третьем способах, характеристики тесноты связи и ошибок сию на неучтенные в явном виде факторы, связанные со коэффициентов регрессии во всех трех случаях будут развременем. Показано (7, с.90), что параметры модели можно личаться.
109 4.7. Многофакторные модели прогнозирования Х определение числа наблюдений, необходимых для получения несмещенных оценок.
Сложный характер социально-экономических проОдним из важнейших требований является отбор цессов ставит задачу отбора наиболее существенных факнаиболее существенных факторов. Также необходим траторов, оказывающих влияние на вариацию исследуемых диционный экономический анализ, в ходе которого глубже характеристик. Таких факторов достаточно много ввиду и полнее выявляется существо, направленность и теснота усложнения и неоднозначности экономической динамики.
связи между факторами. Последовательное введение всех Тренды и уравнения парной регрессии имеют ограниченконкурирующих факторов в уравнение регрессии следует ные возможности.
осуществлять с точки зрения минимизации остаточной В регрессионном анализе, проводимом в пространдисперсии.
стве, при наличии достаточного числа наблюдений, в соВ процессе отбора факторных признаков особое ответствии с предпосылками, применяются многофакторвнимание следует уделять выявлению и устранению мульные модели, или уравнения множественной регрессии.
тиколлинеарности - тесной корреляционной связи между Они позволяют детально исследовать взаимозавидвумя (коллинеарности) и большим числом факторных симость признаков, их соподчиненность и силу корреляпризнаков.
ционного взаимодействия. Эта тема достаточно глубоко Если в модель включаются две или несколько свярассматривается в курсе многомерного статистического занных между собой независимых переменных, то сисанализа и в то же время она является темой факторного тема нормальных уравнений не имеет однозначного решеанализа пространственно-временной информации.
ния, наряду с уравнением регрессии существуют и другие Множественная корреляция исследует статистичелинейные соотношения.
скую зависимость результативного признака от нескольких Последствия мультиколлинеарности:
факторных признаков. В общем виде уравнение регрессии - слабая обусловленность матрицы системы норимеет вид:
мальных уравнений;
yt = f (x1t, x2t,..., xpt ) + t, (4.31) - неопределенное множество коэффициентов регрессии аj;
где t =1,2,...n - количество наблюдений, р - количество - сильная корреляция стандартных ошибок парапараметров, - возмущающая переменная.
t метров и возрастание остаточных дисперсий;
Для линейной зависимости - чувствительность коэффициентов регрессии к p выборке.
yt = xjt + t,t =1,2,..., n.
aj Разрешение проблемы мультиколлинеарности можj=но разбить на несколько этапов:
Выбор уравнения множественной регрессии вклю1. Установление самого факта существования чает следующие этапы:
мультиколлинеарности.
Х отбор факторов-аргументов;
2. Измерение степени мультиколлинеарности.
Х выбор уравнения связи;
3. Определение области мультиколлинеарности на множестве независимых переменных.
111 4. Установление причин мультиколлинеарности. 2) построение нескольких статических моделей 5. Определение мер по устранению мультиколли- (для каждого года предпрогнозного периода), параметры неарности. которых определяются в виде функций времени, после чего Существует несколько методов выявления мульти- рассчитываются наиболее вероятные значения признаков в коллинеарности, основанных на следующих процедурах : перспективе.
а) анализ парных коэффициентов корреляции между Расчет параметров уравнений по отклонениям.
независимыми переменными rx x ; Осуществляется отбор факторных признаков x1, x2,...xp, i j оказывающих влияние на y.Исходные данные представлеб) анализ множественных коэффициентов корреляны временными рядами ции каждой из независимых переменных со всеми остальными ; x1t, x2 y,..., xpt; yt.
в) сравнение парных коэффициентов корреляции Определяются тенденции изменения временных между независимыми переменными с парными коэффицирядов, т.е. тренды ентами между зависимой и независимыми переменными И И yt = f (t); xit = fi (t);i = 1,2,...n.
rx x,ryx ;
i j i Рассчитываются отклонения выравненных значений переменных от исходных величин г)сравнение множественненных коэффициентов корреляции между независимыми переменными с коэффи- = yt - f (t);it = xit - fi (t).
t циентом множественной корреляции между зависимой пеВыявляется наличие мультиколлинеарности, для череменной со всеми остальными.
го вычисляются коэффициенты парной корреляции. УстаНаряду с линейными моделями используются нелинавливаются периоды запаздывания (временные лаги) во нейные зависимости, например, степенная зависмость взаимодействии признаков. Анализ временных рядов с лаa1 a2 p И yt = a0x1t x2t xa, которую путем простейших преобрагом рассмотрен в предыдущем параграфе.
pt После корректировки состава независимых перезований можно привести к линейному виду:
менных приступают к оцениванию параметров уравнения ln yt = ln a0 + a1 ln x1t + a2 ln x2t +...+ ap ln xpt.
множественной линейной регрессии Анализ временных рядов с учетом предпосылок = 11t +22t +...+. (4.32 ) t p pt регрессионного анализа позволяет определить общую наПри наличии временного лага L по переменной хi в правленность в процессе прогнозирования изменения веуравнение вместо it вводится it -L.
ичины исследуемого показателя. Для исключения атокорреляции при необходимости используются расссмотренные Коэффициенты i рекомендуется определять по мевыше процедуры для случая парной зависимости. Могут тоду наименьших квадратов, используя так называемые использоваться две вычислительные схемы прогнозировастандартизованные i коэффициенты. Необходимость исния на основе уравнений множественной регрессии:
пользования коэффициентов в стандартизованном виде 1) анализ отклонений абсолютных уровней от объясняется тем, что в уравнении (4.32) каждое отклонетрендов;
ние является абсолютной величиной, такой же, как и ис113 ходные временные ряды зависимой и независимых пере- Система нормальных уравнений, используемых при расчеменных. Числовые значения отклонений представлены в тах, имеет вид:
соответствующих единицах измерения.
Данное обстоятельство не позволяет оценивать r 1t = 1r 1t + 2r 2t +...+ r p t 1t 1t 1t pt сравнительную силу воздействия каждого аргумента на заr = 1r + 2r +...+ r, (4.33) висимую переменную путем сопоставления коэффициен- 2t 2t1t 2t2t p t 2t pt........................................................
тов регрессии 1,2,...,.
p Переход к стандартизованным коэффициентам за- r = 1r 1t + 2r 2t +...+ pr t pt 1t pt pt pt ключается в замене отклонений,it новыми переменныt ми, исходя из соотношений 2 2 2 r it = it / ;r = / ;r = t t it it jt it jt t it jt it jt T = / ;Ti = it /, t t it. Система уравнений, линейных относительно i, может откуда = T ;it = Ti. Подставив последние выражеt t it быть решена любым способом. Естественно, оценка парания в уравнение (4.32) и поделив левую и правую части на метров и проверка надежности найденных уравнений рег, получим:
рессии осуществляются при использовании Microsoft Excel t и множества статистических пакетов обработки данных, Tp 1T1 2Tp pt 1t 2t T = + +...+.
таких как SPSS, Statistica, Minitab и других. В данном слу t t t чае важен содержательный алгоритм расчетов. Например, Переменные Т в последнем уравнении являются теi при использовании формул Крамера i =, где i - опреперь относительными безразмерными величинами. Замена i / на i приводит уравнение к стандартизованному it t делитель, получаемый из главного определителя путем виду замены i-го столбца столбцом из свободных членов.
После решения системы и определения i T = 1T1 + 2T2 +...+ Tp, p i в котором i - стандартизованные коэффициенты регресt коэффициентов находятся коэффициенты i =, осусии. Они показывают, на сколько среднеквадратических it отклонений изменится зависимая переменная, если велиществляется переход от относительных величин к абсочина i-го независимого фактора увеличится или уменьшитлютным и уравнению ся на одно свое среднеквадратическое отклонение при усp ловии постоянства всех остальных факторов-аргументов.
yt = xjt + t,t =1,2,..., n.
aj j=Так как i -коэффициенты являются относительныДля оценки параметров уравнения временные ряды ми величинами, то с их помощью можно сделать вывод о должны быть не менее 15-20 лет, а прогнозный период в 2степени влияния каждого фактора на функцию.
3 раза короче. Прогнозные значения xjt можно оценить на Численные значения коэффициентов определяются на основе значений коэффициентов парной корреляции. основе экстраполяции, методом экспоненциального сгла115 живания, на основе трендов или уравнений авторегрессии, Для оценки статистической надежности множестметодом экспертных оценок. При необходимости в модели венных моделей могут применяться различные показатели, должны найти отражение периоды запаздывания. особое место среди них занимают t-критерий Стьюдента и Характеристика тесноты связи. Для определения F-критерий Фишера.
тесноты связи рассчитывается коэффициент множествен- Для проверки существенности коэффициентов регной корреляции R, 0 R 1. R не присваивается знак, т.к. рессии определяется расчетное значение t-критерия факторы находятся в разной парной (прямой и обратной) tpаас = R n - p -1 /(1- R2), зависимости с результативной переменной.
которое сопоставляется с табличным значением tтабл.. ВеДля уравнений регрессии в стандартизованном личина tтабл находится с учетом числа степеней свободы масштабе при линейной зависимости R имеет вид:
k=n-p-1, где n - количество наблюдений, p - количество R = 1r 1t + 2r 2t +...+ r. (4.34) p факторов и доверительной вероятности P. Если tpасч > tтабл., t t t pt Для определения степени влияния вариации факто это свидетельствует о том, что корреляционная связь торных признаков на вариацию зависимого признака рассуществует между признаками уt и x1t, x2t,..., xpt не только считывается коэффициент множественной детерминав выборочной, но и в генеральной совокупности.
ции D = R2, частные коэффициенты детерминации Значимость коэффициентов чистой регрессии устаdi = ir it ; = R2.
di навливается следующим образом. Определяется расчетная t величина t-критерия для каждого iЦго коэффициента, котоДля случаев нелинейной зависимости коэффициент рая сравнивается с табличной.
множественной корреляции рассчитывается как результат tрасчi = ait /, где сопоставления двух дисперсий: остаточной и общей ait ост.
общ a = - yt )2 /(n - p -1) Aii, ( yt И it И где Аii - диагональный элемент матрицы, обратной по от(у - у)2 / n. (4.35) 2 R = 1- / = 1ост общ ношению к матрице системы нормальных уравнений. Если (y - y)2 / n tрасч > tтабл, то значение iЦго коэффициента пропорциоПроверка статистической надежности уравненальности в выборочном уравнении регрессии незначиния множественной регрессии. В регрессионном анализе тельно отличается от коэффициента регрессии, которое при использовании в качестве первичной информации выможно было бы построить по материалам всей совокупноборочных данных результаты расчетов в значительной сти. В противном случае надежность iЦго коэффициента степени зависят от способности выборочного уравнения следует считать недостаточной, а соответствующий факрегрессии отображать закономерности, существующие в торный признак xit рекомендуется исключить из числа пегенеральной совокупности. Важное значение при этом имеет правильный выбор типа аналитической функции, ременных в уравнении регрессии.
качество подбора параметров множественного уравнения, степень разброса исходных данных относительно линии регрессии.
117 ) a1t a2t pt При необходимости по известным tтабл, можно либо yt = a0tx1t x2t...xa.
ait pt рассчитать доверительную зону для выборочного коэффиПоскольку значения переменных x1t, х2t,..., xpt не осциента:
таются постоянными во времени, а закономерно изменяютaв(н) = ait tтабл. (4.36) it ait ся, то множество моделей необходимо дополнить аналитиДля оценки надежности уравнения регрессии в цеческими зависимостями, отражающими тенденции варьилом рекомендуется использовать F-критерий Фишера.
рования показателей аргументов хit и коэффициентов регфакт И ( yt - yt )2 /( p -1). (4.37) рессии аit. С этой целью коэффициенты пропорциональноFрасч = = ост И (y - yt )2 /(n - p) сти объединяют во временные ряды, после чего устанавt ливают закономерности изменения их во времени. В обЕсли Fрасч > Fтабл для k1=р-1 и k2=n-p и доверительщем случае уравнения регрессии имеют вид:
ной вероятности P, то уравнение множественной регреса И аit = f (t),i = 1,2,..., p.
i сии следует признать статистически значимым. В противАналогично определяется тенденция варьирования ном случае гипотеза об адекватности уравнения отбрасыдля каждого показателя аргумента в отдельности:
вается.
Также для обобщенной оценки уравнения множест- И хit = fi x(е),i = 1,2,..., p.
венной регрессии определяется средняя ошибка аппроксиС помощью этих моделей могут быть найдены знамации:
T T чения переменных x1t, х2t,..., хT, а также коэффициенты pt n T T И ( yt - yt / yt ) а1t,а2t...,aT. Для прогнозирования величины исследуемого pt t= = 100%. (4.38) признака могут использоваться регрессии вида n T T T И yt = a0t + a1t x1t +...aT xT. (4.39 ) Допустимой ошибкой является ошибка, не превыpt pt шающая 15%.
Pages: | 1 | ... | 10 | 11 | 12 | 13 | 14 | ... | 21 | Книги по разным темам