Эконометрический анализ среднедушевых денежных доходов населения Республики Башкортостан

Курсовой проект - Менеджмент

Другие курсовые по предмету Менеджмент

затели выработки продукции на одного работающего и численность работающих одновременно в модель включать нельзя, так как в основе расчета показателей лежит один и тот же показатель - численность работающих на предприятии.

факторные признаки по экономическому смыслу дублируют друг друга.

Устранение мультиколлинеарности может реализовываться через исключение из корреляционной модели одного или нескольких линейно-связанных факторных признаков или преобразование исходных факторных признаков в новые, укрупненные факторы.

Вопрос о том, какой из факторов следует отбросить, решается на основании качественного, логического анализа изучаемого явления, а также на основе анализа тесноты связи между результативным (у) с каждым из сильно коллинеарно связанных факторных признаков. Из дальнейшего анализа целесообразно исключить тот факторный признак, связь которого с результативным наименьшая.

Качество уравнения регрессии зависит от степени достоверности и надежности исходных данных и объема совокупности. Исследователь должен стремиться к увеличению числа наблюдений, так как большой объем наблюдений является одной из предпосылок построения адекватных статистических моделей.

корреляционный регрессионный среднедушевой доход

 

ГЛАВА 3. КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ среднедушевых денежных доходов населения в Республики башкортостан

 

Проведение многомерных статистических исследований, в частности регрессионного анализа, невозможно без массовых наблюдений. В этой связи в результате обработки была использована федеральная служба государственной статистики за 11 лет сформирован массив, исходный для анализа информации (табл. 2).

 

Таблица 2

Исходная информация для проведения корреляционно-регрессионного анализа среднедушевые денежные доходы населения

годyХ1Х2Х3Х4Х5Х6200117361932,978333,11272124,217,5200224002836,81051,928,3174613417,9200331343717,91347,123,22264142,718,2200441534449,4161720,32916152,918,6200551575389,41860,417,53792165,518,92006689166122353,614,95038179,819,2200789098632,32633,814,546718189,219,620081107911027,13424,112,88959200,42020091425314084,14232,711,511827218,520,5201016134149515780,211,212771219,821,120111767716377,77114,91214173223,521,5

Наиболее простой формой зависимости и достаточно строго обоснованной для случая совместного нормального распределения является линейная, т.е. зависимость вида:

 

y=a0+a1 x1 +a2 x2 +…+ap xp (3.1)

 

Следует определить, все ли переменные нужно включать в уравнение или есть переменные, которые существенно не влияют на величину Y и их нецелесообразно включать в уравнение (3.1).

Для решения этого часто используется таблица, составленная из коэффициентов парной корреляции. Элементами такой таблицы являются коэффициенты парной корреляции для всех 6 факторов.

 

Таблица 3

Таблица коэффициентов парной корреляции

yХ1Х2Х3Х4Х5Х6y1Х10,998511Х20,97490,9660611Х3-0,84616-0,85449-0,769681Х40,9988860,9990340,970853-0,833751Х50,9730240,9764850,913102-0,938680,9688411Х60,990290,9885190,967642-0,899010,9843620,9835681

Рассмотрим таблицу парных коэффициентов корреляции. Для отбора значимых факторов в уравнение регрессии воспользуемся следующей формулой:

 

ryxi ? rxixj(3.2)

ryxj ? rxixj

 

Проведена проверка одновременного включения факторов в модель, исключаются факторы Х1, Х3, Х4, Х5, поскольку не выполняются неравенства системы (3.2).

Составим прогноз для каждого оставшегося фактора.

Х2- средний размер назначенных пенсий.

Выявление аномальных наблюдений.

Так как наличие аномальных наблюдений приводит к искажению результатов моделирования, то необходимо убедиться в отсутствии аномалий в данных. Для диагностики аномальных наблюдений разработаны различные критерии, выбор вида модели и оценка ее параметров, например метод Ирвина. Для всех или только подозреваемых в аномальности наблюдений вычисляется величина ?t.

 

Таблица 4

Диагностика аномальных наблюдений

tx2x2-xср(x2-xср)2?tналичие (отсутствие) аномалии1783-2144,154597398,71521051,9-1875,253516579,610,131984отсутствие аномалии31347,1-1580,052496572,3670,144893отсутствие аномалии41617-1310,151716504,9330,132475отсутствие аномалии51860,4-1066,751137965,260,119468отсутствие аномалии62353,6-573,555328964,81660,242077отсутствие аномалии72633,8-293,35586056,889340,137531отсутствие аномалии83424,1496,9455246954,78480,387903отсутствие аномалии94232,71305,5451704448,9340,396885отсутствие аномалии105780,22853,0458139868,3660,75956отсутствие аномалии117114,94187,74517537211,990,655111отсутствие аномалииСумма32198,741508526,67Ср.Знач.2927,155

tсреднее=6X2среднее=2927,155Sy=2037,364?кр=1,52

Если расчетная величина ?t превышает табличный уровень (для 11 наблюдений значение критерия Ирвина равно 1,52), то уровень х2(t) считается аномальным.

Следующая процедура этапа предварительного анализа данных - выявление наличия тенденций в развитии исследуемого показателя.

Делим исходный временной ряд на две примерно равные по числу уровней части. Для каждой из этих частей вычисляем средние значения.

Таблица 5

Выявление наличия тенденций в развитии исследуемого показателя

tx2(x2-xср)2(x2-xср)21783301269,321051,978388,831347,1231,64844161781293,4151860,4279333,462353,63621218,70372633,82633317,56383424,1692973,002594232,7568,8225105780,22321509,323117114,98170164,723Сумма32198,7740516,517439752,14Ср.Знач.2927,155

Для каждой из этих частей вычисляем средние значения и дисперсии

 

n1=5n2=6x21cp=1331,88x22cp=4256,55?1=185129,1?2=3487950Fрасч=0,053077Fтабл=0,159845сигма=1421,278tрасч.=3,398304tтабл=2,262157

?- общая дисперсия

Так как Fрасч<Fтабл(0,95;4;5) то гипотеза о равенстве дисперсий принимается.

Так как tрасч>tтабл, то гипотеза об отсутствии тренда отвергается. Тренд есть.

Тогда можно проверить основную гипотезу о равенстве средних значений с использованием t-критерия Стьюдента:

 

Таблица 6

Двухвыборочные t-тесты

Двухвыборочный F-тест дл