Процесс обработки статистикой информации
Контрольная работа - Экономика
Другие контрольные работы по предмету Экономика
p>, (3)
Определение среднеквадратического отклонения
(4)
Используя значения таблицы 7, получим
Задача № 5
Используя данные комбинационной таблицы и опираясь на выводы, полученные на основе графического анализа характера связи между двумя показателями, следует выделить определенные особенности и свойства изучаемой совокупности. Для этого необходимо провести ряд статистических расчетов.
1. Определить корреляционную зависимость между факторным и результативным признаками. При этом выбор уравнения связи должен производиться на основе выявления экономической сущности зависимости показателей между собой с использованием графического способа.
2. Определить показатели тесноты связи (коэффициент корреляции - r или корреляционное отношение - ?).
3. Нанести уравнение регрессии на график, полученный в задаче № 4. Проследить, как выявленная методом корреляционного анализа теоретическая линия регрессии (прямая или кривая) расположена относительно эмпирической.
Определение коэффициента корреляции.
Коэффициент корреляции (между двумя признаками) характеризует интенсивность связи между ними; он может изменяться в пределах от - 1,0 до +1,0. Знак коэффициента характеризует направление изменения результативного признака при увеличении факторного.
(5)
Таблица 8 - Расчет коэффициента корреляции
ХiУiХiУiХi2Уi211635,72209,14342090,702675590,6243738,4021439,29196,06282182,542071543,3738438,4831408,65193,67272817,551984286,3737509,4141253,17191,45239915,481570440,5836651,7851203,06183,16220353,981447356,3133547,9861163, 19182,67212481,801353005,9933369,0471080,65180,78195359,881167793,9632681,6981039,45179,71186800,361080453,7132296,049970,11179,64174270, 20941111,8132270,4510958,67178,18170814,71919053,0931747,5311944,78178,09168252,47892616,0831714,5212883, 19176,95156278,99780017,2331311,0013869,62175,98153036,70756232,4930969,6214866,90175,73152340,80751520,8130881,0115828,83175,10145127,82686957,2330659,9616819,40175,04143424,73671411,7430637,9117811,53174,85141891,52658573,5130570,9318792,50174,47138263,79628052,1830438,3619785,89173,76136556, 20617616,0030192,8620766,24173,69133088,42587127,9930168,0821766,24173,26132758,92587123,7430019,1122763,77165,94126742,12583345,4727536,9723762,01160,80122527,86580653,0725855,5024744,16160,53119460,11553768,3625770, 1925741,97150,48111651,77550520,6722644,2326705,47145,48102635,02497692,8621165,5627694,35136,1494532,44482124,4418535,4328549,94134,7574102,64302429,0418156,9929527,98127,9667558,48278766,0816372,6830514, 19121,9762714,28264389,8514876,07?27290,895105,414780032,2626921574,62880727,78
Проверим значимость коэффициента корреляции, т.е. возможность отвергнуть теорию о некоррелированности рассматриваемых величин.
Для этого определим коэффициент (6)
Для нашего примера
В справочнике найдем табличное значение критерия значимости. При заданной вероятности Р=0,95 и N=30 . Условие, при котором отвергают гипотезу о некоррелированности исследуемых величин . Условие выполняется, следовательно гипотезу некоррелированности признаков можно отвергнуть с заданным уровнем надежности.
Построение линейной регрессионной модели.
Наибольшее распространение получил метод наименьших квадратов МНК, при использовании которого ставится требование, чтобы сумма квадратов разностей между эмпирическими и теоретическими значениями была минимальной.
Оценка линейности связи
Для решения поставленной задачи используем дисперсионный анализ. Если теоретическая линейная регрессия действительно выражает форму эмпирической связи, то отклонения эмпирической линии регрессии от теоретической будут случайными.
В случае если в действительности связь не прямолинейна, отклонения не будут случайными, а будут отражать кривизну эмпирической регрессии. Поэтому вопрос о линейной регрессии может быть решен путем сравнения неслучайных и случайных отклонений.
Неслучайные отклонения характеризуются дисперсией отклонения теоретической регрессии от среднего. Случайные отклонения характеризуются дисперсией остатка.
Определение общей дисперсии по результативному признаку
(7.1)
(7.2)
где К1 - число степеней свободы, приходящееся на регрессию; равно числу независимых переменных (для парной регрессии К1=1)
К2-число степеней свободы, приходящееся на остаток (К2=N - К1-1=28)
Y - теоретическое значение результативного признака, найденное по уравнению парной регрессии.
Таблица 9 - Расчет общей дисперсии
ХYХY1635,722222800,59170,16819,401675,892222,631439,292091568,33682,48811,531668,762240,721408,652071408,12812,72792,5016518,062276,791253,17196728,12944,65785,8916522,072344,561203,06193556,311522,60766,2416336,362351,481163, 19190436,091561,01766,2416336,362393,301080,65185233,671714,03763,7716338,413162,821039,45182156,081803,76762,0116339,913768,14970,1117760,721809,81744,1616256,663800,80958,6717649,231936,29741,9716258,925141,12944,7817536,901944,45705,47159103,035882,55883, 191713,602045,98694,35158118,907402,33869,621700,962134,42549,94149428,327644,66866,901700,632157,76527,98147492,148878,51828,831673, 192216,69514, 19146534,5110042,8810040,8693010,09
Таким образом:
S1=10040,86/1=10040,86
S2=93010,09/28=3321,79
Для установления соответствия эмпирической регрессии линейной форме связи определяют дисперсионное отношение F=S1/S2 и сравнивают со значением из справочника при заданной надежности.
F=10040,86/3321,79=3,03, табличное значение F=4,2.
Фактическое значение меньше табличного, значит прямолинейная форма связи не соответствует эмпирическим данным.
Рисунок 2 - Графическая интерпретация теоретической и эмпирической регрессии
Корреляционный анализ статистических данных показал относительно высокую степень связи между факторным и результативным признаками.
Регрессионный анализ позволил подобрать регрессионную линейную модель методом наименьших квадратов. Насколько эта модель адекватна экспериментальным данным доказала проверка с помощью дисперсионного анализа. В частности, была проверена гипотеза о том, что регрессионная модель точнее описывает результаты экспер