Прогноз заработной платы
Контрольная работа - Менеджмент
Другие контрольные работы по предмету Менеджмент
>
параметры уравнения парной линейной регрессии.
При этом
- эмпирический корреляционный момент случайных величин
среднее квадратическое отклонение случайной величины ,
дисперсия случайной величины ,
выборочное среднее значение случайной величины ,
- выборочное среднее значение случайной величины ,
- выборочное среднее значение случайной величины ,
выборочное среднее значение случайной величины ,
- объем выборки.
В нашем случае Вычислим все необходимые суммы. Результаты расчетов представим в виде таблицы:
Таблица 2.2
Номер региона1234561711319301504117161123456276142107925776201643811361101665611849646713489784489179565791411113962411988168214912218672422201788151132887744228018781471146660842160998915013350792122500109115313923828123409Итого802143411547164862206178Среднее 80,2143,411547,16486,220617,8
Получаем:
Тогда
Параметры линейного регрессионного уравнения:
Следовательно, уравнение линейной регрессии имеет вид: . Значит с увеличением на 1 увеличивается в среднем на 0,857.
Таким образом, с увеличением среднедушевого прожиточного минимума в день на 1 руб. среднедневная заработная плата увеличивается в среднем на 0,857 руб.
2) Найдем линейный коэффициент парной корреляции , являющийся мерой тесноты связи между переменными и . Для этого воспользуемся формулой:
где среднее квадратическое отклонение случайной величины ,
дисперсия случайной величины ,
выборочное среднее значение случайной величины .
Итак,
Значит линейный коэффициент парной корреляции:
Коэффициент корреляции характеризует зависимость и и меняется от -1 до 1.
По коэффициенту корреляции можно сделать вывод, что линейная связь между и прямая (так как ) и очень сильная, так как
Коэффициент детерминации позволяет сделать вывод о том, что линейной уравнение вполне адекватно описывает зависимость между и (вариация на 73,3 % объясняется влиянием показателя ).
Точность модели характеризуется величиной отклонения расчетных значений от фактических. Средняя относительная ошибка аппроксимации - среднее отклонение расчетных значений от фактических, определяется по формуле:
где объем выборки,
значение регрессионной функции в точке .
Составим расчетную таблицу:
Таблица 2.3
Номер региона1234567171131135,5156-4,5156-0,034470230,03447023276142139,80062,19940,0154887320,015488732381136144,0856-8,0856-0,059452940,05945294467134132,08761,91240,0142716420,014271642579141142,3716-1,3716-0,009727660,00972766682149144,94264,05740,0272308720,027230872788151150,08460,91540,0060622520,006062252878147141,51465,48540,0373156460,037315646989150150,9416-0,9416-0,006277330,006277331091153152,65560,34440,002250980,00225098Итого802143414340-0,0073080380,212548288
В нашем случае
Таким образом, в среднем расчетные значения линейной модели
отклоняются от фактических на 2,1 %.
) Оценим статистическую значимость параметров регрессии и корреляции
Проверим значимость с доверительной вероятностью (то есть на уровне значимости ) с помощью критерия Фишера.
Наблюдаемое (фактическое) значение критерия Фишера определяется как:
Критическое значение критерия Фишера определяется как
по таблице критических точек распределения Фишера - Снедекора, где
число степеней свободы большей дисперсии,
число степеней свободы меньшей дисперсии,
( число факторных переменных, определяющих модель).
При гипотеза об отсутствии линейной связи (то есть о том, что ) отклоняется, и соответственно коэффициент парной корреляции является значимым.
При гипотеза об отсутствии связи линейной верна, и соответственно коэффициент парной корреляции является незначимым.
В нашем случае
Оказалось, что , следовательно, гипотеза об отсутствии линейной связи неверна, и соответственно коэффициент парной корреляции
является значимым.
Таким образом, найденное линейное уравнение в целом довольно точно описывает зависимость между среднедневной заработной платой и среднедушевым прожиточным минимумом в день.
Значимость параметра линейного уравнения парной регрессии проверим с помощью критерия Стьюдента.
Наблюдаемое (фактическое) значение критерия Стьюдента определяется как:
где число фактических наблюдений (в нашем случае );
значение регрессионной функции в точке .
Критическое значение критерия Стьюдента определяется как
по таблице критических точек распределения Стьюдента.
При гипотеза о равенстве нулю параметра линейного уравнения парной регрессии отклоняется, и соответственно параметр является значимым.
При параметр линейного уравнения парной регрессии является незначимым, его можно считать равным нулю.
Вычислим
и
для чего составим расчетную таблицу:
Таблица 2.4
Номер региона12345678171131135,5156-4,515620,39064336-9,284,64276142139,80062,19944,83736036-4,217,64381136144,0856-8,085665,376927360,80,64467134132,08761,91243,65727376-13,2174,24579141142,3716-1,37161,88128656-1,21,44682149144,94264,057416,462494761,83,24788151150,08460,91540,837957167,860,84878147141,51465,485430,08961316-2,24,84989150150,9416-0,94160,886610568,877,441091153152,65560,34440,1186113610,8116,64Итого802143414340144,53880541,6Среднее80,2143,4
Таким образом,
В нашем случае
Оказалось, что , следовательно, гипотеза о равенстве нулю параметра линейн?/p>