Корреляционно-регрессионный анализ зависимости прибыли 40 банков от их чистых активов

Информация - Математика и статистика

Другие материалы по предмету Математика и статистика

Задание №1.

 

Произвести выборку 40 банков, пользуясь таблицей случайных чисел. Затем по отобранным единицам выписать значения факторного и результативного признаков.

 

 

 

 

Задание №2.

 

Построить ряд распределения по факторному признаку. Число групп определить по формуле Стерджесса. По построенному ряду распределения рассчитать среднее арифметическое, моду, медиану, показатели вариации. Сформулировать выводы.

 

 

 

Выводы: Вариация факторного признака (чистых активов) для данной совокупности банков является значительной, индивидуальные значения отличаются в среднем от средней на 11 127 232 тыс. руб., или на 106,08%. Среднее квадратическое отклонение превышает среднее линейное отклонение в соответствии со свойствами мажорантности средних. Значение коэффициента вариации (106,08%) свидетельствует о том, что совокупность достаточно неоднородна.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задание №3

 

Осуществить проверку первичной информации по факторному признаку на однородность. Исключить резко выделяющиеся банки из массы первичной информации.

Проверка первичной информации по факторному признаку на однородность осуществлялась в несколько этапов по правилу 3 сигм. В результате была получена достаточно однородная совокупность (все единицы лежат в интервале (Xср. - 3 ; Xср. +3), а коэффициент вариации меньше требуемых 33%), которая представлена ниже.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задание №4

 

Предполагая, что данные банкам представляют собой 10% простую случайную выборку с вероятностью 0,954 определить доверительный интервал, в котором будет находиться средняя величина факторного признака для генеральной совокупности.

 

Xср. Xген.ср. ? Xген.ср. ? Xср. + Xген.ср.

 

Где Xср. средняя выборочной совокупности, Xген.ср. средняя генеральной совокупности, Xген.ср. предельная ошибка средней.

 

Xген.ср. = t * ?ген.ср.

 

Где t коэффициент кратности средней ошибки выборки, зависящий от вероятности, с которой гарантируется величина предельной ошибки, ?ген.ср. величина средней квадратической стандартной ошибки.

Находим t по таблице для удвоенной нормированной функции Лапласа при вероятности 0,954, t = 2.

 

?ген.ср. = ((2*(1- n/N))/n)

 

Где 2 дисперсия, n объем выборочной совокупности, N объем генеральной совокупности.

N=n/0,1 n=25 N=250 2= 200 301 737 920 Xср. = 1 506 994 (я взял дисперсию и среднюю, рассчитанные по однородной совокупности по не сгруппированным данным)

?ген.ср.= 84 917 Xген.ср. = 169 834

Xср. Xген.ср.= 1 337 161 Xср. + Xген.ср.= 1 676 828

 

1 337 161 ? Xген.ср. ?1 676 828 - искомый доверительный интервал