Математические методы статистики
Дипломная работа - Математика и статистика
Другие дипломы по предмету Математика и статистика
сква320323МБРРМосква582924ВоронежВоронеж3682925РуссобанкМосква4615526ОрбитаМосква185127ЕвросиббанкМосква2752328ТольяттихимбанкТольятти1683329СифЯкутск384830Банк Китая (ЭЛОС)Москва141-8Итого458393970Среднее значение1528,0132,3
При произведении расчетов использовались стандартные пакеты прикладных программ, в частности Excel.
Способ отбора данных был следующий - из 200 банков выбрали каждый 6-ой банк начиная с 3-го по списку. Получился список из 33 банков. Из этого списка исключили каждый 11-ый банк. Получилась выборочная совокупность из 30 банков.
1.1 Построение интервального вариационного ряда по величине чистого капитала
Построим интервальный вариационный ряд распределения по величине чистого капитала
Для определения числа групп можно воспользоваться формулой Стерджесса:
,
гдеn - число групп;
N - число единиц в совокупности.
n = 1+3.322 lg30 = 5,90699 ? 6
Величина интервала определяется по формуле:
,
где Хmax - максимальное значение признака в ряду;
Xmin - минимальное значение признака в ряду.
Величина интервала для вариационного ряда распределения банков по величине чистых активов
H = (9911 - 141) / 6 = 1628,3 млн.руб.
В таблице 2 приведена группировка банков по величине чистых активов
Таблица 2
№ группыВеличина чистых активов, млн.руб.Число банков, штСредняя величина интервала, млн.руб.Общая величина чистых активов в группе, млн.руб.Средняя величина чистых активов в группе, млн.руб.1 141 - 1769,325955,1514370574,82 1769 - 3397,612583,152583,152583,23 3397,6 - 5025,914211,7536493649,04 5025,9 - 6654,2000-56654,2 -8282,517468,3567286728,06 8282,5 - 991129096,65183649182,0 Итого30 45694,151523,1
1.2 Построение графика
Для наглядного изображения интервального ряда распределения построим гистограмму. Она представлена на рисунке 1.
Гистограмма распределения банков по величине чистого капитала
Рис.1
В таблице 2 рассчитана средняя величина чистых активов по группировке.
Хср = 1 527,97 млн.руб.
Так же среднюю величину для интервального ряда можно рассчитать по формуле средней арифметической взвешенной
, где
гдеxi -середина интервала усредняемого показателя;
n - число единиц (объем) совокупности;
fi - частота, которая показывает как часто встречается значение признака в статистической совокупности.
хср = 1877,84 млн.руб.
Однако средняя величина, рассчитанная в первом случае, является более точной и в последующих расчетах мы будем пользоваться ею.
1.3 Расчет показателей вариации
Для характеристики структуры вариации рассчитываем структурные средние: моду и медиану.
Мода - значение признака, которое наиболее часто встречается в ряду распределения. Для интервального ряда мода определяется по наибольшей частоте. Мода находится по формуле:
,
гдеx0 - нижняя (начальная) граница модального интервала;
k - величина интервала;
fMo - частота модального интервала;
fMo-1 - частота интервала, предшествующего модальному;
fMo+1 - частота интервала, следующего за модальным.
М0 = 141 + 1628,3*(25 - 0) / ((25 - 0) + (25 - 1)) = 971,77 млн.руб.
Медиана - значение признака, которое делит совокупность на две равные части, т.е. 50% единиц совокупности имеют значение меньше медианы, а остальные - больше медианы.
Для определения медианы рассчитывается ее порядковый номер по формуле:
= 31 / 2 = 15,5
гдеn - число единиц совокупности.
Затем рассчитывается накопленные частоты. После смотрят, какая из накопленных частот впервые превышает номер медианы.
Медиану рассчитывают по формуле:
,
гдеx0 - нижняя граница медианного интервала;
k - величина интервала;
?f = n - число единиц совокупности;
SMe-1 - накопленная частота (кумулятивная частота) интервала, предшествующего медианному;
fMe - медианная частота.
Ме = 141 + 1628,3 * (15 - 0) / 25 = 1117,98 млн.руб. - данная величина чистых активов находится в середине совокупности.
Степень близости данных отдельных единиц совокупности к средней величине измеряется рядом абсолютных и относительных показателей вариации.
К абсолютным показателям вариации относятся:
размах вариации;
среднее линейное отклонение;
дисперсия;
среднее квадратическое отклонение.
Размах вариации представляет собой разность между максимальным и минимальным значениями признака совокупности, и находится по формуле:
R = 9911 - 141 = 9770 млн.руб.
Среднее линейное отклонение представляет собой среднюю величину из отклонений значений признака от их средней величины, которое рассчитывается по формуле:
= 1688,6 млн.руб.
Так же среднее линейное отклонение можно рассчитать по формуле
В таблице 3 представлены дополнительные расчеты для исчисления показателей вариации
Таблица 3
№ группыВеличина чистых активов, млн.руб.Число банков,шт, fiСредняя величина интервала, млн.руб.|х-хср||х-хср|*fi(х-хср)2*fi1 141 - 1769,325955,15568,014199,718065268,672 1769 - 3397,612583,151060,01060,0121123624,733 3397,6 - 5025,914211,752688,62688,6127228632,694 5025,9 - 6654,2001523,100,0056654,2 -8282,517468,355945,25945,21235345541,766 8282,5 - 991129096,657573,515147,02114716157,93 Итого30 19358,539040,6166479225,79 Среднее 645,31301,45549307,53d = 1301,4 млн.руб.
Таким образом, средняя величина отклонений значений величины чистых вложений от их средней составляет 1301,4 млн. руб.
Дисперсия - это средний квадрат отклонений индивидуальных значений признака от их средней величины. Дисперсия находится по формуле: