Статистическая выборка

Контрольная работа - Экономика

Другие контрольные работы по предмету Экономика

?яется в тех случаях, когда цели исследования требуют различной точности при исчислении разных показателей.

Задание 1. Описательная статистика

На экзамене 20 студентов получили следующие оценки (по 100 бальной шкале):

 

8978916871635869988591875967867379985359

1)Построить ряд распределения частот, относительных и накопленных частот для 5 интервалов;

2)Построить полигон, гистограмму и кумулятивный полигон;

)Найти среднюю арифметическую, моду, медиану, первый и третий квартили, межквартальный размах, стандартное отклонение и коэффициенты вариации. Проанализировать данные с использованием этих характеристик и указать интервал, включающий 50% центральных значений указанных величин.

Решение:

 

1)x (min) =53, x (max) =98=x (max) - x (min) =98-53=45=R/1+3.32lgn, где n - объем выборки, n=20

h= 45/1+3.32*lg20= 9

 

a (i) - нижняя граница интервала, b (i) - верхняя граница интервала.

a (1) = x (min) - h/2, b (1) = a (1) +h, тогда, если b (i) - верхняя граница i-го интервала (причем a (i+1) =b (i)), то b (2) =a (2) +h, b (3) =a (3) +h и т.д. Построение интервалов продолжается до тех пор, пока начало следующего по порядку интервала не будет равно или больше x (max).

 

a (1) = 47.5 b (1) = 56.5(2) = 56.5 b (2) = 65.5(3) = 65.5 b (3) = 74.5(4) = 74.5 b (4) = 83.5(5) = 83.5 b (5) = 92.5(6) = 92.5 b (6) = 101.5

 

№Интервалы, a (i) - b (i) Подсчет частотЧастота, n (i) Накопленная частота, n (hi) 147.5 - 56.5/11256.5 - 65.5 // // 45365.5 - 74.5 // // /510474.5 - 83.5 // 212583.5 - 92.5 // // // 618692.5 - 101.5 // 220

2)Для построения графиков запишем вариационные ряды распределения (интервальный и дискретный) относительных частот W (i) = n (i) /n, накопленных относительных частот W (hi) и найдем отношение W (i) /h, заполнив таблицу.

 

x (i) =a (i) +b (i) /2; W (hi) =n (hi) /n

 

Статистический ряд распределения оценок:

Интервалы, a (i) - b (i) x (i) W (i) W (hi) W (i) /h47.5 - 56.5520.050.050.00556.5 - 65.5610.20.250.0265.5 - 74.5700.250.50.02774.5 - 83.5790.10.60.0183.5 - 92.5880.30.90.0392.5 - 101.5970.110.01

Для построения гистограммы относительных частот по оси абсцисс откладываем частичные интервалы, на каждом из которых строим прямоугольник, площадь которого равна относительной частоте W (i) данного i-го интервала. Тогда высота элементарного прямоугольника должна быть равна W (i) /h.

 

 

Из гистограммы можно получить полигон того же распределения, если середины верхних оснований прямоугольников соединить отрезками прямой.

 

 

Для построения кумуляты дискретного ряда по оси абсцисс откладываем значения признака, а по оси ординат - относительные накопленные частоты W (hi). Полученные точки соединяем отрезками прямых. Для интервального ряда по оси абсцисс откладываем верхние границы группировки.

 

 

)Среднее арифметическое значение находим по формуле:

 

/n=

 

Мода рассчитывается по формуле:

 

, где

 

- нижняя граница модального интервала; h - ширина интервала группировки; - частота модального интервала; - частота интервала, предшествующего модальному; - частота интервала, следующего за модальным. = 23,125.

Найдем медиану:

 

n=20: 53,58,59,59,63,67,68,69,71,73,78,79,85,86,87,89,91,91,98,98

= (73+78) /2= 75.5

 

Далее рассчитаем первый, второй и третий квартили.

 

Подставив значения, получаем: Q1=65;

Значение второго квартиля совпадает со значением медианы, поэтому Q2=75.5; Q3= 88.

Межквартальный размах равен:

 

 

Среднеквадратическое (стандартное) отклонение находим по формуле:

 

 

Коэффициент вариации:

 

 

Из данных расчетов видно, что 50% центральных значений указанных величин включает в себя интервал 74,5 - 83,5.

Задание 2. Статистическая проверка гипотез.

 

Предпочтения в спорте для мужчин, женщин и подростков следующие:

БейсболБаскетболФутболМужчина191524Женщина161816Подростки201210

Проверить гипотезу о независимости предпочтения от пола и возраста ? = 0,05.

Решение:

) Проверка гипотезы о независимости предпочтений в спорте.

 

БейсболБаскетболФутболniМужчина19152458Женщина16181650Подростки20121042nj554550n = 150

Коэффициент Пирсена:

 

Ф2=

 

Табличное значение критерия хи-квадрат со степенью свободы 4 при ? = 0,05 равно ?2табл=9,488.

 

.

 

Так как , то гипотеза отвергается. Различия в предпочтениях существенные.

. Гипотеза о соответствии.

Волейбол как вид спорта ближе всего к баскетболу. Проверим соответствие в предпочтениях для мужчин, женщин и подростков.

 

волейболбаскетболniМужчина201535Женщина101828Подросток181230nj4845n=93

Ф2=0.1896+0.1531+0.1624+0.1786+0.1415+0.1533 = 0.979.

 

При уровне значимости ? = 0,05 и степени свободы k = 2 табличное значение ?2табл=9,210.

 

Тогда .

 

Так как Ф2>, то различия в предпочтениях существенные.

Задание 3. Корреляционно-регрессионный анализ.

Анализ дорожно-транспортных происшествий дал следующую статистику относительно процента водителей, моложе 21 года и числа происшествий с тяжелыми последствиями на 1000 водителей:

 

№ п/п12345678910% ниже 21 г. 99101214111311128Число происшествий1,430,931,932,242,351,292,631,851,910,64

Провести графический и корреляционно-регрессионный анализ данных, спрогнозировать число ДТП с тяжелыми последствиями для города, в котором число водителей, моложе 21 года равно 20% от общего числа водителей.

Решение:

Получаем выборку объема n = 10.

 

i12345678910xi89111214111012139yi0.641.431.852.242.351.291.931.912.630.93 - процент водителей моложе 21 года,

y - число происшествий на 1000 водителей.

Уравнение линейной регрессии имеет вид:

 

,

где .

 

Последовательно вычисляем:

 

,

,