Статистическая выборка
Контрольная работа - Экономика
Другие контрольные работы по предмету Экономика
?яется в тех случаях, когда цели исследования требуют различной точности при исчислении разных показателей.
Задание 1. Описательная статистика
На экзамене 20 студентов получили следующие оценки (по 100 бальной шкале):
8978916871635869988591875967867379985359
1)Построить ряд распределения частот, относительных и накопленных частот для 5 интервалов;
2)Построить полигон, гистограмму и кумулятивный полигон;
)Найти среднюю арифметическую, моду, медиану, первый и третий квартили, межквартальный размах, стандартное отклонение и коэффициенты вариации. Проанализировать данные с использованием этих характеристик и указать интервал, включающий 50% центральных значений указанных величин.
Решение:
1)x (min) =53, x (max) =98=x (max) - x (min) =98-53=45=R/1+3.32lgn, где n - объем выборки, n=20
h= 45/1+3.32*lg20= 9
a (i) - нижняя граница интервала, b (i) - верхняя граница интервала.
a (1) = x (min) - h/2, b (1) = a (1) +h, тогда, если b (i) - верхняя граница i-го интервала (причем a (i+1) =b (i)), то b (2) =a (2) +h, b (3) =a (3) +h и т.д. Построение интервалов продолжается до тех пор, пока начало следующего по порядку интервала не будет равно или больше x (max).
a (1) = 47.5 b (1) = 56.5(2) = 56.5 b (2) = 65.5(3) = 65.5 b (3) = 74.5(4) = 74.5 b (4) = 83.5(5) = 83.5 b (5) = 92.5(6) = 92.5 b (6) = 101.5
№Интервалы, a (i) - b (i) Подсчет частотЧастота, n (i) Накопленная частота, n (hi) 147.5 - 56.5/11256.5 - 65.5 // // 45365.5 - 74.5 // // /510474.5 - 83.5 // 212583.5 - 92.5 // // // 618692.5 - 101.5 // 220
2)Для построения графиков запишем вариационные ряды распределения (интервальный и дискретный) относительных частот W (i) = n (i) /n, накопленных относительных частот W (hi) и найдем отношение W (i) /h, заполнив таблицу.
x (i) =a (i) +b (i) /2; W (hi) =n (hi) /n
Статистический ряд распределения оценок:
Интервалы, a (i) - b (i) x (i) W (i) W (hi) W (i) /h47.5 - 56.5520.050.050.00556.5 - 65.5610.20.250.0265.5 - 74.5700.250.50.02774.5 - 83.5790.10.60.0183.5 - 92.5880.30.90.0392.5 - 101.5970.110.01
Для построения гистограммы относительных частот по оси абсцисс откладываем частичные интервалы, на каждом из которых строим прямоугольник, площадь которого равна относительной частоте W (i) данного i-го интервала. Тогда высота элементарного прямоугольника должна быть равна W (i) /h.
Из гистограммы можно получить полигон того же распределения, если середины верхних оснований прямоугольников соединить отрезками прямой.
Для построения кумуляты дискретного ряда по оси абсцисс откладываем значения признака, а по оси ординат - относительные накопленные частоты W (hi). Полученные точки соединяем отрезками прямых. Для интервального ряда по оси абсцисс откладываем верхние границы группировки.
)Среднее арифметическое значение находим по формуле:
/n=
Мода рассчитывается по формуле:
, где
- нижняя граница модального интервала; h - ширина интервала группировки; - частота модального интервала; - частота интервала, предшествующего модальному; - частота интервала, следующего за модальным. = 23,125.
Найдем медиану:
n=20: 53,58,59,59,63,67,68,69,71,73,78,79,85,86,87,89,91,91,98,98
= (73+78) /2= 75.5
Далее рассчитаем первый, второй и третий квартили.
Подставив значения, получаем: Q1=65;
Значение второго квартиля совпадает со значением медианы, поэтому Q2=75.5; Q3= 88.
Межквартальный размах равен:
Среднеквадратическое (стандартное) отклонение находим по формуле:
Коэффициент вариации:
Из данных расчетов видно, что 50% центральных значений указанных величин включает в себя интервал 74,5 - 83,5.
Задание 2. Статистическая проверка гипотез.
Предпочтения в спорте для мужчин, женщин и подростков следующие:
БейсболБаскетболФутболМужчина191524Женщина161816Подростки201210
Проверить гипотезу о независимости предпочтения от пола и возраста ? = 0,05.
Решение:
) Проверка гипотезы о независимости предпочтений в спорте.
БейсболБаскетболФутболniМужчина19152458Женщина16181650Подростки20121042nj554550n = 150
Коэффициент Пирсена:
Ф2=
Табличное значение критерия хи-квадрат со степенью свободы 4 при ? = 0,05 равно ?2табл=9,488.
.
Так как , то гипотеза отвергается. Различия в предпочтениях существенные.
. Гипотеза о соответствии.
Волейбол как вид спорта ближе всего к баскетболу. Проверим соответствие в предпочтениях для мужчин, женщин и подростков.
волейболбаскетболniМужчина201535Женщина101828Подросток181230nj4845n=93
Ф2=0.1896+0.1531+0.1624+0.1786+0.1415+0.1533 = 0.979.
При уровне значимости ? = 0,05 и степени свободы k = 2 табличное значение ?2табл=9,210.
Тогда .
Так как Ф2>, то различия в предпочтениях существенные.
Задание 3. Корреляционно-регрессионный анализ.
Анализ дорожно-транспортных происшествий дал следующую статистику относительно процента водителей, моложе 21 года и числа происшествий с тяжелыми последствиями на 1000 водителей:
№ п/п12345678910% ниже 21 г. 99101214111311128Число происшествий1,430,931,932,242,351,292,631,851,910,64
Провести графический и корреляционно-регрессионный анализ данных, спрогнозировать число ДТП с тяжелыми последствиями для города, в котором число водителей, моложе 21 года равно 20% от общего числа водителей.
Решение:
Получаем выборку объема n = 10.
i12345678910xi89111214111012139yi0.641.431.852.242.351.291.931.912.630.93 - процент водителей моложе 21 года,
y - число происшествий на 1000 водителей.
Уравнение линейной регрессии имеет вид:
,
где .
Последовательно вычисляем:
,
,