Конспект лекций по курсу "Теория вероятностей и математическая статистика"
Вид материала | Конспект |
Математическая статистика Группированным статистическим рядом |
- Рабочая учебная программа дисциплины (модуля) Теория вероятностей и математическая, 217.23kb.
- Примерная программа наименование дисциплины «теория вероятностей и математическая статистика», 165.37kb.
- Рабочая программа дисциплины "теория вероятностей и математическая статистика", 112.61kb.
- Рабочая программа учебной дисциплины теория вероятностей и математическая статистика, 830.1kb.
- Рабочая программа учебной дисциплины «Теория вероятностей и математическая статистика», 165.42kb.
- Программа курса лекций "Теория вероятностей и математическая статистика", 18.69kb.
- Примерная рабочая программа по дисциплине: «теория вероятностей, математическая статистика, 83.07kb.
- Программа по дисциплине «Теория вероятностей и математическая статистика» для студентов, 206.05kb.
- А. С. Гринберг О. Б. Плющ Б. В. Новыш Теория вероятностей и математическая статистика, 1813.61kb.
- Программа-минимум кандидатского экзамена по специальности, 37.75kb.
Математическая статистика - это наука, занимающаяся методами обработки результатов опытов или наблюдений над случайными явлениями.
Хотя аппарат математической статистики связан со случайными явлениями, но в отличие от теории вероятностей методы математической статистики позволяют охарактеризовать случайное явление по его ограниченной выборке.
Имея статистический материал n измерений какой-либо случайной величины (выборку), необходимо решить следующие основные задачи:
1) представить статистический материал в наиболее удобном виде;
2) оценить неизвестные характеристики исследуемой случайной величины;
3) проверить статистические гипотезы о параметрах или природе анализируемой модели.
Таким образом, математическая статистика помогает исследователю лучше разобраться в опытных данных, полученных в результате наблюдений над случайными явлениями: оценить значимы или не значимы наблюдаемые факты; принять или отбросить те или иные гипотезы о природе явления.
Вместе с тем методы математической статистики широко применяются для обработки статистических данных, не имеющих вероятностной природы, поэтому они широко применяются во многих областях человеческой деятельности: политике, экономике, финансах, медицине, военном деле и др.
10. Основные понятия математической статистики и статистическое распределение выборки
Результат n независимых измерений случайной величины X представляет собой выборку (x1, x2, ... , xn) из теоретически бесконечной генеральной совокупности, распределение признака в которой совпадает с теоретическим распределением ввероятностей величины Х. Последняя называется распределением генеральной совокупности, а его параметры - параметрами генеральной совокупности. В большинстве приложений теоретическая генеральная совокупность есть идеализация действительной совокупности, из которой получена выборка. Если эксперимент охватывает генеральную совокупность объектов, то полученный набор экспериментальных данных назывется генеральной выборкой.
Первое, что попадает в руки аналитика - это протокол в котором зарегистрированы: номер опыта i и значение хi, которое приняла в этом опыте случайная величина Х. Такой протокол, представленный в виде таблицы или виде вектора, называют первичной статистической совокупностью. При большом числе опытов n рассмотрение и осмысливание таблиц или векторов первичной статистической совокупности затруднительно, поэтому производят ее упорядочение. Например, размещают результаты опыта в порядке возрастания случайной величины. Таким образом получают упорядоченную статистическую совокупность. Размах выборки есть разность между наибольшим и наименьшим значением хi.
По упорядоченной статистической совокупности уже можно построить статистическую функцию распределения:
Функция - разрывная ступенчатая функция, равная нулю левее наименьшего наблюденного значения случайной величины Х и единице, правее наибольшего. Теоретически она должна иметь n скачков, где n - число опытов (размер выборки), а величина каждого скачка должна быть равной - частоте наблюдаемого значения случайной величины n. Практически, если одно и то же значение наблюдалось несколько раз, соответствующие скачки сливаются в один, так что общее число скачков равно числу различных наблюденных значений случайной величины. Величина скачка в каждой точке равна , где - число повторений значения в полученной выборке.
Рис. 1-ст.
Очевидно, что другие n опытов дали бы несколько иной график функции , но общая тенденция сохранилась бы. При неограниченном увеличении n кривая будет приближаться (сходиться по вероятности) к функции распределения cлучайной величины Х. На практике применяются другие, более простые способы построения законов распределения случайной величины по опытным данным.
Для того, чтобы составить себе общее представление о законе распределения случайной величины X, незачем фиксировать каждое наблюденное значение и строить статистическую функцию распределения. Этим целям лучше служат группированный статистический ряд и гистограмма.
Для построения группированного статистического ряда весь участок оси абсцисс, на котором расположены значения случайной величины X, наблюдавшиеся в опыте, делятся на участки или “разряды”. Длины разрядов необязательно брать равными друг другу: бывают случаи, когда на участках оси абсцисс, где наблюденные значения X располагаются гуще, удобнее брать разряды более мелкими, а там где реже - более крупными (или объединять два или более равных по длине разрядов в один). Границы разрядов удобно брать “круглыми” числами.
Группированным статистическим рядом называется таблица, где в верхней строке указаны разряды: от и до, в нижней - соответствующие им частоты:
| | | | | |
| | | | | |
причем
Частота события вычисляется как отношение числа опытов, в которых случайная величина попала в -й разряд к общему числу проведенных опытов:
.
Если значение случайной величины попало в точности на границу между разрядами, то её можно отнести либо к левому разряду, либо к правому (ведь вероятность того, что непрерывная случайная величина примет заранее заданное значение, равна нулю). Можно использовать и “симметричное правило”: если значение случайной величины попало в точности на границу разрядов, то разделить его поровну между соседними разрядами и прибавить по к числам для обоих разрядов.
Число разрядов, на которые следует группировать статистические данные, не должно быть слишком большим ( тогда ряд распределения становится слишком невыразительным, и частоты в нем обнаруживают незакономерные колебания); с другой стороны оно не должно быть слишком малым (при этом свойства распределения описываются слишком грубо). Практика показывает, что в большинстве случаев рационально выбирать число разрядов порядка .
Группированный статистический ряд часто оформляется графически в виде так называемой гистограммы - статистического аналога кривой распределения. Гистограмма строится следующим образом. По оси абсцисс откладываются разряды и на каждом разряде как его основание строится прямоугольник, площадь которого равна частоте данного разряда (высота прямоугольника равна частоте данного разряда , разделенной на его длину ). Из способа построения гистограммы следует, что полная площадь ее равна единице.
Очевидно, что при увеличении числа опытов можно выбирать все более и более мелкие разряды, при этом гистограмма будет все более приближаться к некоторой кривой ограничивающей площадь, равную единице.
Эта кривая представляет собой график статистической плотности распределения величины Х.
Имея в своем распоряжении группированный статистический ряд, можно приближенно построить и статистическую функцию распределения величины Х.
В качестве тех значений х, для которых вычисляется , естественно, взять границы разрядов. Тогда, очевидно:
Соединяя полученные точки плавной кривой, получим приближенный график статистической функции распределения.
Пример. Измерено n=100 сопротивлений определенного вида. В таблице приведены номер опыта i и соответствующие значения сопротивления (в омах).
i | xi | i | xi | i | xi | i | xi | i | xi |
1 | 87 | 21 | 82 | 41 | 88 | 61 | 108 | 81 | 84 |
2 | 85 | 22 | 111 | 42 | 90 | 62 | 95 | 82 | 105 |
3 | 91 | 23 | 115 | 43 | 101 | 63 | 99 | 83 | 110 |
4 | 102 | 24 | 99 | 44 | 95 | 64 | 92 | 84 | 102 |
5 | 80 | 25 | 96 | 45 | 93 | 65 | 100 | 85 | 104 |
6 | 75 | 26 | 101 | 46 | 32 | 66 | 118 | 86 | 107 |
7 | 94 | 27 | 115 | 47 | 88 | 67 | 103 | 87 | 120 |
8 | 102 | 28 | 100 | 48 | 94 | 68 | 102 | 88 | 108 |
9 | 99 | 29 | 97 | 49 | 98 | 69 | 89 | 89 | 107 |
10 | 101 | 30 | 91 | 50 | 99 | 70 | 90 | 90 | 98 |
11 | 100 | 31 | 87 | 51 | 102 | 71 | 94 | 91 | 96 |
12 | 120 | 32 | 116 | 52 | 101 | 72 | 106 | 92 | 106 |
13 | 122 | 33 | 121 | 53 | 122 | 73 | 112 | 93 | 110 |
14 | 101 | 34 | 101 | 54 | 99 | 74 | 122 | 94 | 115 |
15 | 88 | 35 | 123 | 55 | 97 | 75 | 100 | 95 | 95 |
16 | 80 | 36 | 97 | 56 | 95 | 76 | 92 | 96 | 109 |
17 | 97 | 37 | 95 | 57 | 105 | 77 | 83 | 97 | 111 |
18 | 92 | 38 | 88 | 58 | 112 | 78 | 82 | 98 | 103 |
19 | 91 | 39 | 104 | 59 | 116 | 79 | 111 | 99 | 88 |
20 | 94 | 40 | 111 | 60 | 118 | 80 | 102 | 100 | 108 |
Имея первичную статистическую совокупность, получить упорядоченную статистическую совокупность; построить группированный статистический ряд с шестью равномерными разрядами; гистограмму и статистическую функцию распределения.
Решение: Упорядоченная статистическая совокупность имеет вид:
i | xi | i | xi | i | xi | i | xi | i | xi |
1 | 75 | 21 | 92 | 41 | 97 | 61 | 102 | 81 | 111 |
2 | 80 | 22 | 92 | 42 | 98 | 62 | 102 | 82 | 111 |
3 | 80 | 23 | 92 | 43 | 98 | 63 | 102 | 83 | 111 |
4 | 82 | 24 | 92 | 44 | 99 | 64 | 102 | 84 | 111 |
5 | 82 | 25 | 93 | 45 | 99 | 65 | 103 | 85 | 112 |
6 | 84 | 26 | 93 | 46 | 99 | 66 | 103 | 86 | 112 |
7 | 85 | 27 | 94 | 47 | 99 | 67 | 104 | 87 | 115 |
8 | 87 | 28 | 94 | 48 | 99 | 68 | 104 | 88 | 115 |
9 | 87 | 29 | 94 | 49 | 100 | 69 | 105 | 89 | 115 |
10 | 88 | 30 | 95 | 50 | 100 | 70 | 105 | 90 | 116 |
11 | 88 | 31 | 95 | 51 | 100 | 71 | 106 | 91 | 116 |
12 | 88 | 32 | 95 | 52 | 100 | 72 | 106 | 92 | 118 |
13 | 88 | 33 | 95 | 53 | 101 | 73 | 107 | 93 | 118 |
14 | 88 | 34 | 95 | 54 | 101 | 74 | 107 | 94 | 120 |
15 | 89 | 35 | 95 | 55 | 101 | 75 | 108 | 95 | 120 |
16 | 90 | 36 | 96 | 56 | 101 | 76 | 108 | 96 | 121 |
17 | 90 | 37 | 96 | 57 | 101 | 77 | 108 | 97 | 122 |
18 | 91 | 38 | 97 | 58 | 101 | 78 | 109 | 98 | 122 |
19 | 91 | 39 | 97 | 59 | 102 | 79 | 110 | 99 | 122 |
20 | 91 | 40 | 97 | 60 | 102 | 80 | 110 | 100 | 123 |
Если в таблице первичной статистической совокупности одно и то же значение встречается несколько раз, то и в таблице упорядоченной статистической совокупности его надо писать столько же раз.
Для группированного статистического ряда выберем “круглые” границы разрядов: (70-80); (80-90); (90-100); (100-110); (110-120); (120-130).
Подсчитывая количество значений случайной величины, попавших в каждый разряд (считая половинки от попавших в границу между разрядами) и деля это значение на число опытов n=100, получим группированный статистический ряд:
Разряды | 70:80 | 80:90 | 90:100 |
Частоты | 0,02 | 0,14 | 0,34 |
Разряды | 100:110 | 110:120 | 120:130 |
Частоты | 0,29 | 0,15 | 0,06 |
Откладывая по оси абсцисс разряды и строя на каждом разряде как на основании прямоугольник с площадью , получим гистограмму (рис. 2).
Рис. 2-ст.
Пользуясь группированным статистическим рядом, находим:
F*(70) = 0; F*(80) = 0,02; F*(90) = 0,02 + 0,14 = 0,16;
F*(100) = 0,02 + 0,14 + 0,34 = 0,5; F*(110) = 0,5 + 0,29 = 0,79;
F*(120) = 0,79 + 0,15 = 0,94; F*(130) = 0,94 + 0,06 = 1.
График статистической функции распределения показан на рис. 3.