Конспект лекций по курсу "Теория вероятностей и математическая статистика"

Вид материалаКонспект
Математическая статистика
Группированным статистическим рядом
Подобный материал:
1   2   3   4   5   6   7   8
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

Математическая статистика - это наука, занимающаяся методами обработки результатов опытов или наблюдений над случайными явлениями.

Хотя аппарат математической статистики связан со случайными явлениями, но в отличие от теории вероятностей методы математической статистики позволяют охарактеризовать случайное явление по его ограниченной выборке.

Имея статистический материал n измерений какой-либо случайной величины (выборку), необходимо решить следующие основные задачи:

1) представить статистический материал в наиболее удобном виде;

2) оценить неизвестные характеристики исследуемой случайной величины;

3) проверить статистические гипотезы о параметрах или природе анализируемой модели.

Таким образом, математическая статистика помогает исследователю лучше разобраться в опытных данных, полученных в результате наблюдений над случайными явлениями: оценить значимы или не значимы наблюдаемые факты; принять или отбросить те или иные гипотезы о природе явления.

Вместе с тем методы математической статистики широко применяются для обработки статистических данных, не имеющих вероятностной природы, поэтому они широко применяются во многих областях человеческой деятельности: политике, экономике, финансах, медицине, военном деле и др.

 

10. Основные понятия математической статистики и статистическое распределение выборки

Результат n независимых измерений случайной величины X представляет собой выборку (x1, x2, ... , xn) из теоретически бесконечной генеральной совокупности, распределение признака в которой совпадает с теоретическим распределением ввероятностей величины Х. Последняя называется распределением генеральной совокупности, а его параметры - параметрами генеральной совокупности. В большинстве приложений теоретическая генеральная совокупность есть идеализация действительной совокупности, из которой получена выборка. Если эксперимент охватывает генеральную совокупность объектов, то полученный набор экспериментальных данных назывется генеральной выборкой.

Первое, что попадает в руки аналитика - это протокол в котором зарегистрированы: номер опыта i и значение хi, которое приняла в этом опыте случайная величина Х. Такой протокол, представленный в виде таблицы или виде вектора, называют первичной статистической совокупностью. При большом числе опытов n рассмотрение и осмысливание таблиц или векторов первичной статистической совокупности затруднительно, поэтому производят ее упорядочение. Например, размещают результаты опыта в порядке возрастания случайной величины. Таким образом получают упорядоченную статистическую совокупность. Размах выборки есть разность между наибольшим и наименьшим значением хi.

По упорядоченной статистической совокупности уже можно построить статистическую функцию распределения:



Функция - разрывная ступенчатая функция, равная нулю левее наименьшего наблюденного значения случайной величины Х и единице, правее наибольшего. Теоретически она должна иметь n скачков, где n - число опытов (размер выборки), а величина каждого скачка должна быть равной - частоте наблюдаемого значения случайной величины n. Практически, если одно и то же значение наблюдалось несколько раз, соответствующие скачки сливаются в один, так что общее число скачков равно числу различных наблюденных значений случайной величины. Величина скачка в каждой точке равна , где - число повторений значения в полученной выборке.



Рис. 1-ст.

Очевидно, что другие n опытов дали бы несколько иной график функции , но общая тенденция сохранилась бы. При неограниченном увеличении n кривая будет приближаться (сходиться по вероятности) к функции распределения cлучайной величины Х. На практике применяются другие, более простые способы построения законов распределения случайной величины по опытным данным.

Для того, чтобы составить себе общее представление о законе распределения случайной величины X, незачем фиксировать каждое наблюденное значение и строить статистическую функцию распределения. Этим целям лучше служат группированный статистический ряд и гистограмма.

Для построения группированного статистического ряда весь участок оси абсцисс, на котором расположены значения случайной величины X, наблюдавшиеся в опыте, делятся на участки или “разряды”. Длины разрядов необязательно брать равными друг другу: бывают случаи, когда на участках оси абсцисс, где наблюденные значения X располагаются гуще, удобнее брать разряды более мелкими, а там где реже - более крупными (или объединять два или более равных по длине разрядов в один). Границы разрядов удобно брать “круглыми” числами.

Группированным статистическим рядом называется таблица, где в верхней строке указаны разряды: от и до, в нижней - соответствующие им частоты:





























 

 

причем

Частота события вычисляется как отношение числа опытов, в которых случайная величина попала в -й разряд к общему числу проведенных опытов:

.

Если значение случайной величины попало в точности на границу между разрядами, то её можно отнести либо к левому разряду, либо к правому (ведь вероятность того, что непрерывная случайная величина примет заранее заданное значение, равна нулю). Можно использовать и “симметричное правило”: если значение случайной величины попало в точности на границу разрядов, то разделить его поровну между соседними разрядами и прибавить по к числам для обоих разрядов.

Число разрядов, на которые следует группировать статистические данные, не должно быть слишком большим ( тогда ряд распределения становится слишком невыразительным, и частоты в нем обнаруживают незакономерные колебания); с другой стороны оно не должно быть слишком малым (при этом свойства распределения описываются слишком грубо). Практика показывает, что в большинстве случаев рационально выбирать число разрядов порядка .

Группированный статистический ряд часто оформляется графически в виде так называемой гистограммы - статистического аналога кривой распределения. Гистограмма строится следующим образом. По оси абсцисс откладываются разряды и на каждом разряде как его основание строится прямоугольник, площадь которого равна частоте данного разряда (высота прямоугольника равна частоте данного разряда , разделенной на его длину ). Из способа построения гистограммы следует, что полная площадь ее равна единице.

Очевидно, что при увеличении числа опытов можно выбирать все более и более мелкие разряды, при этом гистограмма будет все более приближаться к некоторой кривой ограничивающей площадь, равную единице.

Эта кривая представляет собой график статистической плотности распределения величины Х.

Имея в своем распоряжении группированный статистический ряд, можно приближенно построить и статистическую функцию распределения величины Х.

В качестве тех значений х, для которых вычисляется , естественно, взять границы разрядов. Тогда, очевидно:



Соединяя полученные точки плавной кривой, получим приближенный график статистической функции распределения.

Пример. Измерено n=100 сопротивлений определенного вида. В таблице приведены номер опыта i и соответствующие значения сопротивления (в омах).



i

xi

i

xi

i

xi

i

xi

i

xi

1

87

21

82

41

88

61

108

81

84

2

85

22

111

42

90

62

95

82

105

3

91

23

115

43

101

63

99

83

110

4

102

24

99

44

95

64

92

84

102

5

80

25

96

45

93

65

100

85

104

6

75

26

101

46

32

66

118

86

107

7

94

27

115

47

88

67

103

87

120

8

102

28

100

48

94

68

102

88

108

9

99

29

97

49

98

69

89

89

107

10

101

30

91

50

99

70

90

90

98

11

100

31

87

51

102

71

94

91

96

12

120

32

116

52

101

72

106

92

106

13

122

33

121

53

122

73

112

93

110

14

101

34

101

54

99

74

122

94

115

15

88

35

123

55

97

75

100

95

95

16

80

36

97

56

95

76

92

96

109

17

97

37

95

57

105

77

83

97

111

18

92

38

88

58

112

78

82

98

103

19

91

39

104

59

116

79

111

99

88

20

94

40

111

60

118

80

102

100

108



Имея первичную статистическую совокупность, получить упорядоченную статистическую совокупность; построить группированный статистический ряд с шестью равномерными разрядами; гистограмму и статистическую функцию распределения.

Решение: Упорядоченная статистическая совокупность имеет вид:



i

xi

i

xi

i

xi

i

xi

i

xi

1

75

21

92

41

97

61

102

81

111

2

80

22

92

42

98

62

102

82

111

3

80

23

92

43

98

63

102

83

111

4

82

24

92

44

99

64

102

84

111

5

82

25

93

45

99

65

103

85

112

6

84

26

93

46

99

66

103

86

112

7

85

27

94

47

99

67

104

87

115

8

87

28

94

48

99

68

104

88

115

9

87

29

94

49

100

69

105

89

115

10

88

30

95

50

100

70

105

90

116

11

88

31

95

51

100

71

106

91

116

12

88

32

95

52

100

72

106

92

118

13

88

33

95

53

101

73

107

93

118

14

88

34

95

54

101

74

107

94

120

15

89

35

95

55

101

75

108

95

120

16

90

36

96

56

101

76

108

96

121

17

90

37

96

57

101

77

108

97

122

18

91

38

97

58

101

78

109

98

122

19

91

39

97

59

102

79

110

99

122

20

91

40

97

60

102

80

110

100

123



Если в таблице первичной статистической совокупности одно и то же значение встречается несколько раз, то и в таблице упорядоченной статистической совокупности его надо писать столько же раз.

Для группированного статистического ряда выберем “круглые” границы разрядов: (70-80); (80-90); (90-100); (100-110); (110-120); (120-130).

Подсчитывая количество значений случайной величины, попавших в каждый разряд (считая половинки от попавших в границу между разрядами) и деля это значение на число опытов n=100, получим группированный статистический ряд:



Разряды

70:80

80:90

90:100

Частоты

0,02

0,14

0,34

Разряды

100:110

110:120

120:130

Частоты

0,29

0,15

0,06



Откладывая по оси абсцисс разряды и строя на каждом разряде как на основании прямоугольник с площадью , получим гистограмму (рис. 2).



Рис. 2-ст.

Пользуясь группированным статистическим рядом, находим:

F*(70) = 0; F*(80) = 0,02; F*(90) = 0,02 + 0,14 = 0,16;

F*(100) = 0,02 + 0,14 + 0,34 = 0,5; F*(110) = 0,5 + 0,29 = 0,79;

F*(120) = 0,79 + 0,15 = 0,94; F*(130) = 0,94 + 0,06 = 1.

График статистической функции распределения показан на рис. 3.