Исследование статистической зависимости количества эритроцитов в крови от возраста человека
Дипломная работа - Математика и статистика
Другие дипломы по предмету Математика и статистика
?ики состоит в том, чтобы указать методы сбора и обработки статистических данных для получения выводов.
Теория вероятностей - раздел математики, в котором по данным вероятностям одних случайных событий находят вероятности других событий, связанных каким - либо образом с первым. Теория вероятностей изучает также случайные величины и случайные процессы. Одно из основных задач теории вероятностей состоит в выяснении закономерностей, возникающих при взаимодействии случайных факторов.
У нас имеется выборка случайных значений, объем которой равен n = 100.
Выборочной совокупностью или просто выборкой называют совокупность случайно отобранных объектов.
Генеральной совокупностью называют совокупность объектов, из которых производится выборка.
Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности.
Виды выборочной совокупности:
повторная;
бесповторная;
репрезентативная.
Повторной называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность.
Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается.
Выборка должна правильно представлять пропорции генеральной совокупности. Это требование коротко формулируют так: выборка должна быть репрезентативной (представительной).
Наблюдаемые значения называются вариантами, а последовательность вариант в возрастающем прядке - вариационным рядом. Частотой называется число, которое показывает, сколько раз встречается данный вариант. Относительной частотой называется отношение частоты к объему выборки n.
Случайной величиной называется величина, которая может принимать различные (случайные) значения. Она характеризуется несколькими величинами.
Гистограммой частот называется ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длинной h, а высоты равны частоте .
Исходные данные и их обработка
Нам дана выборка (объемом n = 100) зависимости числа Y от числа X (см. табл. 1).
Таблица 1
Исходные данные
XYXYXYXY15,0046,805,1818,308,9830,504,2216,100,214,091,879,7110,6034,101,064,7217,9055,106,6222,8016,8054,409,9232,807,6828,608,0627,102,709,9717,1054,3018,0055,608,1628,107,5826,509,3433,1014,9046,606,7623,1012,3037,6019,2058,0013,4041,7013,8044,504,0615,403,5414,400,364,663,1411,800,243,604,6418,500,996,966,2620,904,8617,409,6032,209,7833,5010,8036,209,4830,007,4825,105,0017,806,2821,7015,7049,506,5422,806,6822,507,5425,4013,5043,001,106,2617,7055,403,9814,6016,6053,7019,4061,501,9910,2014,3044,7012,1039,204,5215,5019,7062,9010,0032,7015,0048,908,7830,507,1623,2013,5042,3012,2040,303,5413,0010,8035,706,6221,108,0626,0016,7052,500,653,9318,4059,1017,6054,809,7031,909,7233,801,767,6819,7061,701,979,2212,6042,7012,4040,409,9833,0017,1053,904,7817,9011,2036,3016,4053,106,1421,501,365,6714,6048,7017,8057,803,2415,404,9419,401,447,045,4220,008,0427,9012,3041,1011,0035,606,9824,306,7023,404,6418,7017,8056,105,9822,609,5631,0015,0046,805,1818,308,9830,504,2216,100,214,091,879,7110,6034,101,064,7217,9055,106,6222,8016,8054,409,9232,807,6828,608,0627,102,709,9717,1054,30
Диаграмма рассеивания
Построим диаграмму рассеивания (см. рисунок 1):
Рис. 1 Диаграмма рассеивания
Найдем некоторые характеристика для X и Y:
выборочное среднее: 9,1947;
выборочную дисперсию: 30,1964;
исправленную дисперсию: 30,5014;
среднеквадратичное отклонение: 5,4951;
оценку среднеквадратичного отклонения: 5,5228;
выборочное среднее: 30,6331;
выборочную дисперсию: 268,7818;
исправленную дисперсию: 271,4968;
среднеквадратичное отклонение: 16,3946;
оценку среднеквадратичного отклонения: 16,4772;
выборочный коэффициент корреляции: = 0,998.
Найдем также моду и медиану для X и Y.
Модой случайной дискретной величины называется значение случайной величины, которое имеет максимальную вероятность:
15, 22,8.
Медианой называется такое значение варьирующего признака, которое приходится на середину упорядоченного ряда:
8,47, 29,3.
Корреляционная таблица
Разобьем значения X и Y на 6 интервалов (см. табл. 2, табл. 3) и построим корреляционную таблицу (см. табл. 4).
Таблица 2
Интервалы разбиения Х
Интервалы разбиения Х0,212-3,463,46-6,7086,708-9,969,96-13,20413,204-16,45216,452-19,7Представитель интервала1,845,088,3311,5814,8318,08
Таблица 3
Интервалы разбиения Y
Интервалы разбиения Y3,6-13,4833,6-13,4833,6-13,4833,6-13,4833,6-13,4833,6-13,483Представитель интервала8,548,548,548,548,548,54
Таблица 4
Корреляционная таблица
X/Y1,845,088,3311,5814,8318,08Ny8,5416000001618,4302310002428,3100200002038,1900013301648,08000080857,96000001616Nx162321131116100
По корреляционной таблице найдем оценки для X.
Выборочное среднее
;
9,1947;
выборочную дисперсию
;
30,1964;
исправленную дисперсию
;
30,5014;
среднеквадратичное отклонение
;
5,4951;
оценку среднеквадратичного отклонения
;
5,5228.
Найдем так же оценки для Y.
Выборочное среднее
;
30,6331;
выборочную дисперсию
;
268,7818;
исправленную дисперсию
;
271,4968;
среднеквадратичное отклонение
;
16,3946;
оценку среднеквадратичного отклонения
;
16,4772.
Выборочный коэффициент корреляции:
выборочный корреляционный момент
;
= 89,9142
выборочный коэффициент корреляции
;
= 0,998.
Оценки , , , , , - несмещенные оценки математического ожидания, дисперсии и среднеквадратичного отклонения.
Видим, что вычисленные величины по сгруппированным рядам