Статистика измерений
Дипломная работа - Математика и статистика
Другие дипломы по предмету Математика и статистика
?ного коэффициента ассиметрии определяется его средняя квадратическая ошибка (коэффициент ассиметрии):
?As =
?As = = 0.1568
отношение = = 9.8 3, следовательно, ассиметрия является существенной. Очевидно, что в нашем случае это связано со смещением вершины распределения относительно середины распределения.
Мода распределения в нашем случае Мо = 0,14, а = 0,2844, поэтому форму распределения можно представить как
Так как распределение является одновершинным, то необходимо рассчитать еще один показатель оценки его формы - эксцесс. Эксцесс является показателем островершинности распределения. Он рассчитывается как
Ех = -3
Ех = - 3 = 2,935-3 = - 0,065.
Так как Ех 0, то распределение является плосковершинным..
Показатель формы для Ех* = 2,935 2 (находится по специализированным таблицам).
Для изучения показателей формы вариации удобно использовать табличный процессор Excel Он имеет набор средств анализа данных (Пакет анализа), предназначенный для решения статистических и инженерных задач. Вызов осуществляется командой Сервис Анализ данных. Для проведения анализа следует указать входные данные и выбрать параметры. Анализ будет проведен с помощью соответствующей статистической или инженерной функции, а результат будет помещен в выходной диапазон.
Правдоподобно или нет допущение о том, что результат измерения подчиняется нормальному закону распределения вероятности, оценим по виду гистограммы, построенной на основании экспериментальных данных.
Произведём разделение на интервалы рассматриваемую совокупность.
.Количество интервалов определяем по формуле Старджесса:
r = 1 + 3.33lg m
r = 1 + 3.33*lg 239 = 1 + 3.33*2.378 = 8.92.
выбираем 9 интервалов.
.Ширина интервала d
d =
xmax = 1.15
xmin = 0.00, тогда d = 1.15/9 = 0.127777,
выбираем шаг равным 0,13, тогда получаем интервальное распределение и составим сводную расчётную таблицу.
Таблица 7.
№хСередина хЧастота nn/rn/P(x)F(x)10.00 - 0.130.065859.4440.3560.3560.35620.13 - 0.260.195586.4440.2430.2430.59930.26 - 0.390.325353.8880.1460.1460.74540.39 - 0.520.455171.8880.0710.0710.81650.52 - 0.650.585212.3330.0880.0880.90460.65 - 0.780.71560.6660.0250.0250.92970.78 - 0.91 0.84560.6660.0250.0250.95480.91 - 1.04 0.97580.8880.03350.03350.98791.04 - 1.171.10530.3330.01250.012512391
Построим гистограмму и полигон для полученного распределения в Excel. Одновременно рассмотрим полученную функцию распределения F(x) и произведём в этом операторе поиск аппроксимирующей функции.
Выбирая окончательный вариант табличного представления вариационного ряда из представленных вариантов, остановимся на первом - n=9.
From ToCountCommulative CountPersentCommulative Persent0,00<x=0,1385850,344650,344650,13<x=0,26581430,242680,587330,26<x=0,39351780,146440,744770,39<x=0,52171950,071130,80490,52<x=0,65212160,087870,892770,65<x=0,7862220,02510,917870,78<x=0,9162280,02510,942970,91<x=1,0482360,033480,976451,04<x=1,1732390,012551
В таблицах первая непоименованная графа (From To) содержит интервалы значений признака Количество Второй столбец Count - абсолютные частоты (fi), т.е. число единиц совокупности, обладающих указанным значением признака.Count - накопленные абсолютные частоты, получаемые последовательным суммированием частот по группам. Сумма накопленных частот по каждой строке означает, какое количество единиц совокупности имеет значение признака, не превышающее значения верхней границы данного интервала. Общая сумма накопленных частот соответствует объему изучаемой совокупности (239).- частости (относительные частоты, wi; выражаются в процентах), рассчитываются:
, или n/r в нашем случае
где: fi - число единиц i-той группы; - общее число единиц в совокупности; wi - доля каждой группы в общем объеме совокупности.
percent - накопленные частости - это результат последовательного суммирования относительных частот по группам, итоговая сумма, очевидно, равна 100%.
Табличное представление вариационного ряда позволяет получить подробную информацию о составе и структуре изучаемой совокупности, т.е. определить какое количество единиц изучаемой совокупности обладает тем или иным значением признака и какова доля этой группы единиц в общем объеме совокупности, а также выявить закономерность изменения частот.
Из таблицы видно, что наибольшую частоту (85 или 35.6% от всего объема совокупности) имеет интервал 0.00 - 0.13.
Наименьшую частоту (3 или 1.25%) имеет первый интервал - 1.04 - 1.17
Для более наглядного представления вариационного ряда используют статистические графики.
Статистический график представляет собой чертеж, на котором при помощи условных геометрических фигур (линий, точек или других символических знаков) изображаются статистические данные. В результате этого достигается наглядная характеристика изучаемой статистической совокупности.
Правильно построенный график делает статистическую информацию более выразительной, запоминающейся и удобно воспринимаемой.
Традиционно для изображения вариационных рядов распределения в отечественной практике используются графики: гистограмма, полигон, кумулята.
На рис. 1. представлен полигон распределения в абсолютных частотах при количестве интервалов n=9. Он показывает, что наибольшую частоту имеет интервал 0.00 - 0.13 т.е. это модальный интервал.
Одной из часто используемых видов графиков является гистограмма (или столбиковая диаграмма), т.е. график распределения, на котором частоты каждого интервала представлены в виде столбиков (рис. 2).
Рис.1
Рис.2
Рис. 3 Функция распределения.
Рис.5. Отношения частостей.
Рис. 6. Аппроксимация плот?/p>