Статистика измерений

Дипломная работа - Математика и статистика

Другие дипломы по предмету Математика и статистика

ие наблюдалось m = 79 раз (как в нашем случае), то несмещенной точечной оценкой максимальной правдоподобности параметра р является величина рn = m/n = 79/239 = 0.3305.

Плотность вероятности биноминального распределения имеет вид:

 

f(x) = px(1 - p)n - x

 

распределение имеет единственный параметр р.

 

Интервальная оценка: Интервальные оценки параметра р с доверительной вероятностью ? являются решениями уравнений Клоппера-Пирсона

= (1 - ?);

= (?);

 

В скобках приведены вероятности, соответствующие границам рн и рв односторонних доверительных интервалов.

Известно, что биноминальное распределение может быть аппроксимировано с помощью бета- и F-распределений, нормального распределения и распределения Пуассона. Поэтому значения рн и рв для двусторонней интервальной оценки можно выразить через квантили этих распределений.

Ввиду сложности биноминальной зависимости - высокий порядок шестой степени - рассмотрим данную зависимость в ППП Statistica 9.5.8.

 

From To CountTeoretic Count0,0658550,993452,2678310,1955869,451990,1888330,3253573,297512,0010220,4551759,941543,076290,5852137,9840,7594150,715618,651240,8581410,84567,0965780,0169450,97582,0923021,6680621,10530,4780071,33062суммы239319,986612,16716Midl0,287469 Midl Quatro0,257414

 

Замечание

Получение такого результата в программе Statistic 9.3. объясняется тем, что прежде, чем приступить к вычислению специальных статистических показателей, из исходной совокупности исключаются единицы, не подчиняющиеся общей закономерности распределения, так называемые выбросы. Выбросы - это значения признака, резко отличающиеся как в большую, так и в меньшую сторону, от значений признака основной части единиц совокупности .

Для локализации и устранения выбросов необходимо, прежде всего, ранжировать исходные данные. Затем, в ППП Statistic 9.5.8. строится график Box plot на основании ранжированной совокупности. Единицы совокупности, являющиеся выбросами, исключаются из изучаемой совокупности (данная процедура использовалась только для контроля получаемых результатов).

 

3.Определение доверительного интервала, в котором лежит значение вероятной величины

 

Определение доверительного интервала означает оценку для центра распределения. В качестве первичных оценок группирования значений случайных величин могут быть использованы различные предельные неравенства.

Неравенство Чебышева.

Неравенство Чебышева имеет вид:

 

 

где ? и ? - соответственно среднее значение и стандартное отклонение.

Из неравенства Чебышева следует, что

 

 

Таким образом, при ? = 0,95

х - ? х +

Х - 0,0693 ? Х + 0,0693

 

При х = :

 

,2844 - 0,0693 ? 0,2844 + 0,0693

,2151 ? 0,3537.

 

Это и есть искомый доверительный интервал.

Неравенство Кантелли.

 

Таким образом, при ? = 0,95

 

? 0,2844 - 0,27 = (х - 0,0619) = 0,2844 - 0,0619 = 0,2225 и

? 0,2844 + 0,27 = (х + 0,0148) = 0,2844 + 0,0148 = 0,2992.

 

Доверительный интервал:

 

Х - 0,0619 ? Х + 0,0148

При х =

,2225 ? 0,2992.

 

Неравенство Мейделя

 

Откуда

 

 

Тогда, ? = 0,272 + (0,2844 - 0,14)2 = 0,0520,

х - ? х + 0,95*0,052

Х - 0,0329 ? Х + 0,0329

,2515 ? 0,0,3173.

Вывод:

Последнее неравенство более точно.

Заключение

 

В курсовой работе были проанализированы данные о распределении проведенных. Для удобства анализа данные были представлены в виде группировочных таблиц с количеством интервалов n=9. Также для удобства анализа вариационного ряда используется графическое представление. В работе были использованы такие виды графиков, как полигон и гистограмма. Полигон, построенный на основе абсолютных частот, показывает форму распределения. Из рисунка видно, что распределение имеет одну вершину, форма его не симметрична, смещена к левому краю и довольно крута.

Также с помощью графика можно определить модальный интервал (0,00 - 0,13). Гистограмма позволяет сделать такие же выводы.

Центральная тенденция распределения характеризуется такими показателями, как среднее арифметическое значение, мода и медиана. Все показатели были определены с помощью программы Statistica по исходному ряду данных и вручную по сгруппированным данным. Среднее арифметическое значение вариационного ряда составило 0,2844 (по исходным данным) и 0,28747 (по группировочной таблице).

Медиана - это величина признака, делящая распределение на две равные части. По исходным данным медиана составила 0,24, а по сгруппированным данным - 0,2409.

Мода - это значение признака с наибольшей частотой. Ее значение составило 0,14. Очевидно, что и среднее арифметическое, и медиана принадлежат одному интервалу, но отличаются по значениям. Мода принадлежит другому интервалу. Это свидетельствует о несимметричности распределения относительно центра.

Вариация - это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. К показателям, характеризующим вариацию распределения, относятся размах вариации, дисперсия и среднее квадратическое отклонение и коэффициент вариации.

Размах вариации показывает амплитуду вариации и определяется как разница между максимальным и минимальным значением распределения и составляет 1,15.

Дисперсия признака представляет собой средний квадрат отклонений вариантов от их средней величины. Дисперсия, рассчитанная по исходным данным, составила 0,0729, а по сгруппированным - 0,0663. Более удобным для анализа показателем является среднее квадратическое отклонение, которое определяется как коре?/p>