Статистика измерений
Дипломная работа - Математика и статистика
Другие дипломы по предмету Математика и статистика
ие наблюдалось m = 79 раз (как в нашем случае), то несмещенной точечной оценкой максимальной правдоподобности параметра р является величина рn = m/n = 79/239 = 0.3305.
Плотность вероятности биноминального распределения имеет вид:
f(x) = px(1 - p)n - x
распределение имеет единственный параметр р.
Интервальная оценка: Интервальные оценки параметра р с доверительной вероятностью ? являются решениями уравнений Клоппера-Пирсона
= (1 - ?);
= (?);
В скобках приведены вероятности, соответствующие границам рн и рв односторонних доверительных интервалов.
Известно, что биноминальное распределение может быть аппроксимировано с помощью бета- и F-распределений, нормального распределения и распределения Пуассона. Поэтому значения рн и рв для двусторонней интервальной оценки можно выразить через квантили этих распределений.
Ввиду сложности биноминальной зависимости - высокий порядок шестой степени - рассмотрим данную зависимость в ППП Statistica 9.5.8.
From To CountTeoretic Count0,0658550,993452,2678310,1955869,451990,1888330,3253573,297512,0010220,4551759,941543,076290,5852137,9840,7594150,715618,651240,8581410,84567,0965780,0169450,97582,0923021,6680621,10530,4780071,33062суммы239319,986612,16716Midl0,287469 Midl Quatro0,257414
Замечание
Получение такого результата в программе Statistic 9.3. объясняется тем, что прежде, чем приступить к вычислению специальных статистических показателей, из исходной совокупности исключаются единицы, не подчиняющиеся общей закономерности распределения, так называемые выбросы. Выбросы - это значения признака, резко отличающиеся как в большую, так и в меньшую сторону, от значений признака основной части единиц совокупности .
Для локализации и устранения выбросов необходимо, прежде всего, ранжировать исходные данные. Затем, в ППП Statistic 9.5.8. строится график Box plot на основании ранжированной совокупности. Единицы совокупности, являющиеся выбросами, исключаются из изучаемой совокупности (данная процедура использовалась только для контроля получаемых результатов).
3.Определение доверительного интервала, в котором лежит значение вероятной величины
Определение доверительного интервала означает оценку для центра распределения. В качестве первичных оценок группирования значений случайных величин могут быть использованы различные предельные неравенства.
Неравенство Чебышева.
Неравенство Чебышева имеет вид:
где ? и ? - соответственно среднее значение и стандартное отклонение.
Из неравенства Чебышева следует, что
Таким образом, при ? = 0,95
х - ? х +
Х - 0,0693 ? Х + 0,0693
При х = :
,2844 - 0,0693 ? 0,2844 + 0,0693
,2151 ? 0,3537.
Это и есть искомый доверительный интервал.
Неравенство Кантелли.
Таким образом, при ? = 0,95
? 0,2844 - 0,27 = (х - 0,0619) = 0,2844 - 0,0619 = 0,2225 и
? 0,2844 + 0,27 = (х + 0,0148) = 0,2844 + 0,0148 = 0,2992.
Доверительный интервал:
Х - 0,0619 ? Х + 0,0148
При х =
,2225 ? 0,2992.
Неравенство Мейделя
Откуда
Тогда, ? = 0,272 + (0,2844 - 0,14)2 = 0,0520,
х - ? х + 0,95*0,052
Х - 0,0329 ? Х + 0,0329
,2515 ? 0,0,3173.
Вывод:
Последнее неравенство более точно.
Заключение
В курсовой работе были проанализированы данные о распределении проведенных. Для удобства анализа данные были представлены в виде группировочных таблиц с количеством интервалов n=9. Также для удобства анализа вариационного ряда используется графическое представление. В работе были использованы такие виды графиков, как полигон и гистограмма. Полигон, построенный на основе абсолютных частот, показывает форму распределения. Из рисунка видно, что распределение имеет одну вершину, форма его не симметрична, смещена к левому краю и довольно крута.
Также с помощью графика можно определить модальный интервал (0,00 - 0,13). Гистограмма позволяет сделать такие же выводы.
Центральная тенденция распределения характеризуется такими показателями, как среднее арифметическое значение, мода и медиана. Все показатели были определены с помощью программы Statistica по исходному ряду данных и вручную по сгруппированным данным. Среднее арифметическое значение вариационного ряда составило 0,2844 (по исходным данным) и 0,28747 (по группировочной таблице).
Медиана - это величина признака, делящая распределение на две равные части. По исходным данным медиана составила 0,24, а по сгруппированным данным - 0,2409.
Мода - это значение признака с наибольшей частотой. Ее значение составило 0,14. Очевидно, что и среднее арифметическое, и медиана принадлежат одному интервалу, но отличаются по значениям. Мода принадлежит другому интервалу. Это свидетельствует о несимметричности распределения относительно центра.
Вариация - это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. К показателям, характеризующим вариацию распределения, относятся размах вариации, дисперсия и среднее квадратическое отклонение и коэффициент вариации.
Размах вариации показывает амплитуду вариации и определяется как разница между максимальным и минимальным значением распределения и составляет 1,15.
Дисперсия признака представляет собой средний квадрат отклонений вариантов от их средней величины. Дисперсия, рассчитанная по исходным данным, составила 0,0729, а по сгруппированным - 0,0663. Более удобным для анализа показателем является среднее квадратическое отклонение, которое определяется как коре?/p>