А. С. Гринберг О. Б. Плющ Б. В. Новыш Теория вероятностей и математическая статистика Курс лекций

Вид материалаКурс лекций

Содержание


Особенности изучения теории вероятностей и математической статистики менеджером
Краткие сведения
Средним квадратическим отклонением
Нормальный закон распределения
Доверительным интервалом
Подобный материал:
1   2   3   4   5   6   7   8   9   ...   26

Особенности изучения теории вероятностей и математической статистики менеджером


В арсенале средств менеджмента значительное место занимают методы принятия решения, основывающиеся на теории вероятностей и математической статистике. Рассматривая различные ситуации в экономике, социологии, мы имеем дело с явлениями, на которые оказывает влияние множество факторов, многие из них не поддаются строгому учету и контролю. Влияние этих факторов вызывает некоторый неконтролируемый разброс (случайное рассеяние) фиксируемых на ряде однородных объектов количественных признаков, будь то качество продукции, производительность технологической линии, объем валовой продукции предприятия, продолжительность какой-либо технологической операции или заработок отдельных рабочих.

Объективное суждение менеджера о закономерностях такого рода процессов (часто называемых стохастическими или вероятностными), выбор и обоснование решения возможны лишь на основе вероятностно – статистического анализа исследуемого явления.

Краткие сведения


Теория вероятностей – математическая дисциплина, изучающая закономерности в случайных явлениях. Математическая статистика – наука о математических методах систематизации и использования статистических данных для научных и практических выводов, опирающаяся на теорию вероятностей.

Объектами изучения теории вероятностей и математической статистики являются случайные события, величины и функции, которые характеризуют рассматриваемое случайное явление. Случайным в теории вероятностей называют событие, которое при данном испытании, в данном опыте может либо произойти, либо не произойти и для которого имеется определенная вероятность его наступления. Случайными являются следующие события: выигрыш на один билет денежной лотереи, соответствие контролируемого продукта установленным требованиям, безотказная работа автомобиля в течение первого месяца его эксплуатации, выполнение подрядчиком суточного графика работ.

Вероятность случайного события , обозначаемая – числовая мера степени возможности появления данного события при определенных условиях. При этом всегда .

Событие называется достоверным, если в результате опыта оно обязательно произойдет. Его вероятность равна единице.

Событие называется невозможным, если в результате опыта оно не может произойти; его вероятность равна нулю.

Степень близости события к 1 или к 0, достаточная для того, чтобы считать его практически достоверным или практически невозможным, зависит от последствий ошибки: чем серьезнее последствия, тем меньше должно быть отличие вероятности события от 1(0), позволяющее считать это событие практически достоверным (практически невозможным). Наибольшее значение отличия вероятности от 1(0), при котором событие может считаться практически достоверным (практически невозможным) называется уровнем значимости и обозначается через ; он задается в зависимости от последствий ошибки. В экономике принимают равным 0,10 (десяти процентный уровень) или 0,05 (пятипроцентный уровень). На практике уровень значимости обычно принимают равным 0,05 (пятипроцентный уровень) или 0,01 (однопроцентный уровень).

Суммой нескольких событий называется событие, заключающееся в появлении хотя бы одного из них. Несколько событий называются несовместимыми в данном опыте, если никакие два из них не могут появиться одновременно.

Согласно теореме сложения вероятностей вероятность суммы несовместимых событий равна сумме вероятностей этих событий.



Если в каком-то опыте может произойти либо событие , либо событие , то событие называют противоположным событию , и обозначают , считая что:

.

Например, событие «невыполнение автобусным парком суточного графика выхода автобусов на линию» противоположно событию «выполнение этого графика».

Два события называются независимыми, если вероятность одного из них не зависит от того, произошло ли другое событие. События зависимы, если появление одного из них изменяет появление другого.

Вероятность события при условии, что произошло событие , называется условной вероятностью события и обозначается . Если событие независимо от события , то условная вероятность события совпадает с его условной вероятностью, т.е. . Согласно теореме умножения вероятностей, если события и независимы, то вероятность совместного появления этих событий равна произведению этих вероятностей:

.

Если же эти события зависимы, то:



Все вышесказанное обобщается и для большего числа событий.

Зависимость двух случайных событий часто порождается не причинным характером, а общими факторами, оказывающими влияние на оба этих события при отсутствии причинной связи между ними.

Вероятность случайного события определяется разными способами:
  • непосредственный подсчет вероятности события;
  • экспериментальное определение вероятности события как предела относительной частоты (частости) его появления в серии опытов при увеличении их числа;
  • вычисление вероятности одного события по известным вероятностям других событий, с ним связанных;
  • экспертная оценка величины вероятности событий.

Первый способ применяется тогда, когда опыт, в результате которого событие может появиться или не появиться, достаточно прост.

Экспериментальное определение вероятности события широко применяется на практике и заключается в подсчете относительной частоты, или частости появления события в серии проведенных опытов , где – число появления события в данной серии опытов, а – общее число опытов в серии.

Частость принимают за приближенную оценку вероятности , тем более точную и надежную, чем больше . Предел, к которому стремится частость при неограниченном увеличении числа опытов , принимается за величину вероятности события.

Для определения вероятности в экономических и производительных процессах используются статистические данные, собранные в процессе функционирования исследуемого объекта.

Экспертная оценка вероятности события состоит в назначении специалистами – экспертами ее предполагаемой величины на основе личного опыта.

Случайность событий, с которыми встречаются на практике менеджеры, не означает, что этими событиями нельзя управлять. Величина вероятностей случайных событий поддается контролю. Сделать событие – достижение заданных значений показателей – практически достоверным – это и есть задача менеджера.

Случайной называется такая величина, которая в зависимости от случайного исхода опыта принимает с определенными вероятностями те или иные значения. Случайными являются, например:
  • число сбоев в поставках за месяц;
  • число изделий, забракованных приемщиком продукции за день;
  • время выполнения заданной работы;
  • фактическая урожайность определенного сорта картофеля;
  • Показатели работы малого предприятия (производительность труда, прибыль, фондоотдача и др.).

Они изменяются во времени и заранее, до подведения итогов, их точные значения назвать нельзя.

Разброс случайных значений случайной величины может быть достаточно узок, и тогда им можно пренебречь; однако это может привести и к ошибкам при больших разбросах. Из приведенных примеров случайных величин две – дискретные, или прерывные, они могут быть перечислены, пронумерованы; все последующие примеры относятся к непрерывным случайным величинам, которые могут принимать любые значения, лежащие в некотором диапазоне.

В результате опыта случайная величина принимает конкретное значение, которое называется реализацией случайной величины.

Полной характеристикой случайной величины является закон распределения – соотношение, устанавливающее связь между возможными значениями случайной величины и их вероятностями. Простейшей формой задания закона распределения дискретной случайной величины с конечным числом возможных ее значений является ряд распределения – таблица, в которой приведены все возможные значения случайной величины и проставлены вероятности , с которыми она принимает каждое из этих значений. Ряд с упорядоченными значениями случайной величины называется упорядоченным, или вариационным, а график называется полигоном распределения.

Для непрерывных случайных величин по результатам наблюдения строят ступенчатую кривую – гистограмму; число ее столбиков равно числу интервалов , на которые разбит весь диапазон полученных при испытаниях значений случайной величины.

Плотность вероятности есть предел отношения вероятности попадания случайной величины в интервал между и к длине этого интервала при безграничном уменьшении его длины



Другой формой закона распределения случайной величины является функция распределения случайной величины , т.е. вероятность события , рассматриваемая как функция любого фиксированного значения величины .

Вероятность попадания значения случайной величины в заданный интервал () определяется по формуле , если закон распределения задан плотностью вероятности .

Часто для описания случайной величины достаточно знать лишь некоторые ее числовые характеристики, описывающие основные свойства закона распределения этой величины. Наиболее широко применяются:
  • среднее значение или математическое ожидание случайной величины;
  • дисперсия и среднее квадратическое отклонение случайной величины.

Математическое ожидание характеризует положение случайной величины на числовой оси и принимается за среднее значение, вокруг которых происходит разброс возможных значений случайной величины. При малом разбросе возможных значений случайной величины относительно ее математического ожидания можно им пренебречь и считать, что данная величина полностью характеризуется ее математическим ожиданием, т.е. она неслучайна. Если же математическое ожидание мало, а разброс велик, то пренебрежение им, т.е. неучет случайности данной величины, приведет к недопустимым ошибкам.

Математическое ожидание суммы случайных величин равно сумме математических ожиданий слагаемых .

При известном законе распределения значение математического ожидания определяется по формуле при задании закона распределения дискретной случайной величины, и по формуле при задании закона распределения непрерывной случайной величины плотностью вероятности.

При неизвестном законе распределения по результатам наблюдения может быть получена оценка математического ожидания , называемая статистической средней.

Если полученные значения не сгруппированы, то расчет ведут по формуле:

,

где – общее число полученных значений случайной величины , которые могут повторяться.

Дисперсия, обозначаемая или , и среднее квадратическое отклонение , являются характеристиками рассеивания случайной величины, т.е. разброса ее возможных значений вокруг математического ожидания.

Дисперсией называется математическое ожидание квадрата отклонения случайной величины от ее математического ожидания:

.

Средним квадратическим отклонением называется положительный квадратный корень из дисперсии . Чем больше дисперсия (и среднее квадратическое отклонение), тем больше рассеивание случайной величины. Дисперсия неслучайной величины равна нулю.

Для оценки интервала возможных отклонений случайной величины служит правило средних квадратических отклонений:



вероятность отклонения любой случайной величины от ее математического ожидания более чем на в любую сторону не превышает . С вероятностью не меньшей можно считать, что все возможные значения любой случайной величины лежат в диапазоне .

Дисперсия суммы независимых случайных величин равна сумме дисперсий этих величин .

Для оценки рассеивания случайной величины служит коэффициент вариации . Если он велик, то это говорит о высоком разбросе значений случайной величины и о больших резервах в управлении случайной величиной.

Наиболее часто используемые законы распределения случайных величин:
  • для дискретных случайных величин – это:
  • распределение Бернулли (биномиальное распределение);
  • распределение Пуассона;
  • для непрерывных случайных величин – это:
  • закон равномерной плотности;
  • показательный закон (экспоненциальное распределение);
  • нормальный закон распределения.

Биномиальное распределение (закон распределения Бернулли) описывает повторяющиеся независимые опыты. Этот закон определяет появление события раз при независимых испытаниях, если вероятность появления события в каждом из этих опытов не изменяется от опыта к опыту. Вероятность:

,

где: – известная вероятность появления события в опыте, не изменяющаяся от опыта к опыту;

– вероятность непоявления события в опыте;

– заданное число появления события в опытах;

– число сочетаний из элементов по .

Математическое ожидание для биномиального закона распределения , а дисперсия – .

Биномиальное распределение широко используется при выборочном методе контроля продукции, т.к. определяет вероятность извлечения из партии продукции заданного количества бракованных изделий при известной доле брака.

Закон Пуассона – предельный случай биномиального распределения, которое превращается в биномиальное распределение, если число опытов бесконечно возрастает, а вероятность появления в каждом из опытов стремится к нулю, причем, их произведение стремится к постоянному числу .

Вероятность того, что случайная величина примет случайное значение , определяется выражением

,

где – параметр закона Пуассона.

По закону Пуассона распределены:
  • число вызовов, поступивших на АТС за единицу времени;
  • число некондиционных изделий в выборке при малой вероятности брака и большом объеме партии;
  • количество отказов технического устройства в единицу времени;
  • количество заявок на обслуживание, поступивших в единицу времени.


Закон равномерной плотности используется, если нет оснований считать, что одни значения случайной величины более вероятны, чем другие, во всем диапазоне () ее возможных значений; поэтому в этом диапазоне. Время наступления некоторого события (например, поставки комплектующих) может в первом приближении считаться распределенным равномерно, если известны лишь крайние сроки, но нет никакой информации, уточняющей время наступления данного события.

Математическое ожидание для закона равномерной плотности , а среднеквадратичное отклонение – .

Нормальный закон распределения (закон Гаусса) имеет наиболее широкое применение в теории вероятностей и математической статистике. К нормальному распределению близки распределения ошибок измерений, отклонения от номиналов значений характеристик изделий массового изготовления и т.д. Нормальный закон распределения полностью определяется двумя параметрами – математическим ожиданием и среднеквадратическим отклонением .

Аналитическое выражение нормального закона имеет вид:



Все значения случайной величины при нормальном распределении лежат с точностью до долей процента в интервале 3, вероятность попадания в который превышает 0,97.

Вероятность попадания нормально распределенной случайной величины в интервал 2 составляет более 0,95.

Для определения вероятности нормально распределенной случайной величины на участок применяется формула , где и – значения функции распределения случайной величины при и , соответственно.

Функция распределения нормально распределенной случайной величины имеет вид:



Для вычисления вероятности попадания на заданный участок используют таблицы интеграла вероятности:



Функция распределения нормально распределенной случайной величины с любыми значениями и связана с выражением:

.

Показательный закон (экспоненциальное распределение) выражается формулой , где , , . Этот закон принят для распределения случайного времени между двумя событиями, например:
  • промежутков между поступлениями двух заявок на обслуживание;
  • отказами технического устройства;
  • время погрузки или разгрузки;
  • время, затраченное на ремонт аппаратуры и т.д.

Математическая статистика основывается на выборочном методе. Множество элементов объекта статистического обследования, обладающих общим свойством, называется генеральной совокупностью, если наблюдению подвергаются все элементы генеральной совокупности, и выборочным, если наблюдению подвергается лишь некоторая доля элементов генеральной совокупности. Количество элементов, составляющих выборку, называется объемом выборки. Выборка имеет ценность, если она правильно отражает основные свойства генеральной совокупности. Статистическую оценку параметров распределения проводят в два этапа. Сначала по выборке получают одно приближенное значение – точечную оценку некоторого оцениваемого параметра , например, оценку математического ожидания , а затем определяют точность и надежность этой оценки.

К точечной оценке предъявляется ряд требований. Она обязательно должна быть:
  1. состоятельной (при увеличении объема выборки значение оценки должно стремиться (по вероятности) к истинному значению оцениваемого параметра );
  2. несмещенной, т.е. чтобы ее математическое ожидание было равно оцениваемому параметру ;
  3. эффективной, т.е. иметь минимальную дисперсию.

За оценку вероятности события принимают его частость, за оценку математического ожидания – среднее значение полученных реализаций случайной величины .

Для построения интервальной оценки задаются малой вероятностью – уровнем значимости (или доверительной вероятностью ) и по полученной точечной оценке и объему выборки находят доверительный интервал.

Доверительным интервалом называется такой интервал значений оценки , который включает неизвестное истинное значение оцениваемого параметра с заданной вероятностью , называемой доверительной вероятностью:



– такая малая вероятность выхода истинного значения оцениваемого параметра за пределы интервала , которой можно пренебречь.

Доверительный интервал характеризует точность оценки параметра, а доверительная вероятность – ее надежность: чем больше доверительная вероятность, тем шире доверительный интервал при одном и том же объеме выборки, т.е. выигрывая в надежности оценки, проигрываем в ее точности и наоборот.

Для определения доверительного интервала необходимо знать закон распределения оценки .

Статистической гипотезой называется суждение, предположение, высказанное о вероятности события, какой-либо числовой характеристике или законе распределения случайной величины. Гипотеза называется параметрической, если она высказывается относительно значения числовой характеристики (вероятности, математического ожидания или дисперсии). Гипотеза о характере распределения случайной величины называется непараметрической. При проверке параметрической гипотезы по выборке вычисляется оценка числовой характеристики, о значении которой была выдвинута гипотеза и находится доверительный интервал при заданной доверительной вероятности и при допущении, что гипотеза верна, т.е. интервал строится относительно предполагаемого гипотетического значения характеристики. При проверке нулевой гипотезы возможны ошибки двух родов:
  • ошибка первого рода, когда гипотеза истинна, а мы ее отбрасываем;
  • ошибка второго рода, когда принимаем ложную в действительности гипотезу.

Вероятность ошибки первого рода равна уровню значимости . Вероятность ошибки второго рода тем больше, чем меньше вероятность ошибки первого рода. Для случая выборочного контроля качества продукции вероятность ошибки первого рода называется риском поставщика, а вероятность ошибки второго рода – риском потребителя. Для проверки непараметрической гипотезы используются критерии согласия.

На практике часто приходится иметь дело не с одной случайной величиной, а с совокупностью случайных величин , рассматриваемых совместно.

Наиболее общим видом зависимости между случайными величинами является вероятностная зависимость. Наиболее часто учитываемым случаем вероятностной зависимости является корреляционная, при которой математическое ожидание одной из них функционально зависит от значения, принятого другой случайной величиной.

Уравнение , выражающее зависимость математического ожидания случайной величины от , где – некоторая функция от , называется уравнением регрессии по , а график этой функции – линией регрессии.

Коэффициент корреляции двух случайных величин и , есть:

,

где – взаимный корреляционный момент, или ковариация случайных величин и .

При =0 между и отсутствует линейная связь как функциональная, так и корреляционная.

При 0<<1 между и есть линейная корреляционная зависимость: при изменении одной случайной величины математическое ожидание другой изменяется по закону, близкому к линейному.

Коэффициент корреляции является показателем линейной корреляционной связи и применим лишь при нормальном распределении случайных величин.

Коэффициент корреляции отличен от нуля в следующих случаях:
  • когда причинно зависит от ;
  • когда причинно зависит от ;
  • когда и непосредственно не влияют друг на друга, но совместно зависят от одного или нескольких общих факторов, причинно влияющих на и ;
  • если имеет место простое совпадение согласованности изменений и , характеризующие совершенно несвязанные значения.

Регрессией называется функциональная зависимость математического ожидания одной случайной величины (результативного признака) от значений, которые приняли одна или несколько других случайных (или неслучайных, но изменяющихся) вели-
чин – факториальных признаков или факторов. Минимально допустимый объем выборки, при котором оценка уравнения регрессии может быть использована для практических выводов, определяется соотношением , где – число учитываемых факторов.

Чаще всего используют линейную функцию для описания уравнения регрессии, показывающей, на сколько единиц изменится среднее значение результативного признака при изменении фактора на единицу.

Коэффициент линейной регрессии и постоянная находятся по формулам:

, , где и .

Проверка значимости или адекватности уравнения регрессии проводится по критерию Фишера:

, где – дисперсия регрессии,

– суммарная полная дисперсия случайной величины , – остаточная дисперсия, – линия регрессии.

Точность аппроксимации с помощью линии регрессии можно считать удовлетворительной, если

.

Теперь рассмотрим эти вопросы подробнее.