Статистическая основа принятия решений
Контрольная работа - Математика и статистика
Другие контрольные работы по предмету Математика и статистика
Статистическая основа принятия решений
1. Выборки к генеральной совокупности: оценка параметра и построение доверительных интервалов
Сформировать практические навыки постановки и реализации статистического процесса для поддержки менеджерского решения. Освоить способы сбора, обработки, анализа и визуализации статистической информации на практике. Научиться соотносить управленческие задачи с массивами данных. Сформировать навыки статистического анализа в Excel.
Для выполнения проекта, я выбрал данные, отражающих рейтинг районов Москвы по стоимости квартир в марте 2010 года
РайонЦена в марте 2010 года (долл./м2)Арбат8155Тверской8056Китай-город7723Парк культуры7644Хамовники7204Якиманка6921Дорогомилово6337Красносельский6097Мещанский5950Беговой5752Пресненский5576Замоскворечье5575Гагаринский5516Таганский5467Донской5386Сокольники5077Аэропорт5028Басманный4975Марьина Роща4960Черемушки4903Крылатское4882Проспект Вернадского4808Нижегородский4790Алексеевский4746Динамо4682Академический4666Тропарево-Никулино4638Хорошевский4572Коньково4449Филевский4362Останкинский4343Хорошево-Мневники4335Зюзино4161Войковский4139Кунцево4105Соколиная гора4103Бутырский, Тимирязевский4101Даниловский4100Нагатинский4094Строгино4076Свиблово4068Чертаново4052Южнопортовый4042Можайский4030Преображенское4006Куркино3987Покровское-Стрешнево3946Медведково3908Очаково-Матвеевское3897Ясенево3896Бабушкинский3892Лефортово3832Левобережный3808Теплый Стан3806Тушино3795Отрадное3794Измайлово3782Москворечье-Сабурово, Царицыно3767Головинский3765Митино3660
Данные взяты с сайта www.raiting.rbc.ru. Было отобрано 60 районов Москвы. Таким образом, объём выборки равен 60. Вычисления произведены в Microsoft Excel и приложены к анализу.
Статистические законы распределения
) Рассматриваемая случайная величина является непрерывной, поэтому для определения статистического закона распределения данной случайной величины был построен интервальный статистический ряд. Для построения статистического ряда необходимо вычислить некоторое величины - число интервалов, на которое разбивается рассматриваемый отрезок исходных величин, частоты.
Максимальное значение8155Минимальное значение3660Количество интервалов6Длина интервала749,1667Объём выборки60
Интервальный статистический ряд имеет вид:
Начало промежуткаКонец промежуткаЧастота3660,004409,17310,524409,175158,33140,235158,335907,5060,105907,506656,6730,056656,677405,8320,037405,838155,0040,07
Частота была посчитана с помощью средства Excel Гиcтограмма.
) Для построения эмпирической функция распределения, которая служит оценкой теоретической функции распределения, были посчитаны следующие значения:
Начало промежуткаКонец промежутка-?3660,0003660,004409,170,524409,175158,330,755158,335907,500,855907,506656,670,906656,677405,830,937405,838155,001,008155,00+?1,00
Далее мы построили график эмпирической функции - кумуляту, имеющую следующий вид:
3) Для построения гистограммы, мы нашли для нашей случайной непрерывной величины эмпирическую плотность распределения. Были посчитаны следующие значения:
Начало промежуткаКонец промежутка3660,004409,170,000694409,175158,330,000315158,335907,500,000135907,506656,670,000076656,677405,830,000047405,838155,000,00009
С помощью этих значений мы построили график функции эмпирической плотности - гистограмму:
. Оценивание параметров распределения
) Затем мы вычисляли оценки математического ожидания, дисперсии, среднеквадратического отклонения, ассиметрии и эксцесса, для вычисления которых использования средство Excel Описательная статистика.
Итоговая статистикаСреднее4803,116667Стандартная ошибка149,7236439Медиана4352,5Стандартное отклонение1159,754359Дисперсия выборки1345030,173Эксцесс1,601423954Асимметричность1,506908437Интервал4495Минимум3660Максимум8155Сумма288187Счет60
Таким образом, средняя цена в регионах Москвы в марте 2010 равна 4803,116667 долл./м2. Цена варьируется от 3,5 до 6 тысяч долл./м2. Наименьшая цена за этот период составила 3660 в Митино, наибольшая - 8155 на Арбате.
) Для интервального оценивания параметров распределения были построены доверительные интервалы. Возьмём доверительную вероятность равную 0,95.
Доверительная вероятность ?0,95Ф(С)0,475C?=1,96
Для выборки большого объемаДля математического ожидания? = P {x - S*С?/v(n-1) < m < x + S*С?/v(n-1)}Лев. граница интервала m1 =Прав. граница интервала m2 =
Для дисперсии? = P{S2/|1 + С?*v2/(n-1)| < ?2 < S2/|1 - С?*v2/(n-1)|}Лев. граница интервала v1 =Прав. граница интервала v2 =
Для выборки малого объемаДля математического ожидания? = P {x - t??n-1*S/ v(n-1)< m < x + t?, n-1*S/v(n-1)}Лев. граница интервала m1 =Прав. граница интервала m2 =Для дисперсии? = P{(n-1)*S2/??2, n-1 < ?2 < (n-1)*S2/??1, n-1}Лев. граница интервала v1 =Прав. граница интервала v2 =
3. Статистическая проверка гипотез
7) После визуального изучения кумуляты, гистограммы и анализа полученных оценок числовых характеристик мы выдвинули гипотезу о том, что функция распределена по нормальному закону и проверили по критерию Пирсона и по критерию Колмагорова.
Ho:с. в. распределена по нормальному закону с параметрами m=4803,116667и s= 1159,754359Ha:с. в. не распределена по нормальному закону с параметрами m=4803,116667и s= 1159,754359
Мы знаем, что выдвигая гипотезу о классе закона распределения случайной величины по критерию Пирсона мы сначала строим интервальный статистический ряд, а затем вычисляем выборочную статистику:
началоконецF(xi)F (xi+1)pi вероятностьli частотаn pin pi - li(n pi - li)^2/ n pi-?p>