Общая теория статистики
Методическое пособие - Математика и статистика
Другие методички по предмету Математика и статистика
в единичных случаях, а в массе, что требует для исследования наличия значительного количества данных (не менее 15-20).
Задачи корреляционного анализа
1. Определение формы связи между факторными и результативными признаками (выбор математического уравнения, например, y = a+bx);
2. Определение параметров математического уравнения (a, b, c,…- коэффициенты регрессии).
. Оценка тесноты связи между факторными и результативными признаками;
. Оценка качества полученного уравнения (модели).
Способы выбора формы связи между факторными и результативными признаками
1. Путём теоретического анализа взаимосвязи между изучаемыми признаками.
. При помощи аналитической группировки.
. Графическое изображение показателей (графический анализ).
. Графическое изображение корреляционной таблицы.
Схема №7: Классификация корреляционной зависимости
v vпарная - корреляционная зависимость между двумя признаками: 1. прямолинейная (линейная) отображается уравнением: y = a+bx 2. криволинейная: 2.1. параболическая: y = a+bx+cx2 2.2. гиперболическая: y = a+b • 1/x 2.3. степенная: y = axbмногофакторная - корреляционная зависимость между несколькими признаками, отображается следующими уравнениями: y = a+bx1+cx2+dx3 y = ax1b • x2c • x3d…
Для составления парной корреляционно-регрессионной модели (= a+bx) нам необходимо определить коэффициенты регрессии (a, b, c,…). Для этого составим систему уравнений, выразив один коэффициент через другой, и решим её.
Правило составления алгоритма системы уравнений
1. Составим квадратичную матрицу из коэффициентов регрессии.
. Слева, отступив на столбец и строку, сверху - на строку и столбец, запишем наши неизвестные.
. Перемножим неизвестные слева и сверху на коэффициенты регрессии. Первый элемент первой строки умножим на n - количество наблюдений.
Показатели корреляции
Для того, чтобы убедиться в статистической значимости уравнения регрессии, необходимо оценить тесноту связи, т.е. разброс фактических данных в поле корреляции или отклонение фактических данных от теоретической линии регрессии.
1. При прямолинейной парной зависимости теснота связи оценивается по парному коэффициенту корреляции: или .
Коэффициент корреляции имеет пределы: .
Если , то существует Если r=0, то связь отсутствует.
функциональная зависимость.
r=1 r=-1 r=0
Если r > 0, то связь прямая; если r < 0, то связь обратная.
Коэффициент корреляции характеризует корреляционную зависимость.
Оценка тесноты связи
Если: r < 0,1 - связь отсутствует;
,1 ? r ? 0,3 - связь слабая;
,3 ? r ? 0,5 - связь заметная;
,5 ? r ? 0,7 - связь умеренная;
,7 ? r ? 0,9 - связь высокая;
,9 ? r ? 0,99 - связь весьма высокая.
. При криволинейной зависимости теснота связи оценивается индексом корреляции:
.
. Чтобы учесть колеблемость отдельных факторов и привести их в единую систему измерения (освободиться от различной размерности), рассчитываются ? коэффициенты: .
Они показывают, на сколько сигм (средних квадратических отклонений) изменится результатирующий показатель при изменении x на 1 сигму (СКО).
. Коэффициент эластичности показывает, на сколько процентов изменится результатирующий показатель, при изменении x на 1%: .
. Коэффициент детерминации: ,
. - эмпирическое корреляционное отношение.
Лекция 11. Выборочное наблюдение
Выборочное наблюдение - способ несплошного наблюдения, при котором обсуждается не вся совокупность, а лишь часть её, отобранная по определённым правилам выборки и обеспечивающая получение данных, характеризующих всю совокупность.
Таблица №6: Выборочное наблюдение
генеральная совокупностьвыборкасредняя величинаотносительная величина?Pдисперсия S2коэффициент корреляцииRNK(n)
Ошибки выборочного наблюдения называются ошибками репрезентативности. Размер ошибки выборки т методы её определения зависят от вида и схемы отбора.
статистика вариация дисперсия корреляция регрессия
Таблица №7: Ошибки выборочного наблюдения
способы отбораошибкидля многозначного признакадля альтернативного признакаповторный отборсредняяпредельнаябесповторный отборсредняяпредельная
Различают четыре вида отбора совокупности единиц наблюдения:
. Случайный - жеребьёвки (тиражи выигрышей).
. Механический - вся совокупность разбивается на равные по объёму группы по случайному признаку, затем из каждой группы берётся одна единица.
. Типический - совокупность разбивается по существенному типическому признаку на качественно однородные группы, затем из каждой группы выделяется количество единиц пропорционально удельному весу группы. Типический отбор даёт более точные результаты, чем случайный и механический.
. Серийный (гнездовой) - отбору подлежат не отдельные единицы совокупности, а целые группы (серии, гнёзда), отобранные случайным и механическим способами. В каждой группе проводится сплошное наблюдение, а результаты переносятся на всю совокупность.
Точность выборки зависит и от схемы отбора. Выборка может быть проведена по схеме повторного и бесповторного отбора.
Повторный отбор - каждая отобранная единица и серия возвращается во всю совокупность и может вновь попасть в выборку, что представляет собой схему возвращённого шара.
Бесповторный отбор - каждая обследованная единица из?/p>