Теория статистики
Вопросы - Экономика
Другие вопросы по предмету Экономика
?их квадратов:
Получаем вектор оценок b, где b=(b0 b1...bk)T.
Оценка ковариационной матрицы коэффициентов регрессии вектора b определяется из выражения:
,
где
51-52. Точечные и интервальные оценки парных, частных и множественных коэффициентов корреляции, проверка их значимости
Парный коэффициент корреляции характеризует меру статистической зависимости между величинами.
- парный коэффициент корреляции,
Частный коэффициент корреляции характеризует линейную связь между двумя переменными случайными величинами независимо от влияния остальных случайных переменных.
Точечные оценки:
;;
;
интервальные оценки:
для парных коэффициентов используют статистику Фишера:
, надежность , доверительный интервал:
,
- находится по таблице Лапласа для
Множественный коэффициент корреляции характеризует меру связи между одной случайной величиной и остальными. Множественный коэффициент детерминации (квадрат коэф-та корр-ции) показывает долю дисперсии случайной величины х, обусловленную изменением остальных случайных величин.
Точечные оценки:
;;;;;;
проверка значимости:
,
для множественного R v=n-p.
проверка значимости множественного коэффициента детерминации (а также и множественного коэффициента корреляции) осуществляется с помощью F-распределения. Вычисляется:
далее с заданным уровнем значимости ? и числами степеней свободы ?1=p-1, и ?2=n-p находим Fтабл. Если Fnabl>Fтабл, то гипотеза H0:?2=0 отвергается с вероятностью ошибки ?, то есть ?2 значимо отличается от нуля.
53. Факторный и компонентный анализ как методы снижения размерности
Компонентный и факторный анализы проводятся с несколькими целями. Как методы снижения размерности они позволяют выявить закономерности, которые непосредственно не наблюдаются. Эта задача решается по матрице нагрузок, как и классификация признаков в пространстве главных компонент (или общих факторов). А индивидуальные значения используются для классификации объектов (не по исходным признакам, а по главным компонентам или общим факторам) и для построения уравнения регрессии на эти обобщенные показатели. Интерпретируются главные компоненты и общие факторы, которым соответствуют дисперсии больше 1, и которые имеют хотя бы одну весомую нагрузку. Выбор критической величины, при превышении которой элемент матрицы нагрузок признается весовым и оказывает влияние на интерпретацию главной компоненты или общего фактора, определяется по смыслу решаемой задачи и может варьировать в пределах от 0,5 до 0,9 в зависимости от получаемых промежуточных результатов. Формальные результаты должны хорошо интерпретироваться.
Факторный анализ - более мощный и сложный аппарат, чем метод главных компонент, поэтому он применяется в том случае, если результаты компонентного анализа не вполне устраивают. Но поскольку эти два метода решают одинаковые задачи, необходимо сравнить результаты компонентного и факторного анализов, т.е. матрицы нагрузок, а также уравнения регрессии на главные компоненты и общие факторы, прокомментировать сходство и различия результатов.
Компонентный анализ предназначен для преобразования системы k исходных признаков, в систему k новых показателей (главных компонент). Главные компоненты не коррелированны между собой и упорядочены по величине их дисперсий, причем, первая главная компонента, имеет наибольшую дисперсию, а последняя, k-я, наименьшую. При этом выявляются неявные, непосредственно не измеряемые, но объективно существующие закономерности, обусловленные действием как внутренних, так и внешних причин.
Компонентный анализ является одним из основных методов факторного анализа. В задачах снижения размерности и классификации обычно используются m первых компонент (m< k).
Модель компонентного анализа имеет вид:
(1),
Где ai? - вес, факторная нагрузка, ?-ой главной компоненты на j-ой переменной; fi? - значение ?-й главной компоненты для i-го наблюдения (объекта), где ?=1,2,...,k.
При наличии результативного показателя Y может быть построено уравнение регрессии на главных компонентах.
Обычно для анализа используют m первых главных компонент, суммарный вклад которых превышает 60-70%.
Уравнение регрессии на главных компонентах строится по алгоритму пошагового регрессионного анализа, где в качестве аргументов используются главные компоненты, а не исходные показатели. К достоинству последней модели следует отнести тот факт, что главные компоненты не коррелированы. При построении уравнений регрессии следует учитывать все главные компоненты.
54. Кластерный анализ как метод многомерной классификации
Кластерный анализ наиболее ярко отражает черты многомерного анализа в классификации, факторный анализ - в исследовании связи.
Большое достоинство кластерного анализа в том, что он позволяет производить разбиение объектов не по одному параметру, а по целому набору признаков. Кроме того, кластерный анализ в отличие от большинства математико-статистических методов не накладывает никаких ограничений на вид рассматриваемых объектов, и позволяет рассматривать множество исходных данных практически произвольной природы.
Кластерный анализ позволяет рассматривать достаточно большой объем информации и резко сокращать, сжимать большие массивы социально-экономичес?/p>