АРТ-моделирование на фондовом рынке
Курсовой проект - Разное
Другие курсовые по предмету Разное
? или стандартной ошибкой оценивания:
(12)
Рассмотренные показатели качества линейной регрессионной модели являются абсолютными, поскольку размер дисперсии напрямую зависит от показателя y.
Среди относительных показателей качества регрессии основным является коэффициент детерминации.
Коэффициент детерминации вычисляют как отношение сумм квадратов:
(13) или . (14)
Коэффициент детерминации показывает долю объясненной уравнением регрессии дисперсии зависимой переменной и выражается в долях.
Коэффициент детерминации изменяется от 0 до 1. Высокое значение R2 говорит о том, что включенные в уравнение регрессии факторы в основном объясняют вариацию значений зависимого признака. Если же значение R2 невелико, то можно сделать вывод о том, что факторы, оказывающие существенное влияние на результирующий показатель, в уравнение регрессии не вошли.
Однако существует ряд ограничений, сужающих возможности применения данного показателя для анализа.
Прежде всего, коэффициент детерминации позволяет проводить сравнение различных линейных по параметрам регрессионных уравнений для одной и той же зависимой переменной.
Второе ограничение связано с количеством объясняющих переменных в модели. Сопоставимые уравнения регрессии зависимой переменной должны включать одинаковое число факторов и могут отличаться лишь составом независимых переменных. Ограничение по количеству объясняющих переменных обусловлено тем, что R2 является неубывающей функцией от числа включенных в регрессию факторов. Поэтому наряду с традиционным часто используют скорректированный коэффициент детерминации, позволяющий проводить сравнение линейных регрессионных уравнений с разным подмножеством факторов:
, (15)
где R2 - базовый коэффициент детерминации; n - объем выборки; q - число факторов в факторном наборе.
Еще одно требование связано с наличием свободного члена. Константа должна входить или отсутствовать одновременно во всех сравниваемых уравнениях.
Квадратный корень из R2 для линейной модели
(16)
представляет собой коэффициент множественной корреляции и характеризует тесноту связи совокупности факторов, включенных в уравнение регрессии, с исследуемым показателем.
Кроме того, дополнять оценку качества регрессионного уравнения следует проверкой значимости как параметров регрессии, так и самого регрессионного уравнения.
1). Проверка значимости параметров позволяет установить существенность влияния отдельных факторов на зависимую переменную.
Проверка значимости параметра предполагает проведение процедуры проверки гипотезы о том, что фактор x j не оказывает существенного влияния на зависимую переменную. Нулевую гипотезу относительно параметра модели формулируют следующим образом:
.
Альтернативная ей гипотеза утверждает, что ? j значимо отличается от нуля:
.
Статистика для проверки сформулированной гипотезы принимает вид:
. (17)
Если верна нулевая гипотеза, то статистика (17) имеет распределение Стьюдента. Расчетное значение t-статистики сравнивают с квантилью t-распределения t ?, ?, которая имеет параметры: ? - число степеней свободы,
? = n-p-1, p - число объясняющих переменных в уравнении регрессии; ? - уровень значимости.
Величина ? определяет надежность статистических выводов. Чем выше требования к надежности результатов, тем меньше должна быть величина ?.
Если расчетное значение t-статистики попадает в критическую для проверяемой гипотезы область | t | > t ?, ?, то параметр ? j значим, следовательно, фактор x j оказывает существенный вклад в вариацию зависимого признака. В противном случае, если | t | < t ?, ?, то влияние фактора несущественно и он может быть исключен из уравнения регрессии.
2). Целью поверки гипотезы о значимости уравнения регрессии является определение существенности влияния на зависимую переменную всех или хотя бы некоторых независимых переменных, включенных в регрессионную модель.
Нулевая гипотеза состоит в том, что все переменные x 1, x 2, …, x p не оказывают существенного влияния на зависимую переменную:
.
Альтернативная гипотеза утверждает, что, как минимум, одна из объясняющих переменных оказывает существенное влияние на объясняемую переменную и должна быть включена в регрессионную модель. Гипотеза может быть записана следующим образом:
.
Для проверки нулевой гипотезы используют F-критерий:
. (18)
Если верна нулевая гипотеза, то (18) имеет распределение с числом степеней свободы числителя ? 1 = p и числом степеней свободы знаменателя ? 2 = n - p - 1. Решение о значимости F-критерия принимают, задав некоторый уровень значимости ? и определив соответствующую параметрам ?, ? 1 и ? 2 квантиль распределения F ?, ? 1, ? 2. Если F F ?, ? 1, ? 2, то делают заключение, что выборочные данные не подтверждают основную гипотезу, все или некоторые объясняющие переменные существенно влияют на зависимую переменную.
Все рассмотренные показатели качества регрессионного уравнения определяют дальнейшее поведение исследователя: будет он пересм