Статистичний аналіз тенденцій захворюваності в Україні
Дипломная работа - Математика и статистика
Другие дипломы по предмету Математика и статистика
Тут ми позначили
(Y - X)(Y - Х) = Q, (- ?)ХХ( - ?) = Q2.
При цьому відношення
Q1/?2 = = (?i ~ N(0; ?2), ?i /? ~ N(0; 1)), Q2/?2 ~ .
Отже, Q = Q1 + Q2, Q1 ~ , Q2 ~ (n > p). Тому Q/?2 = Q1/?2 Q2/? ~ ~.
Теорема доведена.
Нехай лінійна модель регресії має вигляд Y = X? + ?, X = X(n p), rangX = p, ? ~ N(0; ?2I).
Необхідно оцінити параметр ?, при лінійних обмеженнях H: A? = c,
де А = А(q p) відома матриця, c = c(q1) відомий вектор. (1.1.16)
Обмеження (1.1.16) можна переписати у вигляді:
H: A? = c
H: ? = ,
де ai i-тий рядок матриці А
H: ai ? = ci , i = 1, 2, …, q.
Використаємо метод множників Лагранжа для розвязання цієї задачі.
В подальшому будемо використовувати такий вираз:
?1(a1? с1) + ?2(a2? с2) + … + ?q(aq? сq) =
= (?1, ?2, …, ?q) = ?(A? c) = (?(A? c)) =
= (A? c)? = (?A - c)? (1.1.17)
Мінімізуємо суму квадратів залишків ?? при лінійних обмеженнях H:
A? = c.
r = ?? + ?1(a1? с1) + … + ?q(aq? сq) = ?? + (?A - c)? = (Y X?)(Y X?) + (?A - c)? = (Y X?) (Y X?) + (?A - c)? = YY - YX? - ?XY + ?XX? + (?A - c)? = YY - 2?XY + ?XX? + ?A? - c?
З (1.1.18) випливає, що
XX? = XY - A?
= (XX)-1XY - (XX)-1A (1.1.20)
= - (XX)-1A (1.1.21)
Формулу (1.1.21) підставляємо в (1.1.19)
c = A = A- (XX)-1A
c - A= - (XX)-1A
(A(XX)-1A)-1(c - A) = -
Останнє підставляємо в (1.1.21)
= + (XX)-1A(A(XX)-1A)-1(c - A)
мінімізує ?? при обмеженнях A? = c.
1.2 F-критерій
Розглянемо лінійну модель Y =Х? + ?, в якій матриця X має розмір nр і ранг р, ? ~ Nn(0, ?2In). Нехай ми хочемо перевірити гіпотезу H: А? = c, де А - відома (qp) - матриця рангу q, а с - відомий (q1) - вектор. Позначимо
RSS = (Y X)(Y-X) = (n p)S2
RSSH = (Y XH)(Y-XH)
Де H = + (ХХ)-1А[А(ХХ)-1А]-1(с-А), (1.2.1)
і RSSH - мінімальне значення ?? при обмеженнях А? = с.
Теорема 1.2.1.
(I) RSSH - RSS = (А- c) [А (ХХ)-1 А]-1 (А- c),
(II) М [RSSH - RSS] = ?2q + (А? -с) [А(ХХ)-1А]-1(А? - с).
(III) Якщо гіпотеза Н: А? = с справедлива, то статистика
F =
має розподіл Фішера Fq,n-p (F-розподіл з q і n - p ступенями вільності відповідно).
(IV) Якщо с = 0, то статистика F приймає вигляд
F = ,
де РH - симетрична і ідемпотентна матриця і РНP = PРН = РН
Доведення.
(I) Спочатку доведемо тотожність:
||Y - XH||2 = ||Y - X||2 + ||X( - H)||2
Розглянемо
||X( - )||2 = (X( - ?))X( - ?) = ( - ?)XX ( - ?) = ( - H + H - ?)XX ( - H + H - ?) =
= ( - H)XX ( - H) + (H - ?)XX (H - ?) =
= 2((XX)-1A)XX(H - ?) = A(XX)-1 XX(H - ?) = A(H - ?) = (AH - A?) = (c c) = 0= (X(-H))X( - H) + (X(H - ?))X(H - ?) = ||X( - H)||2 + ||X(H- ?)||2.
Далі,
?? = (Y X?)(Y X?) = ||Y X?||2 = (Y - X)(Y - X) +
+ ( - ?)XX( - ?) = ||Y - X||2 + ||X( - ?)||2
Підставляємо
||X( - ?)||2:
?? = ||Y - X||2 + ||X( - H)||2 + ||X( - ?)||2
?? досягає мінімального значення при ||X( - ?)||2 = 0, тобто
X( - ?) = 0
? = , Х ? 0 (оскільки стовпці Х лінійно незалежні)
Покладаючи в ?? ? = , знаходимо
||Y - XH||2 = ||Y - X||2 + ||X( - H)||2
Тоді
RSSH RSS = (Y - XH)(Y - XH) (Y - X)(Y - X) =
= ||Y - XH||2 - ||Y - X||2 = ||X( - H)||2 = (X( - H))(X( - H)) =
= ( - H)XX( - H) =
= =
= ((XX)-1A(A(XX)-1A)-1(A - c))XX((XX)-1A(A(XX)-1A)-1(A - c)) =
= (A - c)(A(XX)-1A)-1A(XX)-1(XX)(XX)-1A(A(XX)-1A)-1(A - c) =
= (A - c)(A(XX)-1A)-1(A - c).
(II) Скористаємось лемою.
Нехай Y = Y(n1) - випадковий вектор, A(nn) = A - симетрична матриця. Якщо MY = ?, DY = ?, тоді
M(YAY) = tr(A?) + ?A?.
Раніше, доведено, що
~ Np(?, ?2(ХХ)-1), A ~ Nq(A?, ?2A(ХХ)-1A).
Позначимо Z = А - c і В = А(ХХ)-1А. Тоді
M[Z] = M(А c) = A - c = = А? c і
D[Z] = D(А c) = D[A] = ?2B
Тоді
M[RSSH - RSS] = M[ZВ-1Z] = tr[?2В-1В] + (А? - с) В-1(А? - с) =
= tr[?2Iq] + (A? c)B-1(A? c) =
= ?2q + (A? c)B-1(A? c). (1.2.2)
(III) Відомо, що ~ Nq(?,?2А(ХХ)-1), тоді
A ~ Nq(A?, ?2A(ХХ)-1A) і
А - с ~ Nq(A? - c, ?2A(ХХ)-1A),
, тоді .
Розглянемо (RSSH RSS)/?2
= (А - с) (D[А])-1(А - с),
Раніше доведено, що RSS/?2 ~ (теорема 1.1.6 (IV)), тоді статистика
при справедливій гіпотезі Н має вигляд [/q]/[/(n - р)]. Отже, якщо гіпотеза Н справедлива, то F ~ Fq,n-p.
(IV) Нехай у виразі (1.2.1) c = 0, тоді маємо
= X(H - (ХХ)-1А[А(ХХ)-1А]-1А) = X -
- X(ХХ)-1А[А(ХХ)-1А]-1А
=
= X(ХХ)-1 ХY - X(ХХ)-1А[А(ХХ)-1А]-1А(ХХ)-1 ХY =
={X(ХХ)-1X - X(ХХ)-1А[А(ХХ)-1А]-1А(ХХ)-1Х}Y= (Р-Р1)Y, (1.2.3)
Тобто
(1.2.4)
де РH - симетрична матриця. Спростивши вираз для матриці Р1, знаходимо, що Р1 симетрична і ідемпотентна і Р1Р = РР1 = Р1. Звідси одержуємо
= Р2 - Р1P РP1 + = P - 2P1 + P1 = P - P1 = PH (1.2.5)
PHP = (P - P1)P = P - P1 = PH (1.2.6)
і РРH = РH (останнє одержуємо транспонуванням).
Y - X = Y - X(ХХ)-1 ХY = Y(I - X(ХХ)-1 Х) = (I P)Y.
Тоді
RSS = (Y - X)(Y - X) = ((I P)Y)(I P)Y =
= Y(I P)(I P)Y = Y(In - Р)Y
Aналогічно
RSSH = (Y - XH)(Y - XH) = Y(In РH)Y. (1.2.7)
Таким чином,
RSSH RSS = Y(In РH)Y - Y(In - Р)Y = Y(I РH I + P)Y = Y(P РH)Y.
Отже,
Теорема доведена.
F критерій для перевірки гіпотези H: A? = c.
Гіпотезу H: A? = c відхиляють при
і не відхиляють в супротивному разі. Рівень значущості критерію ?.
1.3 Лінійна одновимірна регресія
Нехай Yi = ?0 + ?1xi + ?i (i = 1,2, …, n) і ми хочемо перевірити гіпотезу H: ?1 = 0. Тоді X = (In, x),
, ,
Підставляючи ці