Статистичний аналіз тенденцій захворюваності в Україні

Дипломная работа - Математика и статистика

Другие дипломы по предмету Математика и статистика

Тут ми позначили

 

(Y - X)(Y - Х) = Q, (- ?)ХХ( - ?) = Q2.

При цьому відношення

 

Q1/?2 = = (?i ~ N(0; ?2), ?i /? ~ N(0; 1)), Q2/?2 ~ .

Отже, Q = Q1 + Q2, Q1 ~ , Q2 ~ (n > p). Тому Q/?2 = Q1/?2 Q2/? ~ ~.

 

Теорема доведена.

Нехай лінійна модель регресії має вигляд Y = X? + ?, X = X(n p), rangX = p, ? ~ N(0; ?2I).

Необхідно оцінити параметр ?, при лінійних обмеженнях H: A? = c,

де А = А(q p) відома матриця, c = c(q1) відомий вектор. (1.1.16)

Обмеження (1.1.16) можна переписати у вигляді:

 

H: A? = c

H: ? = ,

 

де ai i-тий рядок матриці А

 

H: ai ? = ci , i = 1, 2, …, q.

 

Використаємо метод множників Лагранжа для розвязання цієї задачі.

В подальшому будемо використовувати такий вираз:

 

?1(a1? с1) + ?2(a2? с2) + … + ?q(aq? сq) =

= (?1, ?2, …, ?q) = ?(A? c) = (?(A? c)) =

= (A? c)? = (?A - c)? (1.1.17)

 

Мінімізуємо суму квадратів залишків ?? при лінійних обмеженнях H:

 

A? = c.

r = ?? + ?1(a1? с1) + … + ?q(aq? сq) = ?? + (?A - c)? = (Y X?)(Y X?) + (?A - c)? = (Y X?) (Y X?) + (?A - c)? = YY - YX? - ?XY + ?XX? + (?A - c)? = YY - 2?XY + ?XX? + ?A? - c?

 

З (1.1.18) випливає, що

 

XX? = XY - A?

= (XX)-1XY - (XX)-1A (1.1.20)

= - (XX)-1A (1.1.21)

 

Формулу (1.1.21) підставляємо в (1.1.19)

 

c = A = A- (XX)-1A

c - A= - (XX)-1A

(A(XX)-1A)-1(c - A) = -

Останнє підставляємо в (1.1.21)

 

= + (XX)-1A(A(XX)-1A)-1(c - A)

 

мінімізує ?? при обмеженнях A? = c.

 

1.2 F-критерій

 

Розглянемо лінійну модель Y =Х? + ?, в якій матриця X має розмір nр і ранг р, ? ~ Nn(0, ?2In). Нехай ми хочемо перевірити гіпотезу H: А? = c, де А - відома (qp) - матриця рангу q, а с - відомий (q1) - вектор. Позначимо

 

RSS = (Y X)(Y-X) = (n p)S2

RSSH = (Y XH)(Y-XH)

Де H = + (ХХ)-1А[А(ХХ)-1А]-1(с-А), (1.2.1)

 

і RSSH - мінімальне значення ?? при обмеженнях А? = с.

Теорема 1.2.1.

 

(I) RSSH - RSS = (А- c) [А (ХХ)-1 А]-1 (А- c),

(II) М [RSSH - RSS] = ?2q + (А? -с) [А(ХХ)-1А]-1(А? - с).

 

(III) Якщо гіпотеза Н: А? = с справедлива, то статистика

 

F =

 

має розподіл Фішера Fq,n-p (F-розподіл з q і n - p ступенями вільності відповідно).

(IV) Якщо с = 0, то статистика F приймає вигляд

 

F = ,

 

де РH - симетрична і ідемпотентна матриця і РНP = PРН = РН

Доведення.

(I) Спочатку доведемо тотожність:

 

||Y - XH||2 = ||Y - X||2 + ||X( - H)||2

 

Розглянемо

 

||X( - )||2 = (X( - ?))X( - ?) = ( - ?)XX ( - ?) = ( - H + H - ?)XX ( - H + H - ?) =

= ( - H)XX ( - H) + (H - ?)XX (H - ?) =

= 2((XX)-1A)XX(H - ?) = A(XX)-1 XX(H - ?) = A(H - ?) = (AH - A?) = (c c) = 0= (X(-H))X( - H) + (X(H - ?))X(H - ?) = ||X( - H)||2 + ||X(H- ?)||2.

 

Далі,

 

?? = (Y X?)(Y X?) = ||Y X?||2 = (Y - X)(Y - X) +

+ ( - ?)XX( - ?) = ||Y - X||2 + ||X( - ?)||2

Підставляємо

 

||X( - ?)||2:

?? = ||Y - X||2 + ||X( - H)||2 + ||X( - ?)||2

 

?? досягає мінімального значення при ||X( - ?)||2 = 0, тобто

 

X( - ?) = 0

 

? = , Х ? 0 (оскільки стовпці Х лінійно незалежні)

Покладаючи в ?? ? = , знаходимо

 

||Y - XH||2 = ||Y - X||2 + ||X( - H)||2

 

Тоді

 

RSSH RSS = (Y - XH)(Y - XH) (Y - X)(Y - X) =

= ||Y - XH||2 - ||Y - X||2 = ||X( - H)||2 = (X( - H))(X( - H)) =

= ( - H)XX( - H) =

= =

= ((XX)-1A(A(XX)-1A)-1(A - c))XX((XX)-1A(A(XX)-1A)-1(A - c)) =

= (A - c)(A(XX)-1A)-1A(XX)-1(XX)(XX)-1A(A(XX)-1A)-1(A - c) =

= (A - c)(A(XX)-1A)-1(A - c).

 

(II) Скористаємось лемою.

Нехай Y = Y(n1) - випадковий вектор, A(nn) = A - симетрична матриця. Якщо MY = ?, DY = ?, тоді

 

M(YAY) = tr(A?) + ?A?.

 

Раніше, доведено, що

 

~ Np(?, ?2(ХХ)-1), A ~ Nq(A?, ?2A(ХХ)-1A).

 

Позначимо Z = А - c і В = А(ХХ)-1А. Тоді

 

M[Z] = M(А c) = A - c = = А? c і

D[Z] = D(А c) = D[A] = ?2B

 

Тоді

 

M[RSSH - RSS] = M[ZВ-1Z] = tr[?2В-1В] + (А? - с) В-1(А? - с) =

= tr[?2Iq] + (A? c)B-1(A? c) =

= ?2q + (A? c)B-1(A? c). (1.2.2)

 

(III) Відомо, що ~ Nq(?,?2А(ХХ)-1), тоді

 

A ~ Nq(A?, ?2A(ХХ)-1A) і

А - с ~ Nq(A? - c, ?2A(ХХ)-1A),

, тоді .

 

Розглянемо (RSSH RSS)/?2

= (А - с) (D[А])-1(А - с),

 

Раніше доведено, що RSS/?2 ~ (теорема 1.1.6 (IV)), тоді статистика

 

 

при справедливій гіпотезі Н має вигляд [/q]/[/(n - р)]. Отже, якщо гіпотеза Н справедлива, то F ~ Fq,n-p.

(IV) Нехай у виразі (1.2.1) c = 0, тоді маємо

 

= X(H - (ХХ)-1А[А(ХХ)-1А]-1А) = X -

  1. X(ХХ)-1А[А(ХХ)-1А]-1А

    =

  2. = X(ХХ)-1 ХY - X(ХХ)-1А[А(ХХ)-1А]-1А(ХХ)-1 ХY =

={X(ХХ)-1X - X(ХХ)-1А[А(ХХ)-1А]-1А(ХХ)-1Х}Y= (Р-Р1)Y, (1.2.3)

 

Тобто

 

(1.2.4)

 

де РH - симетрична матриця. Спростивши вираз для матриці Р1, знаходимо, що Р1 симетрична і ідемпотентна і Р1Р = РР1 = Р1. Звідси одержуємо

 

= Р2 - Р1P РP1 + = P - 2P1 + P1 = P - P1 = PH (1.2.5)

PHP = (P - P1)P = P - P1 = PH (1.2.6)

 

і РРH = РH (останнє одержуємо транспонуванням).

Y - X = Y - X(ХХ)-1 ХY = Y(I - X(ХХ)-1 Х) = (I P)Y.

 

Тоді

 

RSS = (Y - X)(Y - X) = ((I P)Y)(I P)Y =

= Y(I P)(I P)Y = Y(In - Р)Y

 

Aналогічно

 

RSSH = (Y - XH)(Y - XH) = Y(In РH)Y. (1.2.7)

 

Таким чином,

 

RSSH RSS = Y(In РH)Y - Y(In - Р)Y = Y(I РH I + P)Y = Y(P РH)Y.

 

Отже,

 

 

Теорема доведена.

F критерій для перевірки гіпотези H: A? = c.

Гіпотезу H: A? = c відхиляють при

і не відхиляють в супротивному разі. Рівень значущості критерію ?.

 

1.3 Лінійна одновимірна регресія

 

Нехай Yi = ?0 + ?1xi + ?i (i = 1,2, …, n) і ми хочемо перевірити гіпотезу H: ?1 = 0. Тоді X = (In, x),

 

, ,

 

Підставляючи ці