Логарифмічно-лінійний аналіз

Контрольная работа - Математика и статистика

Другие контрольные работы по предмету Математика и статистика

? (p - 1) власних чисел відповідає гіпотезі лінійності звязку між категоризованими змінними; наступне за величиною значення ?k відповідає гіпотезі про складніший характер взаємозвязку змінних. Така інтерпретація компонент ?2 представляється можливою з причини того, що кожна подальша пара канонічних змінних є функцією першої перетвореної пари, а все розкладання ?2 є спадаючою послідовністю.

Можна показати, що традиційні методи звязків, засновані на критерії ?2, змішують різні за характером звязки і знайдена міра є середньою з різних звязків, що ігноруються за однією таблицею. Це випливає з виразу (3.6), який дозволяє будь-який показник щільності звязку подати через канонічні кореляції. Наприклад, коефіцієнт взаємної спряженості Чупрова виглядатиме так:

 

(3.7)

 

Таблиці 22 виділяються два власних числа матриці С. Оскільки перше дорівнює одиниці, то квадрат канонічної кореляції дорівнює квадрату коефіцієнта спряженості Пірсону:

 

(3.8)

 

Канонічні змінні дозволяють одержати якнайкраще, в сенсі деякого критерію, наближення коміркових частот таблиці спряженості. Як показали М. Кендалл і А. Стьюард, кожна спостережувана комірка може бути розбита на теоретичну частоту, яка відповідає гіпотезі про незалежність змінних, і адитивний внесок, повязаний з канонічною кореляцією:

 

(3.9)

 

де хik канонічна мітка для і-ого рядка к-го власного числа; yjk канонічна мітка для j-го стовпця і к-го власного числа.

Відповідно є можливість подати вихідну таблицю спряженості у вигляді серії таблиць, кожна з яких відповідає певній гіпотезі звязку змінних (тобто частоти таблиці, обчислені при тому або іншому власному числі ?k матриці С).

Існує ряд способів знаходження канонічних міток. Найшвидше приводить до мети наступний порядок дій: спочатку визначаються хik діленням кожної компоненти відповідного власного вектора на корінь квадратний з маргінальної частки; потім визначаються yjk шляхом усереднювання міток рядків для кожного j - й стовпця.

 

(3.10)

 

Набори міток хik і yjk, зважені за відповідними маргінальними частотами, мають нульові середні й одиничні дисперсії.

 

4. Побудова логарифмічної моделі

 

Логарифмічно лінійна модель системи з трьох змінних запишеться у вигляді:

 

?ijkABC (4.1)

 

де ln(nijk) очікувана частота чарунка (і, j, k) тривимірної таблиці спряженості, обчислена за умови незалежності змінних A, B, C; параметри ? визначають внесок у логарифм очікуваної частоти змінних як окремо , так і внаслідок їхньої взаємодії. Параметри ? логлінійної моделі задовольняють умовам:

 

(4.2)

 

Оцінки параметрів обчислюються за методом максимальної правдоподібності:

 

(4.3)

 

Точка в індексі означає середнє значення за цим індексом, так:

 

(4.4)

 

де nijk - частота комірки (і, j, k), яка спостерігається N число комірок таблиці спряженості.

Оцінка дисперсії параметра ? для насиченої моделі дорівнює

 

(4.5)

де ?iiZA = 1, якщо А належить групі змінних Z и , в супротивному разі ?iiZA = 0. Аналогічно обчислюються ?jjZB, ?kkZC.

Якщо поділити, знайдену в результаті розрахунків оцінку на оцінку його середнє квадратичного відхилення , то одержимо стандартизоване значення оцінки параметра. Це значення може бути використане для порівняння відносного внеску кожного параметра в nijk, тим самим для обчислення порівняльного значення впливу окремих змінних, кожному парний і множинному взаємозвязки.

Відзначається, що, крім з насиченої моделі стандартизовані параметри , рівні нулю, можна перейти до моделі, більш адекватної вихідних даних або апріорним припущенням про відносини між змінними.

Одержуємо модель ієрархічну за побудовою, оскільки модель врахована множинна взаємодія A, B, C, а це означає припущення існування звязків у будь-якій підгрупі зі складових "старших" взаємозвязок (ABC) змінних, і тому в модель включені такі параметри, як ?AB, ?BC, ?AC, ?A, ?B, ?C. Якщо ж передбачається, що між змінними немає взаємозвязків, то у модель не включається відповідний параметр ? . Порядок логлинейной моделі дорівнює найбільшому числу змінних.

Побудова моделі складається з наступних основних етапів: 1) означення порядку логлінійної моделі; 2) відбір параметрів заданого порядку для включення в підсумкову модель.

Логлінійна модель має порядок к, якщо будь-які до к + 1 і більше змінних одночасно незалежні. Тому для означення порядку моделі перевіряються гіпотези про незалежність будь-яких до к + 1 і більш змінних за допомогою критеріїв и (максимальної правдоподібності). Число ступенів вільності для обох статистик дорівнює n-p, де n число всіх комірок таблиці, а p число оцінюваних очікуваних частот за умови незалежності змінних.

Крім того, для кожного к-го порядку перевіряється гіпотеза про одночасну незалежність відповідних ним змінних за допомогою цих же критеріїв.

Так, для параметрів третього порядку перевіряється гіпотеза про відсутність потрійної взаємодії.

Спільна перевірка викладених вище гіпотез дозволяє визначити порядок моделі, що щонайкраще відбиває структуру взаємозвязків змінних.

Наступним етапом є відбір параметрів моделі, тобто включення в модель тільки тих параметрів, які відбивають істотні впливи й взаємодії змінних. Для розвязання цієї задачі (перевірки відповідної гіпотези) використовується критерій .

Спочатку обчислюється різниця значень критері?/p>