Числові характеристики випадкової величини. Моменти розподілу. Визначення їх за даними досліду

Вид материалаДокументы
Подобный материал:
1   2   3   4
§8. Кореляційна залежність.


При функціональній залежності двох змінних завдання однієї з них (аргумента ) однозначно визначає другу функцію. Але між величинами є зв’язок більш загального типу. Наприклад зріст і вага людини, працездатність і кваліфікація робітника. Такий зв’язок між змінними, при який на змінення однієї величини друга реагує зміненням свого закону розподілу, має назву статистичною. Якщо при цьому розподіл змінюється так,що зміщується його центр, тобто середнє значення випадкової величини, то залежність має назву кореляційною.

Щоб з’ясувати зв’язок між випадковими величинами Х та Y, роблять одночасні виміри обох ознак і для кожного з них складають варіаційний ряд. Нехай Х - навантаження на кріп, Y- зміщення контуру вибірки.


 


Збудуємо кореляційну таблицю. Шаг змінних вибираємо довільно,але так,щоб при підсумовуванні по горизонталі та вертикалі не було нулів в сумарних клітинах .

По змінній X= 10,= 2,= 6.

Спробуємо =6 (по x )=1 (по y).




Y\X

10

16

22

28

32



Сума рядків

2

















1

3






3









3

4









3







3

5












3




3

6













..

5

5



Сума стовбців.

1

3

3

3

5

n=15

=1





















Числа в клітинках таблиці визначає число появ пари X/Y, та - загальне число позначень Х та Y. n- об’єм вибірки.

Умовні середні знайдемо за формулою:


=; =


m- кількість рядів;

l- число стовбців.


X=10; == 2 ( 1 – кількість пар  2 – кількість ознак по y) .

X=16; == 3

X=22; == 4

X=28; == 5

X=32;== 6


Будуємо таблицю 2.



Х

10

16

22

28

32



2

3

4

5

6



1

3

3

3

5



Як бачимо, кожному значенню Х відповідає одна значення . Тобто, залежність  від Х є функціональна:

=f(x) ( 1 )


Це рівняння визначають кореляційну залежність Y від Х і має назву рівняння регресії.


8.2Лінійна кореляція . Метод найменших квадратів.


Нехай f(x) – лінійна функція,тобто лінію регресії шукають у ряді прямої

= ( 2 )

Параметриі  шукають за методом найменших квадратів:

Нехай в ході іспитів отримано n точок (). Висунемо вимогу,щоб пряма (2) була близька до всієї сукупності точок.Так як точки, як правило,не лежать на прямій (2), то підстановка координат ()в рівняння (2) приводе до нев’язки =--b, в загальному випадку

.

Величина F= характеризує сумарну похибку приближення даної сукупності точок (x;) до прямої (2) . Із зміною змінюється F,тобто

F=F(.

Підберемо  так,щоб сума квадратів відхилень точок () від прямої(2) була мінімальною, тобто щоб була мінімальна функція.


F==--b


  або


 ( 3 )


Так як пара значить () в табл.1 зустрічається  разів,то в (3) треба ввести множини,.

Якщо згадати що

=; = =;  - ( =() - =,

розв’язком системи (3) буде:

=  ; ( 4 )

-.

Рівняння регресії Y по Х буде:

 - = (x- ) . ( 5 )

Пряма Х по Y аналогічно:


 - =(y –  ( 6 )


 =r; = r;

 ( 7 )




 – коефіцієнт кореляції. │r│. Якщо r =о , то лінійної кореляції між Y та Х нема. При цьому , та і  =та= x, тобто умовні середини зберігають сталі значення. Чим ближче │r│ до 1, тим щільніше точки групуються коло прямих регресії.


8.3. Обробка кореляційної таблиці.


Поєднуючи (5) , (6), (7) рівняння регресії можна довести до вигляду:

= - та  = .

Збудуємо кореляційну таблицю. За новий початок візьмемо пару значень, котра має найбільшу частоту=5.

=32, =6.

Позначимо =32,.

Перейдемо до умовних варіантів:

=

= = 

== -3,7 == -4

= = -2,7 = = -3

= = -0,7 = = -2

= = -0,7 = = -1

= 0 


Цей перехід не змінює коефіцієнти:

R= - в нових змінних.


Складаємо добутки