Принято считать, что математика это царица наук и «зрелость науки обычно определяется тем, в какой мере она использует математику» (С. С. Стивенс)

Вид материалаДокументы

Содержание


Непараметрические критерии для несвязных выборок
В исследовании принимали участие 9 мальчиков и 11 девочек.
Полученное значение попало в зону неопределенности, а это значит, что мы принимаем альтернативную гипотезу на 5% уровне статисти
Количество ошибок по тесту дано в таблице.
Необходимо выстроить все значения по порядку и присвоить каждому значению ранг.
Подобный материал:
1   2   3   4   5   6   7   8
Тема 6

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ ДЛЯ НЕСВЯЗНЫХ ВЫБОРОК


6.1. Критерий U Вилкоксона - Манна - Уитни


Примером несвязных выборок служат экспериментальная и контрольная группы в формирующем эксперименте, т.е. характерной чертой несвязных выборок является то, что в них обязательно входят разные испытуемые.

При вычислении критерия U Вилкоксона - Манна – Уитни важны не числовые значения данных, а порядок их расположения.

Если бы нам пришлось сравнивать два множества элементов, которые расположены по возрастанию числовых величин и мы получили бы такой вид:

ххххххх ууууууууууу, то такое расположение является идеальным, а две выборки значимо различались бы между собой.

Критерий U Вилкоксона - Манна – Уитни основан на подсчете нарушений в расположении чисел в упорядоченном экспериментальном ряду по сравнению с идеальным рядом. Любое нарушение порядка идеального ряда называется инверсией. Одним нарушением (одной инверсией) считают такое расположение чисел, когда перед некоторым числом первого ряда, стоит только одно число второго ряда. Если перед некоторым числом первого ряда стоят два числа второго ряда – то возникают две инверсии и т.д.


Пример. Психологом были получены следующие результаты времени решения тестовых заданий по методике Ржичана в двух группах. В состав первой группы входили только мальчики, а в состав второй группы – только девочки. Психолога интересует вопрос, различается ли время затраченное на решение задач мальчиками и девочками.

В исследовании принимали участие 9 мальчиков и 11 девочек.

Время, затраченное на решение задач мальчиками: 16; 9; 11; 24; 48; 62; 52; 31; 44.

Время, затраченное на решение задач девочками: 12; 15; 64; 36; 42; 33; 15; 29; 42; 15; 33.

Упорядочим полученные результаты по возрастанию в каждой группе.

(Х): 9 11 16 24 31 44 48 52 62

(У): 12 15 15 15 29 33 33 36 42 42 64


9

11

12

15

15

15

16

24

29

31

33

33

36

42

42

44

48

52

62

64

х

х

у

у

у

у

х

х

у

х

у

у

у

у

у

х

х

х

х

у


Внесем полученные результаты в таблицу.


№1

№2

№3

№4

Мальчики (Х)

Девочки (У)

Инверсии (Х/У)

Инверсии (У/Х)

9

-

0

-

11

-

0

-

-

12

-

2

-

15

-

2

-

15

-

2

-

15

-

2

16

-

4

-

24

-

4

-

-

29

-

4

31

-

5




-

33

-

5

-

33

-

5

-

36

-

5

-

42

-

5

-

42

-

5

44

-

10

-

48

-

10

-

52

-

10

-

62

-

10

-

-

64

-

9

Сумма инверсий

53

46


Uэмп. = min (U(Х/У); U(У/Х)) = 46

Находим по таблице критических значений Uкр для n1=9 и n2=11..








Зона незначимости 0,05 0,01




Uэмп.=46 27 18


Значение попало в зону незначимости, значит, принимается нулевая гипотеза об отсутствии различий. А это означает, что пол не оказывает влияние на время решения тестовых заданий.


6.2. Q критерий Розенбаума


Критерий Q Розенбаума основан на сравнении двух упорядоченных, но не обязательно равных по численности рядов наблюдений.

Работа с критерием Розенбаума предполагает подсчет так называемых «хвостов». Потому этот критерий имеет также название – «критерий хвостов».

При рассмотрении критерия U – Вилкоксона – Манна – Уитни было введено понятие идеального ряда:

ххххххх

ууууууууууу (*)


Так как в расположении (*) между элементами обоих рядов нет пересечений (одинаковых элементов), то между этими рядами будет статистически значимые различия.

В том случае, если в сравниваемых рядах будут равные элементы, их следует размещать точно друг под другом. В этом случае два сравниваемых ряда можно расположить друг под другом следующими двумя эквивалентными способами (**) и (***):


xxxxx xxxxxxxxxx S

T yyyyyyyyyy yyyyy (**)


T nnnnnnnnnnn nnnnnnnnnnn (***)

zzzzzz zzzzzzzzzzzzzzzzz S


Q эмп. = T+S


После подсчета «хвостов» следует обратиться к таблице критических значений критерия Розенбаума для уровня статистической значимости p≤0,05 и p≤0,01 в соответствии с количеством испытуемых в сравниваемых выборках.


Пример. Используя тест Равена психолог измерил показатели интеллекта у двух групп учащихся из двух школ, территориально расположенных в разных районах города. Его интересует вопрос – будут ли обнаружены статистически значимые различия в показателях интеллекта, если в одной выборке 11 школьников, а в другой – 12.




T 96,100, 104, 104, 120, 120, 120, 120, 126, 130, 134

76, 82, 82, 84, 88, 96, 100, 102, 104, 110, 118, 120, S


Для решения задачи данные показателей интеллекта упорядочили и расположили одно множество под другим. В этом случае Т=5, а S=3. Значит Q эмп = 5+3=8


Критические значения для критерия Q находим по таблице для n1=11 и n2=12.





Соответствующая ось значимости имеет вид:




зона незначимости зона значимости

0,05 0,01


7 8 9











Полученное значение попало в зону неопределенности, а это значит, что мы принимаем альтернативную гипотезу на 5% уровне статистической значимости.

Таким образом, значения показателей интеллекта у учащихся, обучающихся в разных школах различаются на 5% уровне статистической значимости.


6.3. H критерий Крускала – Уоллиса


Критерий H применяется для оценки различий по степени выраженности анализируемого признака одновременно между тремя, четырьмя и более выборками. Он позволяет выявить сте­пень изменения признака в выборках, не указывая, однако, на направление этих изменений.

Критерий основан на том принципе, что чем меньше взаимопересечение выборок, тем выше уровень значимости Hэмп. . Сле­дует подчеркнуть, что в выборках может быть разное количество испытуемых, хотя в приведенных ниже задачах приводится рав­ное число испытуемых в выборках.

Работа с данными начинается с того, что все выборки услов­но объединяются по порядку встречающихся величин в одну вы­борку и значениям этой объединенной выборки проставляются ранги. Затем полученные ранги проставляются исходным выбо­рочным данным, и по каждой выборке отдельно подсчитывается сумма рангов. Критерий построен на следующей идее — если различия между выборками незначимы, то и суммы рангов не будут существенно отличаться одна от другой и наоборот.

Формула для расчета критерия Hэмп





Где N – общее число элементов в обобщенной выборке

 – число членов в каждой отдельной выборке

 – квадраты сумм рангов по каждой i-ой выборке.


Пример. Четыре группы испытуемых выполнили тест интеллектуальной лабильности Козловой в разных условиях. Задача в том, чтобы установить – зависит ли эффективность выполнения теста от условий. В каждой группе четыре испытуемых.

Количество ошибок по тесту дано в таблице.


испытуемых п/п

1 группа

2 группа

3 группа

4 группа

1

19

19

8

5

2

10

23

13

11

3

13

13

18

13

4

14

12

8

16

суммы












  1. Необходимо выстроить все значения по порядку и присвоить каждому значению ранг.




5

8

8

10

11

12

13

13

13

13

14

16

18

19

19

23

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

1

2,5

2,5

4

5

6

8,5

8,5

8,5

8,5

11

12

13

14,5

14,5

16



  1. Расставим полученные ранги в исходной таблице в соответствии с распределением на группы.

испытуемых п/п

1 группа

ранги

2 группа

ранги

3 группа

ранги

4 группа

ранги

1

19

14,5

19

14,5

8

2,5

5

1

2

10

4

23

16

13

8,5

11

5

3

13

8,5

13

8,5

18

13

13

8,5

4

14

11

12

6

8

2,5

16

12

суммы




38




45




26,5




26,5



  1. Проверим правильность ранжирования.


38+45+26,5+26,5=136 и 

Результаты равны, значит ранжирование проведено верно.

  1. По исходной формуле  рассчитаем эмпирическое значение критерия Н Крускала – Уолиса.




  1. При определении критических значений критерия Н применительно к четырем и более выборкам используют таблицу критических значений критерия хи-квадрат.
  2. Число степеней свободы γ = 4 - 1 = 3



  1. Строим ось значимости



Зона незначимости Зона значимости

0,05 0,01


2,61 7,81 11,34











  1. Полученное эмпирическое значение оказалось существенно меньше критического значения для 5% уровня. Следовательно, принимаем нулевую гипотезу. А это значит, что различий по показателю интеллектуальной лабильности по группам нет, т.е. условия не оказывают влияние на прохождение испытания.


К непараметрическим критериям для несвязных выборок относится еще, S критерий тенденций Джонкира.