Принято считать, что математика это царица наук и «зрелость науки обычно определяется тем, в какой мере она использует математику» (С. С. Стивенс)

Вид материалаДокументы

Содержание


Общие принципы проверки
Статистическая значимость
Различия обнаружены на уровне статистической тенденции
Различия обнаружены на высоком уровне статистической значимости
S критерий Джонкира H
Непараметрические критерии для связных выборок
5.1. Критерий знаков G
Нетипичный сдвиг
Общее число отрицательных сдвигов – 10.
Количество типичных сдвигов (n=10) показывает для какого n нужно искать критические значения критерия.
5.2. Парный критерий
Общая сумма нетипичных сдвигов – 3. В таблице в последней строке они отмечены звездочкой.
L критерий Пейджа и M
Подобный материал:
1   2   3   4   5   6   7   8
Тема 4

ОБЩИЕ ПРИНЦИПЫ ПРОВЕРКИ

СТАТИСТИЧЕСКИХ ГИПОТЕЗ


    1. Статистические гипотезы



Полученные в экспериментах выборочные данные всегда ограничены и носят случайный характер. Именно поэтому для анализа таких результатов используют математическую статистику.

В психологических исследованиях невозможно учесть все возможные влияния на элементы выборки, поэтому оценка параметров генеральной совокупности, сделанная на основании выборочных данных, как указывает О.Ю.Ермолаев, всегда будет сопровождаться погрешностью, и поэтому подобного рода оценки должны рассматриваться как предположительные, а не как окончательные утверждения. Такие предположения о свойствах и параметрах генеральной совокупности получили название статистических гипотез.

При проверки статистических гипотез используются два понятия: нулевая гипотеза и альтернативная гипотеза. Нулевая гипотеза (обозначение Ho) – это гипотеза о сходстве, альтернативная гипотеза (обозначение H1) – это гипотеза о различии.


Пример. Психолог измерил показатели IQ у детей из полных и неполных семей. Статистические гипотезы мы формулируем следующим образом: Ho – Статистически значимые различия в показателях IQ у детей из полных и неполных семей отсутствуют. H1Существуют статистически значимые различия в показателях IQ у детей из полных и неполных семей.


    1. Статистическая значимость

Уровень статистической значимости результата исследования (p-уровень) – это количественно выраженная вероятность, свидельствующая о том, что результаты достоверны. Уровнем значимости называется вероятность ошибочного отклонения нулевой гипотезы.

В психологии считается, что низшим уровнем статистической значимости является уровень p=0,05; достаточным – p=0,01; высшим – p=0,001.

Соотношение показателей p-уровня и степени значимости можно представить в виде таблицы 4.1. (по А.Д.Наследову)


Таблица 4.1.

Соотношение значимости и p-уровня (по А.Д.Наследову)


Уровень

значимости

Возможный статистический вывод

p > 0,1

Статистически достоверные различия не обнаружены

p ≤ 0,1

Различия обнаружены на уровне статистической тенденции

p ≤ 0,05

Обнаружены статистически достоверные (значимые) различия

p ≤ 0,01

Различия обнаружены на высоком уровне статистической значимости

p ≤ 0,001

Различия обнаружены на высшем уровне статистической значимости



Используя методы математической статистики, исследователь получает так называемую эмпирическую статистику (Кэмп. – коэффициент эмп.). Кэмп это условное название. Полученную эмпирическую статистику необходимо сравнить с двумя критическими величинами, которые соответствуют рассмотренным выше уровням статистической значимости. Критические величины для используемых коэффициентов находятся в специальных таблицах.


Пример. Психолог рассчитал Кэмп и нашел по таблицам Ккр.



Для сравнения эмпирического и критический значений используемого критерия нужно воспользоваться «осью значимости».

«Ось значимости» представляет собой прямую, на левом конце которой располагается 0, хотя он, как правило, не отмечается на самой этой прямой, и слева направо идет увеличение числового ряда. Левая зона называется зоной незначимости, правая – зона значимости, а промежуточная зоной неопределенности. Границами всех трех зон являются  для p = 0,05 и p = 0,01, как это показано ниже на рисунке 3.


О


Зона неопределенности

Зона незначимости 0,05 0,01 Зона значимости


 
сь значимости










Рисунок 3


П


Зона неопределенности

Зона незначимости 0,05 Кэмп. 0,01 Зона значимости


Кэмп.   Кэмп
ример.
Для принятия статистического решения нужно на оси значимости отметить эмпирическое значение коэффициента.









Если Кэмп. попало в зону незначимости, то принимается Н0. Если Кэмп. попало в зону неопределенности то принимается Н1 на 5% уровне статистической значимости. Если Кэмп. попало в зону значимости, то принимается Н1 на 1% уровне статистической значимости.


    1. Этапы принятия статистического решения

О.Ю.Ермолаев предлагает для принятия статистического решения выделять следующие этапы.
  1. Формулировка нулевой и альтернативной гипотез.
  2. Определение объема выборки N.
  3. Выбор соответствующего уровня значимости или вероятности отклонения нулевой гипотезы. Это может быть величина меньшая или равная 0,05 (5% уровень значимости). В зависи­мости от важности исследования можно выбрать уровень зна­чимости в 0,1% или даже в 0,001%.
  4. Выбор статистического метода, который зависит от типа реша­емой психологической задачи.
  5. Вычисление соответствующего эмпирического значения по эк­спериментальным данным, согласно выбранному статисти­ческому методу.
  6. Нахождение по таблице для выбранного статис­тического метода критических значений, соответствующих уровню значимости для Р=0,05 и для Р=0,01.
  7. Построение оси значимости и нанесение на нее табличных критических значений и эмпирического значения. Для этого целесообразно пользоваться каждый раз приведенными выше рисунками.
  8. Формулировка принятия решения.



    1. Классификации психологических задач

Е.В.Сидоренко и О.Ю.Ермолаев предложили следующую классификацию задач и методов их решения (таблица 4.2.) [с.34]


Таблица 4.2.

Задачи

Условия

Методы
  1. Выявление различий в уровне исследуемого признака
  1. Две выборки испытуемых

Критерий Макнамары

Q критерий Розенбаума

U критерий Манна-Уитни

φ - критерий (угловое преобразование Фишера)
  1. Три и больше выборок испытуемых

S критерий Джонкира

H критерий Крускала-Уоллиса

Задачи

Условия

Методы
  1. Оценка сдвига значений исследуемого признака
  1. Два замера на одной и той же выборке испытуемых

T критерий Вилкоксона

G критерий знаков

φ критерий (угловое преобразование Фишера)

t –критерий Стьюдента
  1. Три и более замеров на одной и той же выборке испытуемых

 критерий Фридмана

L критерий тенденций Пейджа

t –критерий Стьюдента
  1. Выявление различий в распределении признака
  1. При сопоставлении эмпирического распределения с теоретическим

χ2 критерий Пирсона

λ критерий Колмогорова - Смирнова

t –критерий Стьюдента
  1. При сопоставлении двух эмпирических распределений

χ2 критерий Пирсона

λ критерий Колмогорова - Смирнова

φ критерий (угловое преобразование Фишера)
  1. Выявление степени согласованности изменений
  1. Двух признаков

φ коэффициент корреляции Пирсона

η корреляционное отношение Пирсона

τ коэффициент корреляции Кендела

ρ коэффициент ранговой корреляции Спирмена



Тема 5

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ ДЛЯ СВЯЗНЫХ ВЫБОРОК


Непараметрические критерии – это критерии, которые не базируются на предположении о типе распределения генеральной совокупности и не используют параметры этой совокупности (среднее, дисперсию и стандартное отклонение).

Связные выборки – это выборки, элементы которых находятся в какой-то зависимости.


5.1. Критерий знаков G


Критерий знаков G позволяет установить, насколько однонаправлено изменяются значения признака при повторном изменении связанной, однородной выборки.

При вычислении критерия знаков G рассчитываются «сдвиги». Сдвиг – это величина разности между показателями выраженности какого-либо признака одного и того же участника «после» и «до» какого-либо воздействия на признак. В результате получаем нулевые, положительные и отрицательные сдвиги. Отрицательные сдвиги не рассматриваются.

Для решения вопроса об изменении признака вводятся понятия типичного и нетипичного сдвига.

Типичный сдвиг – это сумма сдвигов, получившая наибольшее количество значений (отрицательных или положительных).

Нетипичный сдвиг – это сумма сдвигов, получившая наименьшее количество значений (отрицательных или положительных) и обозначается как Gэмп.


Пример. Психолог проводит коррекционно-развивающие занятия с первоклассниками, направленными на развитие произвольного внимания. Его задача – выяснить будет ли эффективным вариант коррекционно-развивающей программы для развития произвольного внимания. Для решения этой задачи психолог измерил по методике «корректурная проба» количество ошибок, которые допускали ученики до и после занятий по программе.


п/п

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

До

24

12

42

30

40

55

50

52

50

22

33

78

79

25

12

После

22

12

41

31

32

44

50

32

32

21

34

56

78

23

18

СДВИГ

-2

0

-1

1

-8

-11

0

-20

-18

-1

2

-22

-1

-2

6

Общее число нулевых сдвигов –2;

Общее число положительных сдвигов – 3;

Общее число отрицательных сдвигов – 10.


Gэмп. = 3, так это наименьшее количество значений.


Оценка статистической достоверности различий по критерию знаков G производится по таблице критических значений для данного критерия.

Количество типичных сдвигов (n=10) показывает для какого n нужно искать критические значения критерия.





Отметим все полученные значения на оси значимости.




Зона незначимости

0,05 0,01




Gэмп =3 1 0


Полученное эмпирическое значение критерия знаков G попало в зону незначимости, следовательно, принимается нулевая гипотеза об отсутствии различий. А это значит, что вариант коррекционно-развивающей программы психолога не оказывает существенного влияния на развитие произвольного внимания и его необходимо доработать.


5.2. Парный критерий T–Вилкоксона


Критерий Т-Вилкоксона основан на ранжировании абсолютных величин разности между двумя рядами выборочных значений в первом и втором измерении. Для нахождения числового значения критерия Т необходимо помнить о типичных и нетипичных сдвигах.

Пример. Психолог разработал программу тренинга, направленного на снижение тревожности. Его задача – выяснить будет ли данный вариант тренинговой программы эффективен для снижения тревожности. Используя методику Тейлора, психолог измерил уровень тревожности до и после программы тренинга у 19 участников.



№ п/п

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

До

24

12

42

30

40

55

50

52

50

22

33

78

79

25

28

16

17

12

25

После

22

12

41

31

32

44

50

32

32

21

34

56

78

23

22

12

16

18

25

Сдвиг

-2

0

-1

1

-8

-11

0

-20

-18

-1

1

-22

-1

-2

-6

-4

-1

6

0

Абс. вел.

сдвигов

2

0

1

1

8

11

0

20

18

1

1

22

1

2

6

4

1

6

0

Ранг абс. в. сдвига

10,5

2

6,5

6,5

15

16

2

18

17

6,5

6,5

19

6,5

10,5

13,5

12

6,5

13,5

2













*



















*



















*





Общая сумма нетипичных сдвигов – 3. В таблице в последней строке они отмечены звездочкой.

Для вычисления критерия Т Вилкоксона нужно сложить ранги нетипичных сдвигов.

Tэмп. = 6,5 + 6,5 + 13,5 = 26,5


По таблице критических значений находим критические значения критерия Т.







0,05 0,01 Зона значимости




53 38

Tэмп. = 26,5

Полученное эмпирическое значение критерия Т Вилкоксона попало в зону значимости, следовательно, принимается альтернативная гипотеза о наличии различий. А это значит, что вариант тренинговой программы психолога оказывает влияние на снижение уровня тревожности участников.


К непараметрическим критериям для связных выборок относятся еще  критерий Фридмана; L критерий Пейджа и M критерий Макнамары [С.82-95]