Принято считать, что математика это царица наук и «зрелость науки обычно определяется тем, в какой мере она использует математику» (С. С. Стивенс)
Вид материала | Документы |
- Сочинение ученицы 7 класса «В» Шанько Полины «Математику уже затем учить надо, что, 36.51kb.
- Урок путешествие в математическую сказку, 5 класс, 41.6kb.
- А жил на белом свете царь-Федот, 215.55kb.
- Программа подраздела «Философские проблемы математики», 94.9kb.
- Дата проведения, 156.21kb.
- Программа по дисциплине "инновационный менеджмент" для студентов, 139.1kb.
- Сергей Петрович, принято считать, что ученые живут в башне из слоновой кости. Какие, 133.62kb.
- Организации, добивающиеся успеха, отличаются от противоположных им, главным образом, 56.93kb.
- Vi ежегодная практическая конференция «Налоговое консультирование в России. Что нас, 106.58kb.
- Программа-минимум кандидатского экзамена по специальности 09. 00. 08 «Философия науки, 183.75kb.
ОБЩИЕ ПРИНЦИПЫ ПРОВЕРКИ
СТАТИСТИЧЕСКИХ ГИПОТЕЗ
- Статистические гипотезы
Полученные в экспериментах выборочные данные всегда ограничены и носят случайный характер. Именно поэтому для анализа таких результатов используют математическую статистику.
В психологических исследованиях невозможно учесть все возможные влияния на элементы выборки, поэтому оценка параметров генеральной совокупности, сделанная на основании выборочных данных, как указывает О.Ю.Ермолаев, всегда будет сопровождаться погрешностью, и поэтому подобного рода оценки должны рассматриваться как предположительные, а не как окончательные утверждения. Такие предположения о свойствах и параметрах генеральной совокупности получили название статистических гипотез.
При проверки статистических гипотез используются два понятия: нулевая гипотеза и альтернативная гипотеза. Нулевая гипотеза (обозначение Ho) – это гипотеза о сходстве, альтернативная гипотеза (обозначение H1) – это гипотеза о различии.
Пример. Психолог измерил показатели IQ у детей из полных и неполных семей. Статистические гипотезы мы формулируем следующим образом: Ho – Статистически значимые различия в показателях IQ у детей из полных и неполных семей отсутствуют. H1 – Существуют статистически значимые различия в показателях IQ у детей из полных и неполных семей.
- Статистическая значимость
Уровень статистической значимости результата исследования (p-уровень) – это количественно выраженная вероятность, свидельствующая о том, что результаты достоверны. Уровнем значимости называется вероятность ошибочного отклонения нулевой гипотезы.
В психологии считается, что низшим уровнем статистической значимости является уровень p=0,05; достаточным – p=0,01; высшим – p=0,001.
Соотношение показателей p-уровня и степени значимости можно представить в виде таблицы 4.1. (по А.Д.Наследову)
Таблица 4.1.
Соотношение значимости и p-уровня (по А.Д.Наследову)
Уровень значимости | Возможный статистический вывод |
p > 0,1 | Статистически достоверные различия не обнаружены |
p ≤ 0,1 | Различия обнаружены на уровне статистической тенденции |
p ≤ 0,05 | Обнаружены статистически достоверные (значимые) различия |
p ≤ 0,01 | Различия обнаружены на высоком уровне статистической значимости |
p ≤ 0,001 | Различия обнаружены на высшем уровне статистической значимости |
Используя методы математической статистики, исследователь получает так называемую эмпирическую статистику (Кэмп. – коэффициент эмп.). Кэмп – это условное название. Полученную эмпирическую статистику необходимо сравнить с двумя критическими величинами, которые соответствуют рассмотренным выше уровням статистической значимости. Критические величины для используемых коэффициентов находятся в специальных таблицах.
Пример. Психолог рассчитал Кэмп и нашел по таблицам Ккр.
Для сравнения эмпирического и критический значений используемого критерия нужно воспользоваться «осью значимости».
«Ось значимости» представляет собой прямую, на левом конце которой располагается 0, хотя он, как правило, не отмечается на самой этой прямой, и слева направо идет увеличение числового ряда. Левая зона называется зоной незначимости, правая – зона значимости, а промежуточная зоной неопределенности. Границами всех трех зон являются для p = 0,05 и p = 0,01, как это показано ниже на рисунке 3.
О
Зона неопределенности
Зона незначимости 0,05 0,01 Зона значимости
сь значимости
Рисунок 3
П
Зона неопределенности
Зона незначимости 0,05 Кэмп. 0,01 Зона значимости
Кэмп. Кэмп
ример. Для принятия статистического решения нужно на оси значимости отметить эмпирическое значение коэффициента.
Если Кэмп. попало в зону незначимости, то принимается Н0. Если Кэмп. попало в зону неопределенности то принимается Н1 на 5% уровне статистической значимости. Если Кэмп. попало в зону значимости, то принимается Н1 на 1% уровне статистической значимости.
- Этапы принятия статистического решения
О.Ю.Ермолаев предлагает для принятия статистического решения выделять следующие этапы.
- Формулировка нулевой и альтернативной гипотез.
- Определение объема выборки N.
- Выбор соответствующего уровня значимости или вероятности отклонения нулевой гипотезы. Это может быть величина меньшая или равная 0,05 (5% уровень значимости). В зависимости от важности исследования можно выбрать уровень значимости в 0,1% или даже в 0,001%.
- Выбор статистического метода, который зависит от типа решаемой психологической задачи.
- Вычисление соответствующего эмпирического значения по экспериментальным данным, согласно выбранному статистическому методу.
- Нахождение по таблице для выбранного статистического метода критических значений, соответствующих уровню значимости для Р=0,05 и для Р=0,01.
- Построение оси значимости и нанесение на нее табличных критических значений и эмпирического значения. Для этого целесообразно пользоваться каждый раз приведенными выше рисунками.
- Формулировка принятия решения.
- Классификации психологических задач
Е.В.Сидоренко и О.Ю.Ермолаев предложили следующую классификацию задач и методов их решения (таблица 4.2.) [с.34]
Таблица 4.2.
Задачи | Условия | Методы |
|
| Критерий Макнамары Q критерий Розенбаума U критерий Манна-Уитни φ - критерий (угловое преобразование Фишера) |
| S критерий Джонкира H критерий Крускала-Уоллиса | |
Задачи | Условия | Методы |
|
| T критерий Вилкоксона G критерий знаков φ критерий (угловое преобразование Фишера) t –критерий Стьюдента |
| критерий Фридмана L критерий тенденций Пейджа t –критерий Стьюдента | |
|
| χ2 критерий Пирсона λ критерий Колмогорова - Смирнова t –критерий Стьюдента |
| χ2 критерий Пирсона λ критерий Колмогорова - Смирнова φ критерий (угловое преобразование Фишера) | |
|
| φ коэффициент корреляции Пирсона η корреляционное отношение Пирсона τ коэффициент корреляции Кендела ρ коэффициент ранговой корреляции Спирмена |
Тема 5
НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ ДЛЯ СВЯЗНЫХ ВЫБОРОК
Непараметрические критерии – это критерии, которые не базируются на предположении о типе распределения генеральной совокупности и не используют параметры этой совокупности (среднее, дисперсию и стандартное отклонение).
Связные выборки – это выборки, элементы которых находятся в какой-то зависимости.
5.1. Критерий знаков G
Критерий знаков G позволяет установить, насколько однонаправлено изменяются значения признака при повторном изменении связанной, однородной выборки.
При вычислении критерия знаков G рассчитываются «сдвиги». Сдвиг – это величина разности между показателями выраженности какого-либо признака одного и того же участника «после» и «до» какого-либо воздействия на признак. В результате получаем нулевые, положительные и отрицательные сдвиги. Отрицательные сдвиги не рассматриваются.
Для решения вопроса об изменении признака вводятся понятия типичного и нетипичного сдвига.
Типичный сдвиг – это сумма сдвигов, получившая наибольшее количество значений (отрицательных или положительных).
Нетипичный сдвиг – это сумма сдвигов, получившая наименьшее количество значений (отрицательных или положительных) и обозначается как Gэмп.
Пример. Психолог проводит коррекционно-развивающие занятия с первоклассниками, направленными на развитие произвольного внимания. Его задача – выяснить будет ли эффективным вариант коррекционно-развивающей программы для развития произвольного внимания. Для решения этой задачи психолог измерил по методике «корректурная проба» количество ошибок, которые допускали ученики до и после занятий по программе.
№ п/п | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
До | 24 | 12 | 42 | 30 | 40 | 55 | 50 | 52 | 50 | 22 | 33 | 78 | 79 | 25 | 12 |
После | 22 | 12 | 41 | 31 | 32 | 44 | 50 | 32 | 32 | 21 | 34 | 56 | 78 | 23 | 18 |
СДВИГ | -2 | 0 | -1 | 1 | -8 | -11 | 0 | -20 | -18 | -1 | 2 | -22 | -1 | -2 | 6 |
Общее число нулевых сдвигов –2;
Общее число положительных сдвигов – 3;
Общее число отрицательных сдвигов – 10.
Gэмп. = 3, так это наименьшее количество значений.
Оценка статистической достоверности различий по критерию знаков G производится по таблице критических значений для данного критерия.
Количество типичных сдвигов (n=10) показывает для какого n нужно искать критические значения критерия.
Отметим все полученные значения на оси значимости.
Зона незначимости
0,05 0,01
Gэмп =3 1 0
Полученное эмпирическое значение критерия знаков G попало в зону незначимости, следовательно, принимается нулевая гипотеза об отсутствии различий. А это значит, что вариант коррекционно-развивающей программы психолога не оказывает существенного влияния на развитие произвольного внимания и его необходимо доработать.
5.2. Парный критерий T–Вилкоксона
Критерий Т-Вилкоксона основан на ранжировании абсолютных величин разности между двумя рядами выборочных значений в первом и втором измерении. Для нахождения числового значения критерия Т необходимо помнить о типичных и нетипичных сдвигах.
Пример. Психолог разработал программу тренинга, направленного на снижение тревожности. Его задача – выяснить будет ли данный вариант тренинговой программы эффективен для снижения тревожности. Используя методику Тейлора, психолог измерил уровень тревожности до и после программы тренинга у 19 участников.
№ п/п | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 |
До | 24 | 12 | 42 | 30 | 40 | 55 | 50 | 52 | 50 | 22 | 33 | 78 | 79 | 25 | 28 | 16 | 17 | 12 | 25 |
После | 22 | 12 | 41 | 31 | 32 | 44 | 50 | 32 | 32 | 21 | 34 | 56 | 78 | 23 | 22 | 12 | 16 | 18 | 25 |
Сдвиг | -2 | 0 | -1 | 1 | -8 | -11 | 0 | -20 | -18 | -1 | 1 | -22 | -1 | -2 | -6 | -4 | -1 | 6 | 0 |
Абс. вел. сдвигов | 2 | 0 | 1 | 1 | 8 | 11 | 0 | 20 | 18 | 1 | 1 | 22 | 1 | 2 | 6 | 4 | 1 | 6 | 0 |
Ранг абс. в. сдвига | 10,5 | 2 | 6,5 | 6,5 | 15 | 16 | 2 | 18 | 17 | 6,5 | 6,5 | 19 | 6,5 | 10,5 | 13,5 | 12 | 6,5 | 13,5 | 2 |
| | | | * | | | | | | | * | | | | | | | * | |
Общая сумма нетипичных сдвигов – 3. В таблице в последней строке они отмечены звездочкой.
Для вычисления критерия Т Вилкоксона нужно сложить ранги нетипичных сдвигов.
Tэмп. = 6,5 + 6,5 + 13,5 = 26,5
По таблице критических значений находим критические значения критерия Т.
0,05 0,01 Зона значимости
53 38
Tэмп. = 26,5
Полученное эмпирическое значение критерия Т Вилкоксона попало в зону значимости, следовательно, принимается альтернативная гипотеза о наличии различий. А это значит, что вариант тренинговой программы психолога оказывает влияние на снижение уровня тревожности участников.
К непараметрическим критериям для связных выборок относятся еще критерий Фридмана; L критерий Пейджа и M критерий Макнамары [С.82-95]