Принято считать, что математика это царица наук и «зрелость науки обычно определяется тем, в какой мере она использует математику» (С. С. Стивенс)

Вид материалаДокументы

Содержание


Описательные статистики
Мода – это такое числовое значение, которое встречается в выборке наиболее часто. Мода обозначается – Мо. Пример.
В ряду 10, 11, 11, 11, 12, 13, 14, 14, 14, 17 модами явля­ются значения 11 и 14. В таком случае говорят, что выбор­ка является б
2.2. Меры положения
2.3. Меры изменчивости
Нормальный закон распределения
Рис. 1. Кривая нормального распределения с границами стандартных отклонений
Разработка тестовых шкал
Задания для самостоятельной работы
Методы статистического вывода
Подобный материал:
1   2   3   4   5   6   7   8
Тема 2

ОПИСАТЕЛЬНЫЕ СТАТИСТИКИ


2.1. Меры центральной тенденции


Мера центральной тенденции – это число, характеризующее выборку по уровню выраженности измеренного признака.

Существуют три способа определения «центральной тенденции», каждому из которых соответствует своя мера: мода, медиана и выборочное среднее.

Мода – это такое числовое значение, которое встречается в выборке наиболее часто. Мода обозначается – Мо.


Пример. В ряду значений (12, 16, 16, 18, 19, 19, 19, 20) мо­дой является 19, потому что 19 встречается чаще любого другого числа. Обратите внимание, что мода представляет собой наибо­лее часто встречающееся значение (в данном примере это 19), а не частоту встречаемости этого значения (в данном примере рав­ную 3).

В ряду (5, 5, 6, 6, 7, 7) моды нет.

В выборке 1, 2, 2, 2, 5, 5, 5, 6 частоты рядом расположенных значений 2 и 5 совпадают и равняются 3. эта частота больше, чем частота других значений 1 и 6 (у которых она равна 1). Следовательно, модой этого ряда будет величина - (2+5) = 3,5

В ряду 10, 11, 11, 11, 12, 13, 14, 14, 14, 17 модами явля­ются значения 11 и 14. В таком случае говорят, что выбор­ка является бимодальной.


Медианаэто значение, которое делит упорядоченное (ранжированое) множество данных пополам. Обозначается медиана как Х с волной или Md и определяется как величина, по отношению к которой по крайней мере 50 % выборочных значений меньше неё и по крайней мере 50 % - больше.

Пример. Найдем медиану выборки 7; 14; 12; 19;. 5; 9; 11. Сначала упорядочим выборку по величине входящих в неё значений. 5; 7; 9; 11; 12; 14; 19. Поскольку в выборке 7 элементов, то четвертый будет иметь значение большее, чем первые три, и меньшее, чем последние три. Таким образом, медианой будет четвертый элемент – 11

Найдем медиану выборки 3; 7; 2; 6; 9; 11. Упорядочим выборку: 2; 3; 6; 7; 9; 11. Поскольку здесь имеется четное число элементов, то существует две «середины» ­6 и 7. В этом случае медиана определяется как среднее арифме­тическое этих значений. Мd=(6+7)|2=6,5

Среднее – (Мх – выборочное среднее, среднее арифметическое) – определяется как сумма всех значений измеренного признака, деленная на количество суммированных значений (формула 1).


 (1)

Пример. Психолог измерил уровень тревожности у учащихся 5-х классов в ситуации проверки знаний по Филипсу. Получил следующие результаты: 12; 27; 38; 26; 45; 32. Для вычисления среднего результата по группе необходимо сложить все значения 12+27+38+26+45+32=180 и полученную сумму разделить на количество элементов (на 6). Мх=30.


2.2. Меры положения


В психологии используются помимо мер центральной тенденции меры положения, которые называются квантилями распределения. Квантиль распределения – это точка на числовой оси измеренного признака, которая делит всю совокупность упорядоченных измерений на две группы с известным соотношением их численности.

Медиана – это значение, которое делит упорядоченное (ранжированое) множество данных на две группы с равной численностью.

Процентиль – это 99 точек – значений признака (Р1, Р2, Р3, … Р99), которые делят упорядоченное (по возрастанию) множество наблюдений на 100 равных частей, равных по численности.

Квартили – это 3 точки – значения признака (Р25, Р50, Р75), которые делят упорядоченное (по возрастанию) множество наблюдений на 4 равные по численности части. Первый квартиль соответствует 25 процентилю, второй – 50 процентилю и медиане, третий квартиль соответствует 75 процентилю.


2.3. Меры изменчивости


Меры изменчивости позволяют охарактеризовать выраженность индивидуальных различий испытуемых по измеренному признаку. Меры изменчивости применяются в психологии для численного выражения величины межиндивидуальной вариации признака.

Размах (разброс) разность между максимальной и минимальной величинами конкретного вариационного ряда, т.е.

R=Xmax – Xmin

Пример. Для определения размаха выборку необходимо упорядочить (по возрастанию). Нам дано множество данных: 4, 5, 6, 6, 7, 13, 13, 25, 25, 27, 30. Размах равен разности между наибольшим и наименьшим значениями, т.е. 30 – 4 = 26.


Дисперсия – это мера разброса данных относительно среднего значения. Дисперсия представляет собой наиболее часто использующуюся меру рассеяния случайной величины (переменной).


 (2)


n - объем выборки

i - индекс суммирования

Mx - среднее, вычисляемое по формуле (1)

Пример. Вычислим дисперсию ряда: 4, 6, 8, 10, 12.
  1. Найдем среднее значение: (4+6+8+10+12)/5= 8
  2. Вычислим величины  для каждого элемента: 4-8=-4; 6-8=-2;

8-8=0; 10-8=2; 12-8=4. Если сложить все полученные величины, то получиться 0, а это значит, мы вычислили все верно.
  1. Для того, чтобы избавиться от нуля, получаемого при сложении полученных величин, каждую величину возведем в квадрат.

= 16+4+0+4+16=40
  1. =10 – это и есть искомая дисперсия


Стандартное отклонение – (сигма, среднеквадратичное отклонение) – положительное значение квадратного корня из дисперсии.


 (3)


Пример. Для того, чтобы вычислить стандартное отклонение в предыдущем примере, нам необходимо извлечь квадратный корень из величины дисперсии, а именно =3,16


Тема 3

НОРМАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ

И ЕГО ПРИМЕНЕНИЕ

    1. Понятие нормального распределения


Каждому психологическому свойству соответствует свое распределение генеральной совокупности. Нормальное распределение является одним из важнейших в математической статистике, поскольку многие статистические методы предполагают, что, анализируемые с их помощью экспериментальные данные распределены нормально. Нормальное распределение (называемое также распределением Гауса) характеризуется тем, что крайние значения признака в нем встречаются достаточно редко, а значения, близкие к средней величине, – часто.

Нормальное распределение имеет колоколообразную форму, значения моды, медианы и среднего арифметического равны (рис. 1).




Рис. 1. Кривая нормального распределения с границами стандартных отклонений1

Эмпирическим путем было установлено, что многие биологические параметры распределены в соответствии с законом нормального распределения (рост, вес и т.д.). Впоследствии психологи выяснили, что большинство психологических свойств (показатели IQ, темпераментные особенности и т.д.) также распределены нормально.

Характерное свойство нормального распределения состоит в том, что 95,44% всех наблюдений лежат диапазоне ± 2σ (два стандартных отклонения) от среднего арифметического, т.е. в этом диапазоне располагаются значения, относящиеся к статистической норме.


    1. Разработка тестовых шкал


В ходе выполнения психологических исследований экспериментатор получает исходные тестовые оценки, т.е. количество ответов на те или иные вопросы тестовых методик, время или количество решенных задач и т.д. Они называются первичными, или «сырыми» баллами.

Для того, чтобы сравнить результаты, полученные в ходе диагностики с использованием разных методик, необходимо провести процедуру стандартизации. Стандартизация или z – преобразование данных – это перевод измерений в стандартную Z-шкалу (Мz=0, σz=1) (формула 4).


 (4)


Различают множество стандартных тестовых шкал, основное назначение которых – представление индивидуальных результатов тестирования в удобном для интерпретации виде.

Для того, чтобы избавиться от неизбежных отрицательных и дробных значение мы рассмотрим некоторые шкалы: z-шкалу, шкалу стенов, шкалу стенайнов, шкалу Векслера. Общим для них является соответствие нормальному распределению (рис. 2).

IQ – шкала имеет среднее 100 и сигму 15

T–шкала имеет среднее 50 и сигму 10

Шкала стенов (стандартная 10) имеет среднее 5,5 и сигму 2

Шкала стенайнов (стандартная 9) имеет среднее 5 и сигму ≈2

Перевод в новую шкалу осуществляется по формуле 5.


 (5)




Рис. 2 Нормальная кривая и тестовые шкалы2


ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ

К РАЗДЕЛУ 1
  1. Во взаимодействии детей 6-11 лет с предметами окружающего мира имеются определенные различия между мальчиками и девочками (М.В.Осорина).
  • Назовите характерные различия между мальчиками и девочками в возрасте 6-11 лет во взаимоотношениях с предметами окружающего мира.
  • Какие свойства могут интересовать исследователей?
  • Какую совокупность элементов в этом случае нужно изучать?
  • Какой объем выборки позволит сделать статистически обоснованный вывод в данном исследовании?
  • Какие выборки (связные или несвязные) различают в данном исследовании?
  1. Личные характеристики детей, которые служат основанием для взаимных выборов, с возрастом меняются (А.А.Реан, Я.Л.Коломинский).
  • Назовите основания для взаимных выборов детей в 1-2-х классах и в более старшем возрасте.
  • Какие свойства могут интересовать исследователей?
  • Какую совокупность элементов в этом случае нужно изучать?
  • Какой объем выборки позволит сделать статистически обоснованный вывод в данном исследовании?
  • Какие выборки (связные или несвязные) различают в данном исследовании?



  1. В подростковом и юношеском возрасте продуктивность непроизвольного запоминания замедляется и одновременно с этим увеличивается продуктивность опосредованного запоминания (А.Н.Леонтьев).
  • Какие свойства могут интересовать исследователей?
  • Какую совокупность элементов в этом случае нужно изучать?
  • Какой объем выборки позволит сделать статистически обоснованный вывод в данном исследовании?
  • Какие выборки (связные или несвязные) различают в данном исследовании?



  1. Определите, в какой шкале представлено каждое из приведенных ниже из­мерений: наименований, порядка, интервалов, абсолютной.
  1. Порядковый номер испытуемого в списке (для его идентификации).
  2. Количество вопросов в анкете как мера трудоемкости опроса.
  3. Упорядочивание испытуемых по времени решения тестовой задачи.
  4. Академический статус (ассистент, доцент, профессор) как указание на принадлежность к соответствующей категории.
  5. Академический статус (ассистент; доцент, профессор) как мера продви­жения по службе.
  6. Телефонные номера.
  7. Время решения задачи.
  8. Количество агрессивных реакций за рабочий день.
  9. Количество агрессивных реакций за рабочий день как показатель агрессивности.



  1. На трех разных, достаточно больших группах испытуемых изучалась диагностическая ценность методики измерения креативности. Методика представляла собой 10 заданий, которые испытуемые решали за определенный промежуток времени. Фиксировалось количество решенных заданий (минимум – 0, максимум – 1). По результатам исследования была построена таблица, позволяющая сравнить три группы по распределению относительных частот (в %) показателей креативности [Наследов, с. 37]

Решенные задания

Относительные частоты (%)

Группа 1

Группа 2

Группа 3

0

1

10

0

1

4

20

0

2

5

30

1

3

10

30

2

4

20

5

3

5

30

3

4

6

20

1

10

7

5

0

15

8

3

0

25

9

1

0

25

10

1

0

15



  1. Для какой из групп задания были слишком легкие, а для какой – слишком трудные?
  2. В какой группе наблюдается наибольшая, а в какой – наименьшая индивидуальная изменчивость результатов?
  3. В отношении какой группы, на ваш взгляд, методика может иметь наибольшую диагностическую ценность – точнее измерять индивидуальные различия?



  1. Психолог протестировал две группы испытуемых по 5 человек в каждой по методике дифференциальной диагностики депрессивных состояний В.А.Жмурова. результаты представлены в таблице.

№ испытуемых п/п

Группа 1

Группа 2

1

15

26

2

45

67

3

44

23

4

14

78

5

21

3



Проранжируйте результаты в обеих группах как в одной. Проверьте правильность ранжирования.

  1. Психолог провел традиционное тестирование интеллекта по тесту Ржичана у 25 школьников. Сырые баллы по тесту оказались следующими: 6 9; 5; 7; 10; 8; 9; 10; 8; 11; 9; 12; 9; 8; 10; 11; 9; 10; 8; 10; 7; 9; 10; 9; 11. Представьте данный ряд значений в более компактной форме, используя частоту встречаемости признака (fi).
  2. Проранжируйте представленные в таблице качества в отношении образа «квалифицированный психолог» и в отношении образа «Я». Цифре 1 соответствует самое важное качество и т.д.


Образ «Я»




Образ

«квалифицированного психолога»




Самостоятельность







Решительность







Настойчивость







Инициативность







Целеустремленность







Организованность







Открытость







Ответственность







Самообладание







Порядочность







Любознательность







Эмпатичность






  1. Рассчитайте моду, медиану и среднее арифметическое множества элементов, характеризующих значения респондентов по субтестам «Осведомленность» и «Скрытые фигуры» (таблица 1 Приложения).



  1. Рассчитайте размах, дисперсию и стандартное отклонение (с точностью до двух знаков после запятой) множества элементов, характеризующих значения респондентов по субтестам «Осведомленность», «Скрытые фигуры» (таблица 1 Приложения).


  1. Рассчитайте размах, дисперсию и стандартное отклонение (с точностью до двух знаков после запятой) множества элементов, характеризующих значения респондентов психологического исследования «Заучивание слов» (таблица 1 Приложения).
  2. Рассчитайте размах, дисперсию и стандартное отклонение (с точностью до двух знаков после запятой) множества элементов, характеризующих значения респондентов по субтесту «Числовые ряды» (таблица 1 Приложения).


  1. Рассчитайте размах, дисперсию и стандартное отклонение (с точностью до двух знаков после запятой) множества элементов, характеризующих значения респондентов по субтесту «Аналогии» (таблица 1 Приложения).


  1. Рассчитайте размах, дисперсию и стандартное отклонение (с точностью до двух знаков после запятой) множества элементов, характеризующих значения респондентов по субтесту «Геометрическое сложение» (таблица 1 Приложения).


  1. Рассчитайте размах, дисперсию и стандартное отклонение (с точностью до двух знаков после запятой) множества элементов, характеризующих значения респондентов по субтесту «Умозаключения» (таблица 1 Приложения).


  1. Определите средний показатель роста студентов вашей группы и соответствующее стандартное отклонение. Какова должна быть высота дверного проема, чтобы быть уверенным, что сквозь него, не нагибаясь, смогут пройти 99% студентов группы?



РАЗДЕЛ 2

МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА