Методические указания Екатеринбург 2006 утверждаю декан психологического факультета Глотова Г. А
Вид материала | Методические указания |
- Учебно-методическое пособие Екатеринбург 2006 утверждаю декан психологического факультета, 1202.51kb.
- Учебно-методическое пособие Екатеринбург 2006 утверждаю декан психологического факультета, 4118.65kb.
- Программа курса Стандарт 020800 «Историко-архивоведение» Екатеринбург 2006 утверждаю, 234kb.
- Методические указания по выполнению выпускной квалификационной работы для студентов, 665.8kb.
- Программа специальной (Стандарт пд. Сд/ДС) Екатеринбург 2006 Утверждаю Декан физического, 73.92kb.
- Программа специальной (Стандарт пд. Сд/ДС) Екатеринбург 2006 Утверждаю Декан физического, 285.15kb.
- Программа дисциплины (Стандарт пд- сд ) Екатеринбург 2006 Утверждаю Декан экономического, 822.84kb.
- Программа дисциплины (Стандарт пд-сд) Екатеринбург 2006 Утверждаю Декан экономического, 316.67kb.
- Программа дисциплины (Стандарт пд-сд) Екатеринбург 2006 Утверждаю Декан экономического, 137.25kb.
- Программа дисциплины (Стандарт пд- сд /ДС/фтд/днм/сдм/нирм) Екатеринбург 2006 Утверждаю, 1309.1kb.
ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ
Государственное образовательное учреждение
высшего профессионального образования
Уральский государственный университет им. А.М. Горького
Факультет психологии
Кафедра общей психологии и психологии личности
ВВЕДЕНИЕ В МНОГОМЕРНЫЙ АНАЛИЗ ДАННЫХ
Методические указания
Екатеринбург
2006
УТВЕРЖДАЮ
Декан психологического факультета
____________________Глотова Г.А.
Учебно-методическое пособие по курсу «Введение в многомерный анализ данных» составлено в соответствии с требованиями федерального компонента к обязательному минимуму содержания и уровню подготовки:
дипломированного специалиста по специальности 030301
бакалавра, магистра по направлению «психология»
по циклу СД дисциплин государственного образовательного стандарта высшего
профессионального образования.
Автор-составитель:
к.п.н., доцент кафедры общей психологии и психологии личности Ур ГУ
Боднар А. М.
Рекомендовано к изданию учебно-методической комиссией
психологического факультета
Протокол заседания № от
ВВЕДЕНИЕ…………………………………………………………………………..3
Часть 1
НЕОБХОДИМОСТЬ МНОГОМЕРНОГО ПОДХОДА К АНАЛИЗУ
ДАННЫХ В ПСИХОЛОГИИ ………………………………………………………4
НАЗНАЧЕНИЕ И КЛАССИФИКАЦИЯ МНОГОМЕРНЫХ МЕТОДОВ……………….8
ОБЩАЯ ХАРАКТЕРИСТИКА МНОГОМЕРНЫХ МЕТОДОВ
ИССЛЕДОВАНИЯ ЛИЧНОСТИ И РЕЗУЛЬТАТЫ ИХ ПРИМЕНЕНИЯ ……..12
Методы сбора данных……………………………………………………….12
Общая характеристика математических методов многомерного
анализа данных о личности…...…………………………………………….15
Достижения экспериментальной психологии
по выделению черт и типов личности……………………………………..21
Часть 2
ФАКТОРНЫЙ АНАЛИЗ (ОБЩИЕ ВОПРОСЫ)……….………………………..28
Общая характеристика факторного анализа как научного метода……….28
Сведения о матрицах, минимально необходимые для изучения
факторного анализа………………………………………………………….35
ВАЖНЕЙШИЕ ПОНЯТИЯ И ТЕХНИКА ФАКТОРНОГО АНАЛИЗА………..38
Два вводных примера………………………………………………………..38
Схема решения и основные проблемы факторного анализа…….……….43
Классификация факторов и связь между отдельными
видами факторов…………………………………………………………….44
Важнейшие понятия факторного анализа,
связанные с дисперсией………………………………………………….…45
Суть основных проблем факторного анализа………………………….….47
Наглядное пояснение основной концепции факторного анализа
с помощью числового примера………………………………………..…...54
Дополнительные статистические показатели оценки результатов
факторного анализа………………………………………………………….59
Несколько замечаний по поводу конфирматорного
факторного анализа………………………………………………………….60
МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПРИСТУПАЮЩИМ
К ПРАКТИЧЕСКОМУ ОСВОЕНИЮ ФАКТОРНОГО АНАЛИЗА…………….61
ЛИТЕРАТУРА……………………………………………………………………...66
ПРИЛОЖЕНИЕ…………………………………………………………………….67
ВЕДЕНИЕ
Настоящие методические указания подготовлены по программе спецкурса «Введение в многомерный анализ данных», являющегося продолжением и развитием базовой дисциплины «Математические методы в психологии», читаемой студентам-психологам первого курса. Они имеют целью познакомить студентов старших курсов, приступающих к выполнению выпускных и дипломных работ, с теоретическими основами многомерных методов анализа эмпирической информации и – на примере факторного анализа – с практическими способами их применения.
Методические указания состоят из двух частей.
Первая часть посвящена идеям, лежащим в основании многомерного подхода, обоснованию необходимости появления этих идей и их внедрения в процесс получения и анализа данных. Приведены примеры достижений экспериментальной психологии, основанных на использовании многомерных методов, по выделению черт и типов личности.
Вторая часть посвящена факторному анализу. Из множества многомерных методов мы выбрали и обсуждаем идеи, проблемы и прикладные вопросы факторного анализа по ряду причин. Во-первых, с него начинается эпоха многомерных методов в психологии. Долгое время он был основным и практически единственным многомерным методом, применявшимся психологами. Но и после появления других методов к факторному анализу прибегают чаще, чем к этим другим методам. Кроме того, его идеи и техника сравнительно сложны, и потому при освоении факторного анализа желателен комментарий, каковым и являются данные методические указания. В них дается общая характеристика факторного анализа как научного метода, обсуждаются его важнейшие понятия и техника, даются методические рекомендации студентам, приступающим к практическому освоению факторного анализа.
НЕОБХОДИМОСТЬ МНОГОМЕРНОГО ПОДХОДА
К АНАЛИЗУ ДАННЫХ В ПСИХОЛОГИИ
В физико-химико-биологических науках роль научных концепций и теорий ежедневно подтверждается повсеместным использованием вычислительной техники, полимеров, вакцин и т. п., что служит лучшим подтверждением значимости этих наук.
Психологические же теории, которых множество и весьма солидных, в практической жизни не играют существенной роли. Почему?
Отвечая на этот вопрос, мы будем опираться на историю исследований и достижений прежде всего в области психологии личности. Тому есть две причины. Во-первых, в этой области ярко проявись основные тенденции, присущие научному исследованию в психологи, а, во-вторых, здесь получены впечатляющие результаты применения многомерных математических методов, в частности, факторного анализа.
Итак, почему же психологические знания не могут использоваться эффективным образом? Несомненно, психика человека является необыкновенно сложным объектом для изучения. Несомненно и то, что по сравнению с физико-химическими науками психология очень молода.
Однако, сделав эти оговорки, следует спросить: а не присущ ли психологическим методам исследования какой-либо недостаток, который тормозит практическое развитие психологии? Для ответа на этот вопрос обратимся к истории развития научных представлений о личности.
Систематизация психологических знаний о личности может быть условно разделена на две исторические фазы: клинико-психологическую и экспериментальную.
Клинико-психологическая фаза является фазой организованных наблюдений и вербальных теорий. Она возникла как стремление лечить и корригировать отклоняющиеся формы поведения. Эта фаза оставила нам в наследство много известных имен (таких, как Адлер, Бехтерев, Блейхер, Жанэ, Корсаков, Крепелин. Кречмер, Лазурский, Фрейд, Юнг и др.) и множество самобытных теорий. Будучи научными по своим целям, эти теории достигли популярности, не имея обоснованности, ибо в них отсутствует экспериментальная основа, имеющаяся в других науках. Эксперимент используется в клинико-психологической фазе исследования лишь имплицитно: измерение здесь заменено наблюдением, сбор данных – отбором показательных случаев, статистическая обработка – содержательной интерпретацией.
Однако такая бедность экспериментальной процедуры позволяет манипулировать большим числом объясняющих переменных.
Важно, что сторонники клинического метода стараются свести в единую систему все переменные, необходимые для формирования понятий о личности, без которых невозможно прийти к установлению реальных закономерностей.
Экспериментальная фаза возникла как реакция на вербальный характер клинико-психологического метода исследования. Эта фаза количественного и экспериментального исследования личности с самого начала четко разделилась на два течения: двумерное и многомерное. Оба подхода позволяют изучать взаимосвязи между переменными, но разными способами.
Двумерный эксперимент является по существу слепым перенесением в психологию метода исследования, принятого в физичecкиx науках. Он предполагает выделение зависимой и независимой переменных с помощью экспериментального контроля либо с помощью рандомизирующих (обеспечивающих случайный порядок) процедур.
В многомерном же эксперименте одновременно статистически учитываются все измеряемые факторы, взятые во всей их жизненной полноте.
Сторонники двумерного экспериментального метода считают, что выделение двух переменных необходимо для изучения психического феномена в чистом виде. По их мнению, при таком подходе устраняются контаминирующие (зашумляющие) влияния одновременно происходящих процессов, однако упускается из виду тот факт, что изучаемый психический процесс никогда не протекает изолированно. Поведение сложно и определяется множеством внутренних и внешних факторов. По этой причине пытаться сформировать две группы лиц, идентичных во всех отношениях, кроме одного, и поставить их в одинаковые условия невозможно даже в лабораторном эксперименте. Поэтому вместо устранения контаминирующих эффектов разумнее изучить их самих. Этот принцип и был положен в основу многомерных методов исследования.
Многомерный эксперимент в той разновидности, в которой он существовал до 60-х годов 20 в., требовал измерения множества сопутствующих признаков, независимость которых заранее неизвестна. Анализ связей между изучаемыми признаками позволял выявить небольшое число скрытых структурных факторов, от которых зависят наблюдаемые вариации измеряемых переменных.
Такой подход базируется на априорных соображениях, что исходные признаки – это только поверхностные индикаторы, косвенно отражающие скрытые от прямого наблюдения переменные (например, черты личности), знание которых позволит просто и понятно описать индивидуальное поведение. Поскольку скрытых черт значительно меньше, чем поверхностных, то даже полное описание личности остается экономным и удобным для практического использования.
Таким образом, зародившийся в начале 20 века многомерный подход к исследованию интеллекта и личности (реализованный в факторном анализе) может рассматриваться как синтез двух фаз развития психологических исследований. Он позволил объединить достоинства целостного подхода, свойственного клиническому методу с достоинствами метрического подхода, присущего двумерному эксперименту. В силу этих особенностей многомерный подход успешно применяется в тех областях, где человеческое поведение рассматривается в естественных условиях. Того, чего невозможно достичь прямой манипуляцией зависимых и независимых переменных, можно добиться с помощью более сложного статистического анализа всего множества существенных переменных. Главным достоинством многомерного подхода является его эффективность в исследовании реальных ситуаций без риска их искажений или загрязнения побочными влияниями, возникающими при создании искусственных экспериментальных условий.
Идея же применения многомерного подхода в психологии возникла в конце XIX века практически одновременно с началом психологических измерений, однако широкое применение многомерных методов становится возможным лишь к концу 1980-х годов, с распространением персональных компьютеров. Дело в том, что любой многомерный метод требует циклической обработки данных, где на каждом этапе сам исследователь должен принимать решение о характере обработки. Поэтому раньше корректная реализация многомерного метода (факторного анализа) требовала недель работы группы специалистов: предметника (психолога), статистика, программиста, оператора и др. Далеко не каждая исследовательская лаборатория могла себе это позволить.
В настоящее время, с появлением мощных и простых в применении программных средств, сам специалист может реализовать весь процесс многомерного анализа данных, не вдаваясь в вычислительные сложности. Для этого ему достаточно знать общий смысл метода, требования к исходным данным и основные показатели для интерпретации получаемых результатов.
НАЗНАЧЕНИЕ И КЛАССИФИКАЦИЯ МНОГОМЕРНЫХ МЕТОДОВ
Роль математико-статистических методов в психологическом исследовании не однозначна. В курсе «Математические методы в психологии» акцент ставился на процедурах проверки статистических гипотез. Однако помимо статистического обоснования предположений есть еще одна функция математических методов в любой области знания – представление эмпирических данных в пригодном для интерпретации виде, поиск смысла в обилии исходной информации. Эта функция является исходной, а потому более значимой.
Действительно, прежде чем сформулировать гипотезу, мы пытаемся осмыслить данные, для чего, в частности, вычисляем средние значения, сравниваем частоты и т. д. Эти операции, зачастую, не ассоциируются с применением математических методов, а на самом деле использование этих методов в их основных назначениях – поисковых и описательных – с них и начинается. В результате мы получаем описательные математические модели, применяемые для представления исходных (эмпирических) данных в доступном для интерпретации виде, или эмпирические математические модели (ЭММ). Простейшие ЭММ – средние значения признака, вычисляемые для сравниваемых групп в предположении, что различия в средних значениях отражают различия между представителями групп. Или даже просто ранжирование членов группы, которое предполагает, что порядковый номер испытуемого отражает выраженность изучаемого свойства. Если у нас два признака, измеренных на группе объектов (испытуемых), то мы вычисляем коэффициент корреляции или сопряженности, исходя из предположения о согласованности индивидуальной изменчивости признаков.
По сути дела, ЭММ идентичны мыслительным операциям. Но непосредственно сравнивать, различать, определять взаимосвязь и т. д. мы можем только при небольшой численности объектов или признаков. Когда много и объектов и признаков, простейшие ЭММ уже мало пригодны. И тогда возникает необходимость применения многомерных методов и компьютера.
Мы видим, таким образом, еще одну причину – наряду с указанной выше – неизбежности появления многомерных методов как дальнейшего развития ЭММ в отношении многостороннего (многомерного) описания изучаемых явлений. Как и простейшие ЭММ, многомерные ЭММ воспроизводят мыслительные операции человека, но в отношении таких данных, непосредственное осмысление которых невозможно. Многомерные методы выполняют такие интеллектуальные функции, как:
- структурирование эмпирической информации (факторный анализ, кластерный анализ, многомерное шкалирование),
- классификация (кластерный анализ),
- экстраполяция (множественный регрессионный анализ),
- распознавание образов (дискриминантный анализ) и т. д.
Список многомерных методов, которые будут упомянуты ниже, не претендует на полноту и состоит из методов, наиболее часто применяемых в психологии.
Эти методы можно классифицировать по трем основаниям: по назначению; по способу сопоставления данных – по сходству (различию) или пропорциональности (корреляции); по виду исходных эмпирических данных.
Классификация методов по назначению:
- Методы предсказания (экстраполяции): множественный регрессионный анализ. Предсказывает значения метрической «зависимой» переменной по множеству известных значений «независимых» переменных, измеренных у множества объектов (испытуемых).
- Методы классификации: варианты кластерного анализа и дискриминантный анализ. Кластерный анализ («классификация без обучения») по измеренным характеристикам у множества объектов (испытуемых) либо по данным об их попарном сходстве (различии) разбивает это множество объектов на группы, в каждой из которых содержатся объекты, более похожие друг на друга, чем на объекты из других групп. Дискриминантный анализ («классификация с обучением», «распознавание образов») позволяет классифицировать объекты по известным классам, исходя из измеренных у них признаков, пользуясь решающими правилами, выработанными предварительно на выборке идентичных объектов, у которых были измерены те же признаки.
- Структурные методы: факторный анализ и многомерное шкалирование. Факторный анализ направлен на выявление структуры переменных как совокупности факторов, каждый из которых – это скрытая, обобщающая причина взаимосвязи группы переменных. Многомерное шкалирование выявляет шкалы как критерии, по которым поляризуются объекты при их субъективном попарном сравнении.
Классификация методов по исходным предположениям о структуре данных:
- Методы, исходящие из предположения о согласованной изменчивости признаков, измеренных у множества объектов. На корреляционной модели основаны факторный анализ, множественный регрессионный анализ, отчасти – дискриминантный анализ.
- Методы, исходящие из предположения о том, что различия между объектами можно описать как расстояние между ними. На дистантной модели основаны кластерный анализ и многомерное шкалирование, частично – дискриминантный анализ. Многомерное шкалирование и дискриминантный анализ добавляют предположение о том, что исходные различия между объектами можно представить как расстояния между ними в пространстве небольшого числа шкал (функций).
Классификация методов по виду исходных данных:
- Методы, использующие в качестве исходных данных только признаки, измеренные у группы объектов. Это множественный регрессионный анализ. дискриминантный анализ и факторный анализ.
- Методы, исходными данными для которых могут быть попарные сходства (различия) между объектами: это кластерный анализ и многомерное шкалирование. Многомерное шкалирование, кроме того, может анализировать данные о попарном сходстве между совокупностью объектов, оцененном группой экспертов. При этом совместно анализируются как различия между объектами, так и индивидуальные различия между экспертами.
Представленные классификации свидетельствуют о необходимости знания возможностей и ограничений многомерных методов уже на стадии общего замысла исследования. Например, ориентируясь только на факторно-аналитическую модель, исследователь ограничен в выборе процедуры диагностики: она должна состоять в измерении признаков у множества объектов. При этом исследователь ограничен и в направлении поиска: он изучает либо взаимосвязи между признаками, либо межгрупповые различия по измеряемым признакам. Общая осведомленность о других многомерных методах позволит исследователю использовать более широкий круг психодиагностических процедур, решать более широкий спектр не только научных, но и практических задач.
Применение многомерных методов требует соответствующего программного обеспечения. Широко известны и распространены универсальные статистические программы STATIST1CA, SPSS, STATGRAPH, STADIA, содержащие практически весь спектр статистических методов – от простейших до самых современных. Стоит обратить внимание на пакет STADIA, поскольку он – отечественный, а потому сравнительно дешевый.
ОБЩАЯ ХАРАКТЕРИСТИКА МНОГОМЕРНЫХ МЕТОДОВ
ИССЛЕДОВАНИЯ ЛИЧНОСТИ И РЕЗУЛЬТАТЫ ИХ ПРИМЕНЕНИЯ
Итак необходимость измерения в психологии была осознана, а через какое-то время, несмотря на неверный старт (двумерный эксперимент), нашлись психологи (прежде всего это Ч. Спирмен, Л. Терстоун, Р. Кеттел), сумевшие найти путь к измерениям, адекватным объекту исследования – многомерным методам. Но чтобы применять математические методы, в частности, многомерные, нужно иметь объект применении – данные, поэтому далее мы рассмотрим, каким образом психологи их получают.
Методы сбора данных
Психологическая информация может быть получена из трех принципиально различных источников. Данные, полученные из этих источников, обозначаются как «L»-, «Q»- и «Т»-данные (классификация Р. Б. Кеттела).
«L»-данные. Данные, полученные путем регистрации реального поведения человека в повседневной жизни, принято называть «L»-данными (от «life record data»)
Идеально было бы иметь полное и подробное описание образа жизни исследуемого лица, однако на практике это неосуществимо. В лучшем случае удается получить информацию относительно отдельных периодов или сторон жизни испытуемого, например сколько раз ученик правильно отвечал на вопросы, сколько раз нарушал дисциплину, обращался к врачу и т. п. Поэтому чаще всего «L»-данные получают путем формализации оценок экспертов, наблюдающих поведение испытуемого в определенных ситуациях и в течение некоторого периода времени.
С «L»-данных обычно начинаются предварительные исследования проблемы. В многомерных исследованиях очень важно достаточно полно охватить сферу исследования. Кэттелл считает, что «L»-данные идеальны для установления тех признаков поведения, которые нуждаются в измерении. «L»-данные хороши также тем, что все виды поведения уже представлены в языковой форме. Это гарантирует не только лучший начальный выбор переменных, но и более легкую интерпретацию полученных факторов.
«Q»-данные. Изучение личности с помощью опросников и других методов самооценок обозначается как «Q-данные (от «Questionnaire data»). Благодаря простоте инструментальных конструкций и легкости получения информации «Q-данные (опросники, самоотчеты, шкалы самооценок и т. п.) занимают центральное место в личностных исследованиях. Число методик для получения «Q-данных огромно. Из них наиболее известны Миннесотский многопрофильный личностный перечень (MMPI), шестнадцатифакторный личностный опросник (16PF), опросники Айзенка (EPI, EPQ), Калифорнийский психологический тест.
«Т»-данные – это сведения, получаемые от объективных тестов с контролируемой экспериментальной ситуацией (objective test data), а также от физиологических измерений. «T»-данные получают в результате объективного измерения поведения (вербального, невербального, социального и индивидуального) без обращения к самооценкам или оценкам экспертов. При всем многообразии объективных тестов во всех случаях создаются специальные микроситуации, способствующие проявлению основных измеряемых свойств.
Наиболее полное собрание объективных тестов представлено в «компендиуме объективных тестов личности и мотивации», составленном Р. Б. Кэттеллом и Ф. В. Варбуртоном. В этом справочнике авторами собрано более 400 различных тестов, расклассифицированных на 12 групп. Например:
- тесты способностей. Выяснилось, что некоторые тесты, первоначально созданные для исследования интеллектуальных функций, знаний и способностей, высоко коррелируют с личностными факторами, например показатели беглости речи, моторной ригидности высоко коррелируют с фактором «невротическая регрессия–мобилизация энергии».
- тесты умений и навыков. К этой группе относятся тесты на зрительно-моторную координацию, координацию движений рук, точность прохождения лабиринта и т. п.
- опросники. Это группа тестов, построенная в виде анкетного опроса о поведении, вкусах, привычках и т. п., например анкеты для опроса о состоянии здоровья, выполнении гигиенических требований и т. Д.
- проективные тесты. Сюда относятся все виды формализованных проективных личностных тестов.
- ситуационные тесты. Они предполагают создание определенной социальной ситуации. Например, одно и то же задание выполняется в одиночестве и перед всем классом, для личного зачета и для командного, в ситуации соревнования или кооперации и т. д.
- игры. В игровых ситуациях хорошо проявляются индивидуальные особенности личности испытуемого. Поэтому многие игры включены в состав объективных тестов.
- физиологические тесты. К ним относятся тесты, в которых регистрируются физиологические показатели: КГР, ЭКГ, ЭЭГ, тремор и т. п.
- физические тесты. Их не всегда легко отличить от физиологических. Размер грудной клетки, удельный вес тела, тургор мышц, величина жировой складки и другие показатели относят к физическим тестам.
Объективные тесты представляют собой истинно экспериментальный подход, полностью освобожденный от субъективных оценок. Большинство специалистов считают эту область наиболее перспективной, а Кеттелл сравнил переход к ним с «прохождением звукового барьера в авиации или с любым другим прорывом в науке в область новых принципов».