Учебно-методическое пособие Екатеринбург 2006 утверждаю декан психологического факультета Глотова Г. А

Вид материалаУчебно-методическое пособие
Тема 4. математико-статистический метод
Основным предположением
Объекты (наблюдения) должны принадлежать од­ному из двух (или более) классов
Процедура и техника дискриминантного анализа
Fkm = U0+U1X1km+U2X2km+ … +UpXikm
F = 0,03В + 0,16Мк + 0,04Q1 + 0,14Q4 + 0,01ASOл 4 + 0,2МРСл + 0,23OD - 0,17ED - 3,5
Главный центроид
Подобный материал:
1   2   3   4   5   6   7
ТЕМА 4. МАТЕМАТИКО-СТАТИСТИЧЕСКИЙ МЕТОД

КЛАССИФИКАЦИИ В ПСИХОЛОГИИ: МОДЕЛЬ ДИСКРИМИНАНТНОГО АНАЛИЗА


Назначение

Дискриминантный анализ (ДА) является статистическим методом, который позволяет изучать различия между двумя и более груп­пами объектов по нескольким переменным одновременно. Этот метод часто бывает полезен в социальных науках. Рассмотрим, например, такую ситуацию.

Группа экспертов исследует возмож­ность переговоров с террористами, захватившими заложников. Их интересуют те особенности ситуации, при которых было бы возможно безопасное освобождение заложников, даже если тре­бования террористов не выполнены. В качестве альтернативы, что заложникам будет причинен вред, существует несколько перемен­ных, предсказывающих их благополучное освобождение. Напри­мер, число террористов, наличие поддержки их местным населе­нием, являются ли они независимой группой или принадлежат к большой военной организации, характер их устных заявлений, тип и количество оружия, отношение числа террористов к числу заложников и т. д.

Изучая предыдущие инциденты, в которых власти отказались выполнить требования террористов, эксперты должны найти ответ на следующие вопросы:
  1. какие из этих пе­ременных могут быть полезными для предсказания судьбы за­ложников:
  2. как эти переменные могут быть связаны в матема­тическую функцию для предсказания наиболее вероятного исхо­да:
  3. какова точность предсказания.

Дискриминантный анали­з с успехом применяется в таких областях как психологическое тестирование, личностное и в целях профотбора или аттестации кадров, анализ переписи населе­ния, изучение эффекта от како­го-либо метода лечения, исследование экономических различий между географическими районами и предприятиями, предсказание итогов голосо­вания и др.

Основным предположением дискриминантного анали­за является то, что существуют две или более группы, которые по некоторым переменным отличаются от других групп, причем такие переменные могут быть измерены по интервальной шкале либо по шкале отношений. Дискриминантный анализ помогает выявлять различия между группами и дает возможность класси­фицировать объекты по принципу максимального сходства.

Объекты (наблюдения) должны принадлежать од­ному из двух (или более) классов (групп). Объекты являются основными единицами анализа. Объектами изучения могут быть люди, животные, страны, экономика в различные моменты вре­мени и вообще все, что угодно. В примере с террористами каж­дый предыдущий террористический акт есть объект. Класс (группа) дол­жен быть определен таким образом, чтобы каждое наблюдение принадлежало одному и только одному классу. Последствия тер­рористических актов могут быть отнесены к одному из двух клас­сов: случаи успешного освобождения заложников и случаи, когда пострадали некоторые или все заложники. Главная задача в случае с террористами состоит в точном предсказании результатов будущих инцидентов. Поэтому будущие инциденты могут рассматриваться как «нерасклассифицированные» («несгруппированные»).

«Дискриминантный анализ» можно разделить на методы интерпретации межгрупповых различий и методы классификации наблюдений по группам.

При интерпретации необходимо ответить на вопросы: возможно ли, используя данный набор характеристик (переменных), отличить один класс от дру­гого: насколько хорошо эти характеристики позволяют провести различение и какие из них наиболее информативны.

Метод, отно­сящийся к классификации, связан с получением одной или не­скольких функций (уравнений), обеспечивающих возможность отнести данный объект к одной из групп (классов). Эти функции, называются классифицирующими. Например, если значения характеристик нового террори­стического акта близки к соответствующим значениям прошлых инцидентов, в которых все заложники были освобождены, классифицирующая функция покажет, что для рассматриваемого со­бытия более вероятен благоприятный исход. (После того как ин­цидент будет исчерпан, станет известно, оправдался ли прогноз, однако для многих других приложений подтвердить точность классификации не представляется возможным.)

Характеристики, применяемые для того, чтобы отличать один класс от другого, называются дискриминантными переменными. В примере с террористами были упомянуты семь дискриминантных переменных (число террористов, степень поддержки, количество оружия и т. д.). В общем случае, число дискриминантных переменных не ограничено, но в сумме число объектов должно всегда превышать число переменных по крайней мере на два.

Итак, дискриминантный анализ используется для изучения различий между несколькими группами по определенному набору дискриминантных переменных.


Процедура и техника дискриминантного анализа

Дальнейшее изложение понятий и техники дискриминантного анализа мы будем иллюстрировать примерами из психолого-педагогического исследования, одной из задач которого была классификация учителей на группы.

Для выполнения этого исследования были сформированы две группы испытуемых. Первую группу, названную «рядовые» составили педагоги, чьи профессиональные показатели не превышали среднего уровня (85 человек). Во вторую, названную «элита» (45 человек), вошли педагоги, которые, по мнению экспертов, были лучшими представителями своей профессии (напомним, что ДА относится к задачам группировки испытуемых на заданные группы или, что то же самое, к алгоритмам распознавания образов «с учителем»).

В результате тестирования испытуемых было получено более 40 показателей (переменных)1, характеризующих каждого из них. Задача состояла в выработке решающего правила (уравнения) для отнесения каждого испытуемого к своей группе (классу). В ДА предполагается, что если процент верных классификаций окажется высоким, то это значит, что «учитель» справился со своей задачей, и мы можем пользоваться найденным уравнением для классификации неизвестных испытуемых.

Важным является вопрос, все ли переменные, описывающие испытуемых, нужно включать в обработку с помощью ДА? Следует иметь в виду, что переменные, которые не дают значимых межгрупповых различий, из ДА следует исключить. В нашем примере для определения переменных, подлежащих исключению, было проведено сравнение групп по каждой переменной с помощью t-критерия Стьюдента. Оказалось, что статистически значимо группы различаются только по 8 из более чем 40 переменных. Именно к этим переменным и была применена процедура ДА.

Процедуру и технику ДА будем обсуждать в соответствии с последовательными этапами реализации компьютерной программы ДА в пакете STATGRAF .

Процедуры интерпретации

Первый вопрос, который следует обсудить, связан с методами интерпретации. Задача интерпретации связана с определением числа и значимости канонических дискриминантных функций и с выяснением их значений для объяснения различий между классами.

Каноническая дискриминантная функция является линейной комбинацией дискриминантных переменных. Ее уравнение, называемое дискриминантным, имеет следующий вид:

Fkm = U0+U1X1km+U2X2km+ … +UpXikm

где Fkm – значение канонической дискриминантной функции для m-го объекта в группе K; Xikm – значение дискриминантной переменной Xi для m-го объекта в группе K; Ui – коэффициенты, обеспечивающие выполнение требуемых условий.

Коэффициенты для Fkm подбираются таким образом, чтобы ее средние значения для различных классов как можно больше отличались друг от друга.

STATGRAF рассчитывает стандартизированные и нестандартизованные коэффициенты канонической дискриминантной функции. Разница между ними заключается в следующем: нестандартизованные коэффициенты – в отличие от стандартизованных – рассчитываются на основании матрицы, содержащей исходные значения наблюдений, которые не приведены к стандартной форме.

Нестандартизованные коэффициенты канонической дискриминантной функции необходимы для определения положения наблюдений (объектов) в дискриминантом пространстве (табл. 4.1).

Таблица 4.1

Нестандартизованные коэффициенты канонической дискриминантной

функции


В

М

Q1

Q4

АSОл

МРСл

0-D

E-D

Const.

0,03

0,16

0,04

0,14

0,01

0,24

0,23

-0,18

-3,5


Именно они являются коэффициентами при переменных в дискриминантном уравнении

F = 0,03В + 0,16Мк + 0,04Q1 + 0,14Q4 + 0,01ASOл 4 + 0,2МРСл + 0,23OD - 0,17ED - 3,5

Значение функции интерпретируется как координата объекта (учителя) в пространстве этой функции. Пространство канонической дискрининантной функции задается совокупностью объектов наблюдения, в нашей случае это координаты 130 учителей (85 рядовых - гр. I и 45 элитных - гр. 2).

Значение дискриминантной функции измеряется в единицах стандартного отклонения, то есть значение F для данного учителя представляет число стандартных отклонений точки от главного центроида или, другими словами, положение точки на оси, где нулевая точка - главный центроид.

Центроид - это воображаемая точка, координаты которой есть среднее значение переменных в данной группе. Главный центроид – это точка пространства, в которой все дискриминантные переменные принимают средние (по всем наблюдениям) значения. Другими словами, это центральное положение всех точек, представляющих наблюдения. При графическом изображении дискриминантных функций в главном центроиде помещается начало координат, так как в этом случае рассматриваемые группы и объекты соотносятся с центром системы.

У нас есть две группы - значит - два центроида: Ц1 = -0,43, Ц2 = +0,81 (эти значения также рассчитываются программой ДА STATGRAFа). Центроиды можно использовать для изучения различий между группами, так как они занимают положение типичных представителей соответствующей группы.

Число канонических дискриминантных функций не может быть больше числа групп минус 1. Значит при наличии двух групп возможна только одна функция. В таком случае точки, соответствующие объектам, располагаются вдоль некоторой прямой.

Можно построить график-гистограмму распределения объек­тов относительно этой оси. В качестве примера мы нанесли на график значения канонической дискриминантной функции для 10 первых членов из каждой группы (рис. 1).

Расположив групповые гистограммы одну над другой, легко сравнивать относительное положение групп. График показывает, что группы вполне различимы. Центроиды хорошо отделимы друг от друга.

По значению канонической дискриминатной функции, вычисленной для конкретного человека, можно сделать заключение о том, насколько типично положение данного человека среди участников группы. Возможность эта появляется потому, что дискриминантные значения выражены в единицах стандартного отклонения, то есть имеют единый масштаб. Например, значения канонической дискриминантной функции для учителей с условными номерами 86, 89 и 92 равны соответственно 1,8; 0,7 и -0,3. № 89 располагается рядом с центроидом группы (Ц2 = +0, 8) и может считаться типичным ее представителем. № 86 и № 92 отклоняются от своего центроида более чем на стандартное отклонение. Известно, что в пределах стандартного отклонения лежит 68% всех наблюдений, значит № 89 и № 92 входят в оставшиеся 32%, то есть находятся на границах своей группы.

Рис. 4.1 Распределение значений канонической дискриминант­ной функции для десяти произвольно взятых членов из каждой группы. Ось абсцисс является канонической дискриминантной функцией, измеренной в единицах стандартного отклонения.

+ ++

++ ++ + + +

Гр.1 (рядовые) --* * * * *

-1 ц1 0 ц2 +1

-0,43 0,81

++

+ + +++ ++ +

Гр.2 (элита) --* * * * * * *

-1 ц1 -03 0 ц2 +1 1,8


Стандартизованные коэффициенты показывают вклад переменной в значение функции. Их полезно применять для выявления тех переменных, которые значат больше других для характеристики изучаемой области реальности. Абсолютная величина коэффициента анализируется в стандартной форме: чем она больше, тем больше вклад этой переменной. Для нашей функции максимален вклад переменной 0D, затем по убывающей следуют шкалы ED, Мк, МРСл, Q4, Q1, В, asoл. Этот ранжир указывает на особую значимость для профессии педагога особенностей поведения в конфликтных ситуациях, которые измеряются шкалами 0D и ED из методики Розенцвейга. Причем, значимость переменной ОД (максимальный вклад) в 8,3 раза превосходит значимость переменной ASOл (минимальный вклад).

Таблица 4.2

Стандартизованные коэффициенты канонической дискриминантной функции


B

M

Q1

Q4

ASOл

MPCл

O-D

E-D

0.09

0.34

0.11

0.28

0.06

0.29

0.5

-0.39


Процедуры классификации

Следующий вопрос, который мы обсудим, знакомясь с дискриминантным анализом, связан с методами классификации.

Классификация – это особый вид деятельности исследователя, в котором либо дискриминантные переменные, либо канонические дискриминантные функции используются для предсказания класса, к которому более вероятно принадлежит некоторый объект. Существует несколько процедур классификации, но все они сравнивают положение объекта с каждым из центроидов классов, требуют определения понятия «расстояния» между объектом и каждым центроидом группы, чтобы можно было приписать объект к «ближайшей» группе. Классификация проводится с помощью линейной комбинации дискриминантных переменных. Ищется такая комбинация, которая максимизирует различия между группами, но минимизирует дисперсию внутри групп. Особая линейная комбинация для каждой группы называется классифицирующая функция2. Она имеет вид:

Нк = Вк0к1Х1 + Вк2 Х2 +… + Вкn Хn

Где Нк – значение функции для группы К, а Вк – коэффициенты простой классифицирующей функции. STATGRAF (и все другие компьютерные программы ДА) рассчитывают эти коэффициенты. В нашем случае имеется две группы, значит две классифицирующие функции:

Таблица 4.3

Коэффициенты простой классифицирующей функции




В

МК

Q1

Q4

ASOЛ

МРСл

OD

ED

const

Н1

0.2

0.7

0.36

1.2

0.37

5.54

1.68

3.1

47.6

Н2

0.24

0.88

0.41

1.33

0.36

5.83

1.97

2.84

52.16

HI = 0,2В + 0,7МК + 0,36Q1 + 1,2Q4 - 0,37ASOл +5,54МРСл +

+ 1,68OD + 3,1ED - 47,6

Н2 = 0,24В + 0,88МК + 0,41Q1 + 1,33Q4 - 0,36АSОл +

+ 5,83МРСл +1,9700 + 2,84ED - 52,16

Классификация производится следующим образом: подсчиты­ваются значения HI и Н2; объект относится к той группе, у которой значения Н больше.

Проведем для примера классификацию трех человек из элитной группы под условными номерами 1, 2, 3.

Таблица 4.4




№ 1

№ 2

№ 3

HI

42,9

36

35,8

H2

43

37

37,1

У всех трех значение Н2 больше, значит их следует отнести к элитной группе. Здесь мы показали, как работает функция, классифицируя "известных" учителей (тех, принадлежность которых к одной из групп известна заранее). Именно на этих учителях строилась классифицирующая функция, происходило обучение системы. Теперь в уравнения можно подставлять значения переменных неизвестных людей (например, абитуриентов) и относить их к потенциально успешным или к таким, у кого потенциал успешности под вопросом.


Обобщенную меру «расстояния» между объектом и каждым центроидом группы предложил индийский статистик Махаланобис – расстояние Махаланобиса D2, после вычисления которого для каждого класса объект классифицируется в группу с наименьшим D2. Это класс, чей типичный профиль по дискриминантным переменным больше похож на профиль этого объекта. Если расстояние до ближайшего класса велико, то согласие между профилями будет плохим, но по сравнению с любым другим классом – хорошим.

Оказалось, что статистика D2 обладает теми же свойствами, что и статистика 2. Расстояние, таким образом, измеряется в «2-единицах». Поэтому, в соответствии с закономерностями 2-распределения, мы можем ожидать, что большинство объектов будет группироваться вблизи центроида, и их плотность будет убывать по мере удаления от центроида. Зная расстояние от центроида, можно сказать, какая часть класса находится ближе к центроиду, а какая – дальше от него. Следовательно, можно оценить вероятность того, что объект, настолько-то удаленный от центроида, принадлежит к классу. Эта вероятность рассчитывается компьютерными программами ДА.

К классификации обычно обращаются как к средству предсказания принадлежности к группе "неизвестных" объектов, но можно использовать ее также для проверки точности процедуры классификации. Для этого берутся "известные" объекты и к ним применяются правила классификации.

Доля правильно классифицированных объектов говорит о точности процедуры и косвенно подтверждает степень разделения классов. Результат описывается в "классификационной матрице".

Таблица 4.5

Итоговая классификация

«обучающая» группа

Верный прогноз

Ошибочный прогноз

всего

частота

процент

частота

процент

частота

процент

1

65

76,47

20

23,53

85

100

2

33

73,33

12

26,67

45

100


В первой группе всего 85 человек. Из них классифицировано правильно (отнесено к первой группе) 65 человек или 76 %, неправильно (отнесено ко второй группе) 20 человек, то есть допущено 24% ошибок. Аналогично из 45 человек второй группы верно классифицировано 33 человека или 73%.

Всего верно классифицировано 65 + 33 = 98 человек из 130. Таким образом, точность предсказания равна 98:130 = 0,75 или 75% Процентное содержание как мера точности предсказания считается наиболее подходящей мерой дискриминантной информации.