Книги, научные публикации Pages:     | 1 |   ...   | 16 | 17 | 18 | 19 | 20 |   ...   | 22 |

Практическое руководство ТРЕТЬЕ ИЗДАНИЕ НЭРЕШ К. МАЛХОТРА Технологический институт штата Джорджия вильямс WT Москва Х Санкт-Петербург Х Киев 2002 ББК88.5Я75 М19 УДК 681.3.07 Издательский ...

-- [ Страница 18 ] --

Факторный анализ восприятий скидок Оцениваемые пункты' Производители слишком усложняют процесс скидок Почтовые скидки не стоят хлопот, связанных с ними Слишком много времени занимает получение чека на скидку от производителя Производители могли бы делать больше для облегчения процесса использования скидок Производители предлагают скидки, поскольку потребителям это нравится" В настоящее время производители заинтересованы в благосостоянии потребителей" Выгода для потребителей обычно стоит на первом месте при предложении скидок" В целом, производители искренни в своем предложении скидок потребителям" Производители предлагают скидки, чтобы побудить потребителей купить что-то, в чем они на самом деле не нуждаются Производители используют предложения скидок, чтобы заставить потребителей купить неходовой товар Предложение скидки провоцирует вас купить продукт, больше необходимого количества ! Собственные значения Процент объясненной дисперсии Факторные нагрузки Фактор 1 Фактор 2 Фактор 3 0,194 - 0,031 0,013 0,205 0,660 0L5_6_9 0,660 0,716 0,099 0,090 0,230 2,030 27,500 0.671 0,612 Q.71B (Щ6 0,172 0,203 0,002 0,047 0,156 0,027 0,066 1,344 12,2 ~ QJ27 0,352 0,051 0,173 0,101 0,334 0,318 - 0,033 0.744 0.702 0.527 1,062 9, 'Категориями ответов для всех пунктов были: полностью согласен (1}, согласен (2), и не то, чтобы да, и не то, чтобы нет (3), не согласен )4|, совсем не согласен (5), не знаю (6). Ответы "Не знаю" исключили из анализа. "Баллы ло этим пунктам изменили на противоположные. Три фактора включали четыре, четыре и три пункта соответственно (соответствующие факторные нагрузки в таблице подчеркнуты). Фактор 1, по представлению маркетологов, воплотил в себе потребительское восприятие усилий и трудностей, связанных со скидками (усилия). Фактор 2 представляет потребительское доверие к системе скидок (доверие). Фактор 3 представляет восприятие потребителями мотивов производителей для предложения скидок (мотивы). Нагрузки пунктов на соответствующие факторы варьируют от 0,527 до 0,744 [И]. Обратите внимание, что в этом примере, когда первоначальное решение для фактора оказалось неинтерпретируемым, пункты с небольшими нагрузками были исключены, и факторный анализ выполнили по оставшимся пунктам. Если число переменных велико (больше 15), анализ главных компонент и анализ общих факторов приводят к одинаковым решениям. Однако Часть III. Сбор, подготовка и анализ данных анализ главных компонент меньше подвержен ошибочной интерпретации, и поэтому его рекомендуют неопытным аналитикам. Врезка 19.1 "Практика маркетинговых исследований" иллюстрирует применение анализа главных компонент в международных маркетинговых исследованиях [12], а врезка 19.2 "Практика маркетинговых исследований" представляет приложение факторного анализа к изучению проблем этики [13]. Врезка 19.1. Практика маркетинговых исследований Секреты "жуков" Со временем потребности и вкусы потребителей обычно меняются. Предпочтения потребителей по отношению к автомобилям следует постоянно отслеживать для определения изменяющегося спроса и технических требований. Однако есть и одно исключение Ч это "жук" фирмы Volkswagen, С момента начала их выпуска в 1938 году произведено свыше 21 миллиона этих автомобилей. В разных странах провели ряд исследований, чтобы установить причины, почему покупают автомобили этой марки. Анализ главных компонент переменных, отражающих причины приобретения автомобиля "жук", выявил один доминирующий фактор Ч фанатическое пристрастие. Водители глубоко преданы этому шумному и маленькому '"насекомому". В настоящее время старых "жуков" ищут повсюду. "Японцы стремятся узнать все до болтика об этом автомобиле", Ч говорит Джек Финн (Jack Finn), реставратор старых "жуков" из Западного Палм-Бич, штат Флорида. Учитывая высокую преданность "жукам", фирма Volkswagen репозиционпровала "жука", создав новый блестящий VW Passat, дорогой автомобиль высокого качества, который создает имидж изысканности и высокого класса в противоположность старой модели, которая была символом дешевого автомобиля.

Врезка 19.2. Практика маркетинговых исследований Факторы, предсказывающие неэтичное поведение при проведении маркетинговых исследовании Чтобы выявить переменные, влияющие на неэтичную практику маркетинговых исследований, было опрошено 420 специалистов по маркетингу. Их попросили дать оценку по нескольким шкалам ряда переменных и оценить 15 практических исследований, в которых были выявлены этические проблемы. Одна из этих шкал включала 11 пунктов, касающихся степени распространенности этических проблем, которые присущи компании, и действий, которые предпринимает высшая администрация по отношению к неэтичному поведению сотрудников. Анализ главных компонент с вращением факторов методом варимакс показал, что данные можно представить двумя факторами. Затем эти два фактора использовали во множественном регрессионном анализе наряду с четырьмя другими независимыми переменными. Результаты показали, что существуют два предиктора неэтичной практики проведения маркетинговых исследований. Факторный анализ проблем этики и оценки действий высшей администрации Наличие этических проблем внутри компании (фактор 1) 0,66 Отношение руководства компании к этике (фактор 2) 1, Удачливые работники в моей компании подрывают авторитет соперников в глазах влиятельных лиц моей компании 2. Работники одного со мной круга часто ведут себя неэтично 0, Глава 19. Факторный анализ 3. Существует много возможностей для рядовых работников в моей компании вести себя неэтично 4. Удачливые работники в моей компании воплощают в жизнь чужие идеи 5. Чтобы преуспеть в моей компании, часто необходимо идти на компромисс в вопросах этики 6. Преуспевающие работники в моей компании обычно отличаются менее этичным поведением, чем непреуспевающие 7. Преуспевающие работники в моей компании ищут "козла отпущения", если они чувствуют, что их могут в чем-либо обвинить (в плане работы) 8. Удачливые работники в моей компании скрывают информацию, если она может навредить их личным интересам 9. Высшая администрация в моей компании недвусмысленно дает понять, что неэтичное поведение недопустимо 10. Если обнаружат, что работник в моей компании замешан в неэтичном поведении, которое выразилось, главным образом, в получении личной прибыли (а не корпоративной), то на него сразу же наложат дисциплинарное взыскание 11.Если обнаружат, что работник в моей компании замешан в неэтичном поведении, которое выразилось, главным образом, в получении корпоративной прибыли, то на него сразу же наложат дисциплинарное взыскание Собственное значение Процент объясненной дисперсии Коэффициент альфа 0,43 0,81 0,64 0, 0, 0, 0, 0, 0, 5,06 46% 0, 1,17 11% 0, Для упрощения таблицы приведены только факторные нагрузки, полученные после вращения факторов, которые равны 0,40 и больше этого значения. Каждое утверждение оценивали по пятибалльной шкале в диапазоне от 1 Ч полностью согласен до 5 Ч совсем несогласен.

В центре внимания Burke Подход специалистов Burke к цели факторного анализа можно выразить одним словом Ч упрощение! Как правило, интервьюеры компании Burke задают респондентам много вопросов, часть из которых высоко коррелированы между собой. Независимо от того, используется факторный анализ для уточнения того, какие из вопросов служат для измерения одних и тех же базовых понятий, или же с его помощью формируются предикторы для последующего регрессионного анализа, маркетологи Burke всегда осторожно подходят к интерпретации результатов. В качестве примера рассмотрим один из недавних проектов, осуществленный компанией Burke, в котором использовались 16 вопросов (т.е. 16 переменных). На основании корреляционной матрицы проведен анализ главных компонент, в результате которого маркетологи выделили пять факторов или компонент. Дальнейшее вращение факторов методом варимакс показало, что компонент 5 представляет собой, по сути, компонент "одного вопроса1' Часть III. Сбор, подготовка и анализ данных (чтобы прояснить картину, мы опустили нагрузки, значения которых меньше 0,40). Обратите внимание на вопросы, которые дают нагрузку на первый повернутый компонент. Матрица повернутых компонентов' Компонент 1 1/01 1/02 V03 V04 У 05 1/06 У V 2 -0, 4 0, 0,460 0,553 0,675 0,840 0,683 0, 0, 0, 1/09 /10 1/11 V12 V 1/ 0,898 0,472 0,697 0,826 0, 0, 1/15 1/ 0, 0,860 0, Метод выделения факторов: анализ главных компонент. Метод вращения факторов: варимакс с нормированием Кайзера. 'Вращение проведено за 6 итераций. Отбрасываем компонент "одного вопроса", и оставляем решение с четырьмя компонентами. Обратите внимание, что теперь вопрос К10 отчасти связан с переменными 2, 8 и 14, хотя раньше он был частично связан с вопросами компонента 1. Вопрос К14 теперь меньше связан с компонентом 1, чем в первом решении с пятью компонентами. Структура факторов 2 и 3 остается стабильной для двух решений. Матрица повернутых компонент* Компонент 1/01 1/02 I/ 0, 1/04 1/05 1/06 1/ 1/ 0, 0,662 0,837 0,672 0, 0, V V 0, 0, Глава 19. Факторный анализ V11 1/12 0,734 0, 0, 1/ 1/ V 0, 0, 0,438 0, 1/ 0, Метод выделения факторов: анализ главных компонент. Метод вращения факторов: варимакс с нормированием Кайзера.

'Вращение проведено за 5 итераций.

Изложенное выше позволяет высказать некоторые соображения в плане выполнения анализа. 1. Не все вопросы обязательно коррелируются с другими вопросами в такой степени, чтобы образовать самостоятельный компонент. Очень часто причина этого заключается в двусмысленности вопроса или же все респонденты ответят на него очень схожим образом. Обратите внимание на такой вопрос и проверьте, правильно ли он сформулирован. 2. Величины факторных нагрузок могут измениться, если вы вращаете разное число компонент. Посмотрите на самые стабильные вопросы (по нагрузкам) для интерпретации результатов. Даже высокая нагрузка на компонент не означает, что существует взаимосвязь, которая сохранится в условиях вращения разного числа факторов (посмотрите на вопрос 14 при первом пятикомпонентном решении). 3. И последнее замечание. Величины факторных нагрузок переменных, входящих в структуру фактора, свидетельствует об относительном, а не абсолютном, значениях корреляций между вопросами. Можно разделить все корреляции в этой матрице на 10 и те же вопросы будут нагружать те же компоненты после вращения компонент... только факторные нагрузки будут меньше. Нельзя считать, что если факторные нагрузки вопросов входят в структуру одного и тотго же компонента, то они сильно взаимосвязаны. Сила связи определяется долей дисперсии в исходной переменной, которая улавливается фактором.

ИСПОЛЬЗОВАНИЕ INTERNET И КОМПЬЮТЕРА Существуют компьютерные программы для выполнения обоих подходов к проведению факторного анализа Ч методом анализа главных компонент и анализа общих факторов. В программном пакете SPSS можно использовать программу FACTOR для анализа главных компонент, так же как и для анализа общих факторов. Доступны и другие методы факторного анализа и вычисления значения фактора. В пакете SAS с помощью программы PRINCOMP выполняют анализ главных компонент и вычисляют их значения. Для выполнения анализа общих факторов можно использовать программу FACTOR. Программа FACTOR также выполняет анализ главных компонент. В пакете BMDP можно выполнить анализ главных компонент и анализ общих факторов с помощью программы 4М [14]. В программе Minitab можно выполнить факторный анализ с помощью опции Multivariate>Factor analysis, используя главные компоненты или метод максимума правдоподобия для исходного выделения факторов. При использовании метода максимума правдоподобия определите количество выделяемых факторов. Если количество не установлено при выделении главных компонент, то программа установит количество, равное количеству переменных в наборе данных. Выполнение факторного анализа недоступно в Excel (версия 7.0 для PC).

Часть III. Сбор, подготовка и анализ данных РЕЗЮМЕ Факторный анализ Ч это общее название для класса методов, используемых, главным образом, для сокращения числа переменных и их обобщения. Каждую переменную выражают как линейную комбинацию латентных факторов. Аналогично, сами факторы можно выразить как линейную комбинацию наблюдаемых переменных. Факторы выделяют таким образом, что первый фактор объясняет самую высокую долю дисперсии, второй Ч следующую по величине долю дисперсии и т.д. Кроме того, можно выделить факторы так, что они будут некоррелированными, как это и делают в анализе главных компонент. При формулировании проблемы факторного анализа переменные, включаемые в факторный анализ, задаются, исходя из прошлых исследований, теоретических выкладок и по усмотрению исследователя. Эти переменные измеряются в интервальной или относительной шкале. В основе факторного анализа лежит матрица корреляций между переменными. Приемлемость корреляционной матрицы для факторного анализа определяется статистической проверкой. Существует два основных метода проведения факторного анализа Ч анализ главных компонент и анализ общих факторов. В анализе главных компонент учитывается полная дисперсия. Анализ главных компонент рекомендуется, если основная задача исследователя Ч определение минимального числа факторов, которые вносят максимальный вклад в дисперсию, чтобы в последующем использовать их во многомерном анализе. В анализе общих факторов факторы оценивают только по общей (для всех факторов) дисперсии. Этот метод подходит, если основная задача Ч определение факторов, лежащих в основе изучаемой переменной, и общей дисперсии. Этот метод также известен как разложение матрицы. Число выделяемых факторов определяется, исходя из предварительной информации;

собственных значений факторов;

критерия ''каменистой осыпи";

процента объясненной дисперсии;

метода расщепления;

критериев значимости. Несмотря на то, что матрица исходных или неповернутых факторов указывает на взаимосвязь факторов и отдельных переменных, она редко приводит к факторам, которые можно интерпретировать, поскольку факторы коррелируют со многими переменными. Поэтому вращением матрицу факторных коэффициентов преобразуют в более простую, которую легче интерпретировать. Самый распространенный метод вращения матрицы Ч метод варимакс (вращение, максимизирующее дисперсию), который приводит к ортогональным факторам. Если факторы в совокупности высоко коррелированны, то можно использовать косоугольное вращение. Матрица повернутых факторов создает основу для интерпретации факторов. Для каждого респондента можно вычислить значение фактора. Альтернативно, можно выбрать переменные-заменители, изучив матрицу факторных нагрузок и выбрав для каждого фактора переменную с наивысшим (или ближайшим к наивысшему) значением факторной нагрузки. Разницу между наблюдаемыми корреляциями и вычисленными, которую оценивают исходя из матрицы факторных нагрузок, используют для определения степени подгонки эмпирической модели.

ОСНОВНЫЕ ТЕРМИНЫ И ПОНЯТИЯ Х анализ главных компонент (principal components analysis) Х анализ общих факторов (common factor Х график "каменистой осыпи" (scree plot) Х диаграмма факторных нагрузок (factor loading plot). значение фактора (factor scores) Х корреляционная матрица (correlation matrix) Х косоугольное вращение (oblique rotation) Х критерий адекватности выборки КайзеpaЧ МейераЧОлкина (KaiserЧ MeyerЧ Olkin measure of sampling adequacy) Х критерий сферичности Бартлетта (Bartlett's test of sphericity) Глава 19. Факторный анализ Х матрица факторных нагрузок (factor maХ метод варимакс (вращение, максимизирующее дисперсию) (varimax procedure) Х метод взаимозависимости (interdependence techinque) Х общность (communality) Х ортогональное вращение (orthogonal rotation) Х остатки (residuals) Х про цент дисперсии (percentage of variance). собственное значение (eigenvalue) Х фактор (factor) " факторные нагрузки (factor loadings) * факторный анализ (factor analysis) УПРАЖНЕНИЯ Вопросы 1. Чем отличается факторный анализ от множественной регрессии и дискриминантного анализа? 2. В чем главная цель факторного анализа? 3. Опишите модель факторного анализа. 4. Какую гипотезу проверяют критерием сферичности Бартлетта? С какой целью его ис- пользуют? 5. Что означает термин "общность переменной"? 6. Дайте краткие определения следующим понятиям: собственное значение, нагрузки факторов, матрица факторных нагрузок и значение фактора. 7. Для какой цели используют критерий адекватности выборки Кайзера-Мейера-Олкина? 8. Назовите главное отличие между анализом главных компонент и анализом общих факторов. 9. Объясните, как используют собственные значения для определения числа факторов. 10. Что такое график "каменистой осыпи"? С какой целью его используют? 11. Почему полезно вращение факторов? Назовите наиболее распространенные методы вращения. 12. Какими принципами следует руководствоваться при интерпретации факторов? 13. Когда полезно вычислять значение фактора? 14. Что такое переменные-заменители? Как их определяют? 15. Как проверяют подгонку модели факторного анализа?

Задачи 1. Закончите пустую колонку в таблице, демонстрирующей результаты анализа главных компонент:

Переменная f, 1/ Общность 1, 1, Фактор Собственное значение 3, 1, Процент дисперсии l/з 1,03 1,04 1,05 1, 3 4 5 1,23 0,78 0,35 0, ^ 1/5 I/ Часть III. Сбор, подготовка и анализ данных 1/7 l/e 1,07 1, 7 0,19 0, 2. Начертите диаграмму "каменистой осыпи", исходя из данных задачи 1. 3. Сколько факторов следует выделить в задаче 1? Обоснуйте ваш ответ.

УПРАЖНЕНИЯ С ИСПОЛЬЗОВАНИЕМ INTERNET И КОМПЬЮТЕРА 1. В исследовании взаимосвязи между поведением в семье и поведением при покупке получены данные по семибалльной шкале (1 Ч не согласен, 7 Ч согласен) по следующим заявлениям о стиле жизни: У} Я лучше спокойно провел бы вечер дома, чем пошел на вечеринку Уг Я всегда проверяю цены, даже на товар с маленькой ценой Уг Магазины меня интересуют больше, чем кинофильмы Ул Я не покупаю товары, которые рекламируют на бигбордах У$ Я Ч домосед У6 Я экономлю, используя купоны для покупки товаров У7 Компании зря тратят большие деньги на рекламу Данные, полученные из выборки 25 респондентов, приведены в следующей таблице. Номер V, ft V V 6 Vs Vfl 3 6 6 Vr Номер Иг 14 15 16 17 18 Vi Vj 5 4 5 2 5 6 6 3 2 V Vs Ve Ъ 2 7 3 2 ? G 3 5 3 3 5 6 6 1 2 3 2 2 5 4 5 5 4 2 3 2 3 Ь 2 4 6 4 3 4 2 Ь 6 7 8 10 11 12 7 5 5 ? 3 2 3 7 7 2 4 2 6 5 3 7 4 2 3 2 1 2 6 5 4 3 2 5 2 3 4 2 7 5 4 1 4 2 6 2 1 3 7 6 5 7 4 Ь i a) b) c) d) e) f) 3 5 7 7 5 7 4 5 2 4 24 4 6 5 3 5 ? 2 7 6 1 Б 25 7 (i 3 7 2 2 6 I 5 6 Проанализируйте эти данные, используя анализ главных компонент с методом вращения варимакс. Интерпретируйте выделенные факторы. Вычислите значение факторов для каждого респондента. Если надо выбрать переменные-заменители, то какие вы выбрали бы? Проверьте подгонку модели. Проанализируйте данные, используя анализ общих факторов, и ответьте на вопрос Ь) после ответа на вопрос е), 5 20 21 22 2 4 G 6 Глава 19. Факторный анализ ПРИЛОЖЕНИЕ 19А Фундаментальные уравнения факторного анализа В модели факторного анализа выводят гипотетические компоненты, которые объясняют линейную зависимость между наблюдаемыми переменными 1. Модель факторного анализа требует, чтобы зависимость между переменными была линейной, а переменные имели ненулевые корреляции между собой. Выводимые гипотетические компоненты обладают следующими свойствами. 1. Они образуют линейно независимый набор переменных. Ни один из гипотетических компонент не выводится из других гипотетических компонент, как их линейная комбинация. 2. Переменные, являющиеся гипотетическими компонентами, можно разделить на два основных вида Ч общие факторы и характерные факторы. Они отличаются структурой весов в линейном уравнении, которое выводит значение наблюдаемой переменной из гипотетических компонент. Общий фактор имеет несколько переменных с ненулевым весом или факторной нагрузкой, соответствующей этому фактору. (Фактор называется общим, если хотя бы две его нагрузки значительно отличаются от нуля.) Характерный фактор имеет только одну переменную с ненулевым весом. Следовательно, только одна переменная зависит от характерного фактора. 3. Всегда принимают, что общие факторы не коррелируют с характерным фактором. Также обычно принимают, что характерные факторы взаимно некоррелированы, но общие факторы могут или не могут коррелировать между собой. 4. Обычно принимают, что число общих факторов немного меньше, чем число наблюдаемых переменных. Однако число характерных факторов обычно принимают равным числу наблюдаемых переменных. Используют следующие условные обозначения: Х= п х 1 Ч случайный вектор наблюдаемых случайных переменных Xlt X2, Х3,... Хп. Принимают, что Е(Х) = 0 и Е(ХХ) = АИ Ч корреляционная матрица с единицами на главной диагонали. F= т х 1 Ч вектор т общих факторов /",, F2t... Fm. Принимают, что E(F) = 0 и (FF) = RffЧ корреляционная матрица. UЧ я х 1 Ч случайный вектор л характерных факторов переменных t/,, U2,... Un, Принимают, что Характерные факторы нормированы с единичными дисперсиями и взаимно некоррелированы. А = п х т Ч матрица коэффициентов, называемая матрицей факторных нагрузок (матрицей факторной модели). VЧ п х п Ч диагональная матрица коэффициентов для характерных факторов.

' Приложение подготовлено на основании Stanley A. Muiiak. The Foudations of Factor Analysis (New york: McGraw-Hill, 1972).

Часть III. Сбор, подготовка и анализ данных Наблюдаемые переменные, которые являются координатами X, представляют собой взвешенные комбинации общих факторов и характерных факторов. Основное уравнение факторного анализа можно записать так:

X=AF+VU Корреляции между переменными, выраженные факторами, можно вывести следующим образом;

ЛЛ = Е(ХХ') = Е{(АР + УЦ) (AF + VU)1} = = E(AFF'A'+AFU'V' + VUF'A') = VUU'V') = V1.

Задав, что общие факторы не коррелировали с характерными факторами, получим: R^ = R^' = 0. Следовательно, R^. Ч AR^A' + V1. Предположим, что мы вычли матрицу дисперсии характерного фактора И из обеих частей уравнения. В результате получим: RX, зависит только от переменных общего фактора, и корреляции между переменными связаны только с общим фактором. Пусть Rc =RatЧ У1' вычисленная корреляционная матрица. Мы уже определили матрицу факторной модели А. Коэффициенты матрицы модели факторов представляют собой веса, присвоенные общим факторам, когда наблюдаемые переменные выражены линейными комбинациями общего и характерного факторов. Теперь мы определим матрицу факторной структуры. Коэффициенты матрицы факторной структуры представляют собой ковариации между наблюдаемыми переменными и факторами. Матрица факторной структуры полезна при интерпретации факторов, так как она показывает, какие переменные аналогичны по отношению к переменной общего фактора. Матрицу факторной структуры А. определяют по формуле: А, = E(XF') = Е[ (AF + W)F'} = ARff + VR,f ~ ARff Таким образом, матрица факторной структуры эквивалентна матрице модели факторов А, умноженной на матрицу ковариаций между факторами Rff Заменив Arff на А, получим вычисленную (редуцированную) матрицу как произведение матрицы факторной структуры на матрицу модели факторов.

= АА КОММЕНТАРИИ 1. Gerhard Mels, Christo Boshoff, Deon Nel, "The Dimensions of Service Quality: The Original European Perspective Revisited", Service Industries Journal, January 1997, p. 173Ч189;

James M. Sinukula, Leanna Lawtor, "Positioning in the Financial Services Industry: A Look at the Decomposition of Image", in Jon M. Hawes, George B. Glisan (eds.), Developments in Marketing Science, vol. 10 (Akron, OH: Academy of Marketing Science, 1987), p. 439-442. 2. Более подробно о факторном анализе см. работы Jacques Tacq, Multivariate Analysis Techniques in Social Science Research (Thousand Oaks, CA: Sage Publications, 1996);

George H. Dunteman, Principal Components Analysis (Newbury Park, CA: Sage Publications, 1989). О современном применении факторного анализа см. статью Jennifer L. Aaker, ''Dimensions of Btand Personality", Journal of Marketing Research, August 1997, p. 347-356. 3. См., например, статьи Shirely Bo Edvardsson, Gerry Larsson, Sven Setterlind, "Internal Service Quality and the Psychosocial Work Environment: An Empirical Analysis of Conseptual Interrelatedness", Service Industries Journal, April 1997, p. 252Ч263;

Shirley Taylor, "Waiting for Service: The Relationship between Delays and Evaluations of Service", Journal of Marketing, April 1994, p. 56Ч69. Глава 19. Факторный анализ 4.

См. работы Janjay Gaur, "Adelman and Morris Factor Analysis of Developing Countries", Journal of Policy Modeling, August 1997, p. 407-415;

John L. Lastovicka, Kanchana Thamodaran, "Common Factor Score Estimates in Multiple Regression Problems", Journal of Marketing Research, February 1991, p. 105-112;

W.R. Dillon, M. Goldstein, Muitivariate Analysis: Methods and Applications (New York, NY: John Wiley, 1984), p. 23-99.

5. О современном применении факторного анализа см. статью Christopher D. Ittner, David F. Larker, "Product Development Cycle Time and Organizational Performance", Journal of Marketing Research, February 1997, p. 13-23. 6. Alexander Basilevsky, Statistical Factor Analysis & Related Methods: Theory & Applications (New York: John Wiley, 1994);

Joseph F. Hair, Jr., Ralph E. Andersom, Ronald L. Tatham, William C. Black, Muitivariate Data Analysis with Readings, 5th ed. (Upper Saddle River, NJ: Prentice Hall, Inc., 1999). 7. На факторный анализ оказывает большее влияние относительная, а не абсолютная величина коэффициентов корреляций.

8. См. работы James A. Roberts, Donald R. Beacon, "Exploring the Subtle Relationships between Environmental Concern and Ecologically Conscious Behavior", Journal of Business Research, September 1997, p. 79Ч89;

Sangit Chatterjee, Linda Jamieson, Frederick Wiseman, "Identifying Most Influential Observations in Factor Analysis", Marketing Science, Spring 1991, p. 145Ч160;

Frank Acito, Ronald D. Anderson, "A Monte Carlo Comparison of Factor Analytic Methods", Journal of Marketing Research, May 1980, p. 228-236. 9. Существуют и другие методы ортогонального вращения, Метод квартимакс минимизирует число факторов, необходимых для объяснения переменной. Метод эквимакс представляет собой комбинацию методов варимакс и квартимакс.

10. James E. Zemanek, Jr., "Manufacturer Influence versus Manufacturer Salesperson Influence over the Industrial Distributor"', Industrial Marketing Management, January 1997, p. 59Ч66;

Ronald C. Curban, Robert J. Kopp,''Obtaining Retailer Support for Trade Deals: Key Success Factor", Journal of Advertising Research, December 1987ЧJanuary 1988, p. 51Ч60. 11. William M. Bulkeley, "Rebates' Secret Appeal to Manufacturers: Few Consumers Actually Redeem Them", Wall Street Journal, February 10, 1998, p. B1-B2;

Donald R. Lichtenstein, Nancy M. Ridgway, Richard G. Netemeyer, ''Price Perceptions and Consumer Shopping Behavior: A Field Study", Journal of Marketing Research, May 1993, p. 234Ч245;

Peter Tat, William A. Cunningham III, Emin Babakus, "Consumer Perceptions of Rebates", Journal of Advertising Research, AugustSeptember 1988, p. 45-50. 12. "Return of the Beetle", The Economist, January 10, 1998, p. 54. 13. William J, Bigoness, Gerald L. Blakely, "A Cross-National Study of Managerial Values", Journal of Internationa! Business Studies, Fourth Quarter 1996, p. 739Ч752;

Ishmael Akaah, Edward A. Riordan, "The Incidence of Unethical Practices in Marketing Research: An Imperical Investigation", Journal of the Academy of Marketing Science 18(1990),p. 143Ч152. 14. Eric L. Einspruch, An Introductory Guide to SPSS for Windows (Thousand Oaks, CA: Sage Publications, 1998);

Paul E. Specter, SAS Programming for Researchers and Social Scientists (Thousand Oaks, CA: Sage Publications, 1993);

Mohamed Afzal Norat, "Software Reviews", Economic Journal: The Journal of the Royal Economic Society, May 1997, p. 857-882;

Seiter Charles, "The Statistical Difference", Macworld, October 1993, p. 116-121.

Часть III. Сбор, подготовка и анализ данных Глава 2О Кластерный анализ После изучения материала этой главы вы должны уметь...

1. Описывать основную идею, область применения кластерного анализа и его важность в маркетинговых исследованиях. 2. Анализировать статистики, используемые в ходе кластерного анализа. 3. Объяснять ход выполнения кластерного анализа, включая формулирование проблемы, выбор способа измерения расстояния, выбор метода кластеризации, принятие решения о числе кластеров, интерпретацию и профилирование кластеров. 4. Описывать цель и методы оценивания качества результатов кластеризации. 5. Рассматривать надежность и достоверность результатов кластеризации. 6. Обсуждать применение неиерархической кластеризации и кластеризации переменных.

КРАТКИЙ ОБЗОР С помощью кластерного анализа, как и рассмотренного ранее факторного (глава 19), маркетологи проверяют весь набор взаимозависимых связей. В кластерном анализе не проводят различия между зависимыми и независимыми переменными. Более того, проверяются взаимозависимые связи всего набора переменных. Цель кластерного анализаЧ классификация объектов на относительно гомогенные (однородные) группы, исходя из рассматриваемого набора переменных. Объекты в группе относительно схожи с точки зрения этих переменных и отличаются от объектов в других группах. Если кластерный анализ использовать именно таким образом, то он становится составной частью факторного анализа, так как снижает число объектов, а не число переменных, сгруппировывая их в меньшее число кластеров. В этой главе описана основная идея кластерного анализа. Этапы кластерного анализа рассматриваются и иллюстрируются в контексте иерархической группировки с помощью статистического программного пакета. Далее представлено применение не иерархи чес кой кластеризации, которое следует за обсуждением разбиения переменных на кластеры. Начнем с двух примеров. СКВОЗНОЙ ПРИМЕР. ВЫБОР УНИВЕРМАГА Кластерный анализ Маркетологи разделили респондентов на группы (кластеры), исходя из оценок важности, которую они присвоили каждому критерию выбора универмага. Результаты кластеризации показали, что респондентов можно разбить на четыре сегмента. Различия между сегментами были подвергуты статистической проверке. Маркетологи обнаружили, что в каждый сегмент входили респонденты, относительно однородные по критерию выбора магазина. Затем отдельно для каждого сегмента разработали модель выбора магазина. В результате маркетоj логи получили модели выбора магазина, достаточно хорошо показывающих то, как проис1 ходит выбор респондентами магазинов в конкретных сегментах.

Глава 20. Кластерный анализ ПРИМЕР. Любители мороженого Руководство компании ffaagen-Dazs Shoppe, которая имеет около 300 магазинов по продаже мороженого на всей территории Соединенных Штатов Америки, искало возможности привлечения новых покупателей. С этой целью было решено провести маркетинговое исследование для определения новых сегментов потенциальных потребителей, за счет которых можно было бы увеличить объемы продаж. Для решения этой задачи применили геодемографию, т.е. метод кластеризации потребителей, основанный на географических, демографических характеристиках, а также характеристиках образа жизни. Первоначально провели исследование для разработки демографических и психографических профилей покупателей продукции фирмы ffaagen-Dazs, включая частоту покупок, время, дни недели и другие переменные, связанные с использованием товара. Кроме того, маркетологи получили адреса и почтовые индексы респондентов. Затем, исходя из метода кластеризации, разработанного Claritas, респондентов распределили по 40 геодемографических кластерам. Используя эту | информацию, компания ffaagen-Da& определила несколько потенциальных групп потребиI телей, которые могли увеличить объем продаж [1]. Пример компании Haagen-Dazs иллюстрирует использование кластерного анализа для получения однородных сегментов с целью формулирования конкретных маркетинговых стратегий. В примере с универмагами метод кластеризации использовался для разбивки респондентов на группы для последующего выполнения многомерного анализа.

СУЩНОСТЬ КЛАСТЕРНОГО АНАЛИЗА Кластерный анализ представляет собой класс методов, используемых для классификации объектов или событий в относительно однородные группы, которые называют мастерами (clusters). Объекты в каждом кластере должны быть похожи между собой и отличаться от объектов в других кластерах. Кластерный анализ также называют классификационным анализом (classification analysis) или численной таксономией (систематикой) (numerical taxonomy) [2]. Мы рассмотрим процедуры кластеризации, которые относят каждый объект к одному и только одному кластеру [3]. На рис. 20.1 показана идеальная ситуация кластеризации, когда кластеры четко отделены друг от друга на основании различий двух переменных: ориентация на качество (переменная 1), и чувствительность к цене (переменная 2), Переменная Рис. 20,1. Идеальная ситуация кластеризации Следует отметить, что каждый потребитель попадает в один из кластеров, и перекрывающихся областей нет. С другой стороны, на рис. 20.2 представлена ситуация кластеризации, которая чаще всего встречается на практике.

Часть III. Сбор, подготовка и анализ данных ХХХ..v Х%"Хл.Х*.* Переменная 2 Рис. 20.2. Реальная ситуация кластеризации На рис. 20.2 границы некоторых кластеров очерчены нечетко, и отнесение некоторых потребителей к конкретному кластеру не очевидно, поскольку многие из них нельзя сгруппировать в тот или иной кластер. Кластерный анализ, как и дискриминантный, предназначен для классификации переменных. Однако в дискриминантном анализе необходима предварительная информация о кластерной (групповой) принадлежности каждого рассматриваемого объекта или события для того, чтобы разработать правило классификации. В отличие от этого, в кластерном анализе нет необходимости в предварительной информации о кластерной принадлежности любого из объектов. Группы, или кластеры, определяют с помощью собранных данных, а не заранее [4]. Кластерный анализ используют в маркетинге для различных целей [5]. Х Сегментация рынка. Например, потребителей можно разбить на кластеры на основе выгод, которые они ожидают получить от покупки данного товара. Каждый кластер может состоять из потребителей, которые ищут схожие выгоды [6]. Этот метод называют сегментаций преимуществ (benefit segmentation). Мы проиллюстрируем его на следующем примере.

Х.Х ПРИМЕР. Отпускники бывают разными В исследовании, посвященном моделям принятия решений людьми, проводящими свой отпуск за рубежом, маркетологи получили от 260 респондентов информацию, касающуюся шести психографических направлений: психологического, образовательного, социального, релаксационного, физиологического и эстетического. Для разбивки респондентов на психографические сегменты использовали кластерный анализ. Первый сегмент (53%) состоял из людей с высоким (или близким к нему) уровнем жизни. Эту группу назвали "требовательными". Во вторую группу (20%) входили лица с высоким образовательным уровнем, ее назвали "интеллектуалы". Лица, входящие в последнюю группу (26%), оказались большими любителями релаксации (развлечений). Они получили низкую оценку по социальной шкале, и были названы "беглецами" (от действительности). Чтобы привлечь отпускников в каждый из сегментов, разработали специальные маркетинговые стратегии [7].

Глава 20. Кластерный анализ Понимание поведения покупателей. Кластерный анализ используется для идентификации однородных групп покупателей. Затем поведение каждой группы при покупке товара изучается отдельно, как, например, в проекте "Выбор универмага". В этом случае респондентов разбили на группы, исходя из оценок важности, которую они присвоили каждому критерию, используемому для выбора универмага. Кластерный анализ также использовали, чтобы определить виды стратегий, применяемых покупателями автомобилей для получения внешней информации. Х Определение возможностей нового товара. Кластеризацией торговых марок и товаров можно определить конкурентоспособные наборы в пределах данного рынка. Торговые марки в одном и том же кластере конкурируют более жестхо между собой, чем с марками других кластеров. Фирма может изучить свои текущие предложения в сравнении с предложениями своих конкурентов, чтобы определить потенциальные возможности новых товаров. Х Выбор тестовых рынков. Группировкой городов в однородные кластеры можно подобрать сравнимые города для проверки различных маркетинговых стратегий, Х Сокращение размерности данных. Кластерный анализ можно использовать как основной инструмент сокращения размерности данных при создании кластеров или подгрупп данных, более удобных для анализа, чем отдельные наблюдения. Последующий многомерный анализ выполняют над кластерами, а не над отдельными наблюдениями. Например, чтобы описать отличия в поведении потребителей по отношению к товарам, их вначале разбивают на группы. Затем различия между группами проверяют с помощью множественного дискриминантаого анализа.

Х СТАТИСТИКИ, СВЯЗАННЫЕ С КЛАСТЕРНЫМ АНАЛИЗОМ Прежде чем начать разговор о статистиках, соответствующих кластерному анализу, следует упомянуть о том, что большинство методов кластеризации Ч относительно простые процедуры, не требующие изощренных статистических расчетов. Можно даже сказать, что методы кластеризации представляют собой эвристические методы, основанные на определенных алгоритмах действий исследователя. Тем самым кластерный анализ резко отличается от дисперсионного, регрессионного, дискриминантного и факторного, которые базируются на обширных статистических расчетах. Хотя многие методы кластеризации обладают важными статистическими свойствами, необходимо признать фундаментальную простоту этих методов [8]. Следующие статистики и понятия связаны с кластерным анализом. Х План агломерации, объединения (agglomeration schedule). Дает информацию об объектах (событиях, случаях), которые должны быть объединены на каждой стадии процесса иерархической кластеризации. Кластерный центроид (cluster centroid). Среднее значение переменных для всех случаев или объектов в конкретном кластере, Кластерные центры (cluster centers). Исходные начальные точки в неиерархической кластеризации. Кластеры строят вокруг этих центров, или зерен кластеризации.

Х Х Х Принадлежность кластеру (cluster membership). Указывает кластер, которому принадлежит каждый случай или объект. Х Древовидная диаграмма (дендрограмма) (dendrogram). Ее также называют древовидный графЧ графическое средство для показа результатов кластеризации. Вертикальные линии представляют объединяемые кластеры. Положение вертикальной линии на шкале расстояния (горизонтальная ось) показывает расстояния, при которых объединяли кластеры. Древовидную диаграмму (рис, 20.8) читают слева направо.

Часть III. Сбор, подготовка и анализ данных Расстояния между кластерными центрами (distances between cluster centres). Указывают, насколько разнесены отдельные пары кластеров, Кластеры, которые разнесены широко, ясно выражены и поэтому желательны. Сосульчатая диаграмма (icicle diagram), Это графическое отображение результатов кластеризации. Она названа так потому, что имеет сходство с рядом сосулек, свисающих с крыши дома. Сосульчатую диаграмму (рис. 20.7) читают сверху вниз. Матрица сходства/матрица расстояний между объединяемыми объектами (similarity/distance coefficient matrix). Матрица сходства (расстояний) Ч это нижняя треугольная матрица, содержащая значения расстояния между парами объектов или случаев.

ВЫПОЛНЕНИЕ КЛАСТЕРНОГО АНАЛИЗА Этапы выполнения кластерного анализа представлены на рис. 20.3.

терпретация и профилирование кластеров Рис. 20.3. Выполнение кластерного анализа Первый этап Ч формулировка проблемы кластеризации путем определения переменных, на базе которых она будет проводиться, Затем выбирается соответствующий способ измерения расстояния. Мера расстояния показывает, насколько объекты, подвергнутые кластеризации, схожи или не схожи между собой. Разработано несколько методов кластеризации, и исследователю необходимо выбрать наиболее подходящий для решения данной проблемы. Решение о числе кластеров также принимает исследователь. Сформированные кластеры нужно анализировать с точки зрения переменных, использованных для их получения, а также для профилирования кластеров можно использовать дополнительные явно выраженные переменные. И наконец, исследователь должен оценить достоверность (качество) процесса кластеризации.

Формулировка проблемы Возможно, самая важная часть формулирования проблемы кластеризации Ч это выбор переменных, на основе которых проводят кластеризацию. Включение даже одной или двух посторонних (не имеющих отношение к группированию) переменных может исказить результаты кластеризации. Задача состоит в том, чтобы выбранный набор переменных смог описать сходство между объектами с точки зрения признаков, имеющих отношение к данной проблеме маркетингового исследования. Переменные следует выбирать, исходя из опыта прошлых исследований, теории или тестируемой гипотезы. Экспериментатор должен обладать интуицией и уметь делать выводы.

Глава 20. Кластерный анализ Для иллюстрации сказанного рассмотрим кластеризацию потребителей на основе их отношения к посещению магазинов для покупки товаров. Опираясь на прошлый опыт, маркетологи определили шесть переменных. Потребителей попросили выразить их степень согласия со следующими утверждениями по семибалльной шкале (1 Ч не согласен, 7 Ч согласен): V\ Посещение магазинов для покупки товаров Ч приятный процесс. 1/2 Посещение магазинов для покупки товаров плохо сказывается на вашем бюджете, ^з Я совмещаю посещение магазинов для покупки товаров с питанием вне дома. 1/4 Я стараюсь сделать лучшие покупки при посещении магазинов. /5 Мне не нравится посещение магазинов для покупки товаров. VG Вы можете сэкономить много денег, сравнивая цены в разных магазинах, Данные, полученные от 20 респондентов, приведены в табл. 20.1.

I Таблица 20.1. Данные для кластеризации Номер п/п V, V 4 Уз V Vs Ve /.Х' 6 2.' 7 1 6 2 6 6 3 л 4 :: 3 ".

3 h 3 1 i 5 7 8 10 2 3 3 4 Э 6 3 4 5 2 В 5 2 3 4 5 3 л : 2 5 5 2 * Х! -Х: Х1 Х;

6 4 7 12 14 15 16 G 5 л 6 4 4 5 3 7 ! 1 7 4 2 7 6 2 3 19 На практике кластеризацию выполняют для значительно больших по размеру выборок, состоящих из 100 и больше респондентов. Мы взяли небольшую выборку для иллюстрации процесса кластеризации.

Выбор способа измерения расстояния или меры сходства Цель кластеризация Ч группирование схожих объектов. Поэтому для того чтобы оценить, насколько они похожи или непохожи, необходимо использовать некую единицу измерения. Наиболее распространенный метод заключается в том, чтобы в качестве такой меры использовать расстояния между двумя объектами. Объекты с меньшими расстояниями между собой больше похожи, чем объекты с большими расстояниями. Существует несколько способов вычисления расстояния между двумя объектами [9]. 752 Часть III. Сбор, подготовка и анализ данных Наиболее часто используемая мера сходстваЧ евклидово расстояние или его квадрат [10]. Евклидово расстояние (геометрическое расстояние в многомерном пространстве) равно квадратному корню из суммы квадратов разностей значений для каждой переменной. Евклидово расстояние (euclidean distance) Квадратный корень из суммы квадратов разностей в значениях для каждой переменной Существуют и другие способы измерения расстояния. Расстояние городских кварталов) (city-block, или манхэттенское расстояние (Manhattan distance) между двумя объектами Ч это сумма абсолютных разностей в значениях для каждой переменной. Расстояние Чебышева (Chebychev distance) между двумя объектами Ч это максимальная абсолютная разность в значениях для любой переменной. Для нашего примера используем квадрат евклидова расстояния. Если переменные измерены в различных единицах, то единица измерения влияет на решение кластеризации. В исследовании, посвященном посещению супермаркетов для покупки товаров, переменные, выражающие отношение к посещению магазина, можно измерить по шкале Лайкерта;

патронаж (постоянство в посещении магазина) можно выразить через частоту посещений магазина в месяц и через сумму, потраченную на покупки;

лояльность к торговой марке Ч через процент средств, потраченных на покупку товаров в любимом супермаркете. В этих случаях перед кластеризацией респондентов мы должны нормализовать данные, изменив шкалу измерения каждой переменной таким образом, чтобы среднее равнялось нулю, а стандартное отклонение Ч единице. Хотя нормализация может исключить влияние единицы измерения, она также уменьшает различия между группами по переменным, которые наилучшим образом дискриминируют (отличают) группы или кластеры. Кроме того, желательно удалить выбросы (т.е. случаи с нетипичными значениями) [111. Использование различных способов измерения расстояния ведет к разным результатам кластеризации. Следовательно, целесообразно использовать различные меры сходства и затем сравнить результаты. Выбрав меру сходства, затем можно выбрать метод кластеризации.

Выбор метода кластеризации На рис. 20.4 приведена классификация методов кластеризации. Методы кластеризации могут быть иерархическими и неиерархическими. Иерархическая кластеризация (hierarchical clustering) характеризуется построением иерархической, или древовидной, структуры. Иерархическая кластеризация (hierarchical clustering) Метод кластеризации, характеризующийся построением иерархической, или древовидной, структуры. Иерархические методы могут быть агломеративными (объединительными) и дивизивными. Агломеративная кластеризация (agglomerative clustering) начинается с каждого объекта в отдельном кластере. Кластеры объединяют, группируя объекты каждый раз во все более и более крупные кластеры. Этот процесс продолжают до тех пор, пока все объекты не станут членами одного единственного кластера. Агломеративная, или объединительная, кластеризация (agglomerative clustering) Иерархический метод кластеризации, при которой каждый объект первоначально находится в отдельном кластере. Кластеры формируют, группируя объекты каждый раз во все более и более крупные кластеры. Разделяющая, или дивизивная, кластеризация (divisive clustering) начинается со всех объектов, сгруппированных в единственном кластере. Кластеры делят (расщепляют) до тех пор, пока каждый объект не окажется в отдельном кластере.

Глава 20. Кластерный анализ Методы кластеризации Рис, 20.4. Классификация методов кластеризации Разделяющая, или дивизивная, кластеризация (divisive clustering) Иерархический метод кластеризации, при котором все объекты первоначально находятся е одном большом кластере. Кластеры формируют делением этого большого кластера на более мелкие. Обычно в маркетинговых исследованиях используют агломеративные методы, например методы связи, дисперсионные и центроидные методы. Методы связи (linkage methods) включают метол одиночной связи, метод полной связи и метод средней связи. Методы связи (linkage methods) Агломеративные методы иерархической кластеризации, которые объединяют объекты в кластер, исходя из вычисленного расстояния между ними.

Часть III. Сбор, подготовка и анализ данных В основе метода одиночной связи (single method) лежит минимальное расстояние, или правило ближайшего соседа. Метод одиночной связи (single method) Метод связи, в основе которого лежит минимальное расстояние между объектами, или правило ближайшего соседа. При формировании кластера первыми объединяют два объекта, расстояние между которыми минимально. Далее определяют следующее по величине самое короткое расстояние, и в кластер с первыми двумя объектами вводят третий объект. На каждой стадии расстояние между двумя кластерами представляет собой расстояние между их ближайшими точками (рис. 20.5).

Одиночная связь Минимальное Кластер! расстояние Полная связь ю,астер Кластер Максимальное расстояние Средняя связь Кластер Кластер Среднее расстояние Кластер Рис. 20.5. Методы связи для процедуры кластеризации На любой стадии два кластера объединяют по единственному кратчайшемурасстоянию между ними. Этот процесс продолжают до тех пор, пока все объекты не будут объединены в кластер. Если кластеры плохо определены, то метод одиночной связи работает недостаточно хорошо. Метод полной связи (complete linkage) аналогичен методу одиночной связи, за исключением того, что в его основе лежит максимальное расстояние между объектами, или правило дальнего соседа. В методе полной связи расстояние между двумя кластерами вычисляют как расстояние между двумя их самыми удаленными точками. Метод полной связи (complete linkage) Метод связи, в основе которого лежит максимальное расстояние между объектами, или правило дальнего соседа.

Глава 20. Кластерный анализ Метод средней связи (average linkage) действует аналогично. Однако в этом методе расстояние между двумя кластерами определяют как среднее значение всех расстояний, измеренных между объектами двух кластеров, при этом в каждую пару входят объекты из разных кластеров (см. рис. 20.5). Метод средней связи (average linkage) Метод связи, в основе которого лежит среднее значение всех расстояний, измеренных между объектами двух кластеров, при этом в каждую пару входят объекты из разных кластеров. Из рис. 20.5 видно, что метод средней связи использует информацию обо всех расстояниях между парами, а не только минимальное или максимальное расстояние. По этой причине обычно предпочитают метод средней связи, а не методы одиночной или полной связи. Дисперсионные методы (variance methods) формируют кластеры таким образом, чтобы минимизировать внутрикластерную дисперсию. Дисперсионный метод (variance methods) Агломеративный метод иерархической кластеризации, в котором кластеры формируют так, чтобы минимизировать внутрикластерную дисперсию. Широко известным дисперсионным методом, используемым для этой цели, является метод Варда (Ward's procedure). Метод Варда (Ward's procedure) Дисперсионный метод, в котором кластеры формируют таким образом, чтобы минимизировать квадраты евклидовых расстояний до кластерных средних. Для каждого кластера вычисляют средние всех переменных. Затем для каждого объекта вычисляют квадраты евклидовых расстояний до кластерных средних (рис. 20.6). Эти квадраты расстояний суммируют для всех объектов. На каждой стадии объединяют два кластера с наименьшим приростом в полной внутрикластерной дисперсии. В центроидных методах (centroid method) расстояние между двумя кластерами представляет собой расстояние между их центроидами (средними для всех переменных), как показано на рис. 20.6. Центроидный метод (centroid method) Дисперсионный метод иерархической кластеризации, в котором расстояние между двумя кластерами представляет собой расстояние между их центроидами (средними для всех переменных). Каждый раз объекты группируют и вычисляют новый центроид. Изо всех иерархических методов методы средней связи и Варда показывают наилучшие результаты по сравнению с другими методами [12]. К другому типу процедур кластеризации относятся неиерахические методы кластеризации (nonhierarchical clustering), часто называемые методом А-средних. Неиерархические методы кластеризации, метод k-средних (nonhierarchical clustering, k-means clustering) Метод, который вначале определяет центр кластера, а затем группирует все объекты в пре] делах заданного от центра порогового значения.

Часть III. Сбор, подготовка и анализ данных Метод Варда Центре идный метод Рис. 20.6. Другие а&юмеративные методы кластеризации Эти методы включают последовательный пороговый метод, параллельный пороговый метод и оптимизирующее распределение. В последовательном пороговом методе (sequential threshold method) выбирают центр кластера и все объекты, находящиеся в пределах заданного от центра порогового значения, группируют вместе. Затем выбирают новый кластерный центр, и процесс повторяют для несгруппированных точек. После того как объект помещен в кластер с этим новым центром, его уже не рассматривают как объект для дальнейшей кластеризации. Последовательный пороговый метод (sequential threshold method) Неиерархический метод кластеризации, при котором выбирают кластер и все объекты, находящиеся а пределах заданного от центра порогового значения, группируют вместе. Аналогично работает параллельный пороговый метод (parallel threshold method), за исключением того, что одновременно выбирают несколько кластерных центров и объекты в пределах порогового уровня группируют с ближайшим центром. Параллельный пороговый метод (parallel threshold method) Неиерархический метод кластеризации, при котором одновременно определяют несколько кластерных центров. Все объекты, находящиеся в пределах заданного центром порогового значения, группируют вместе. Метод оптимизирующего распределения (optimizing partitioning method) отличается от двух изложенных выше пороговых методов тем, что объекты можно впоследствии поставить в соответствие другим кластерам (перераспределить), чтобы оптимизировать суммарный критерий, такой как среднее внутри кластерное расстояние для данного числа кластеров.

Глава 20. Кластерный анализ Метод оптимизирующего распределения (optimizing partitioning method) Неиерархический метод кластеризации, который позволяет поставить объекты в соответствие другим кластерам (перераспределить объекты), чтобы оптимизировать суммарный критерий. Два главных недостатка неиерархических методов состоят в том, что число кластеров определяется заранее и выбор кластерных центров происходит независимо. Более того, результаты кластеризации могут зависеть от выбранных центров. Многие неиерархические процедуры выбирают первые k случаев (k Ч число кластеров), не пропуская никаких значений в качестве начальных кластерных центров. Таким образом, результаты кластеризации зависят от порядка наблюдений в данных. Неиерархическая кластеризация быстрее иерархических методов, и ее выгодно использовать при большом числе объектов или наблюдений, Высказано предположение о возможности использования иерархических и неиерархических методов в тандеме. Во-первых, первоначальное решение по кластеризации получают, используя такие иерархические методы, как метод средней связи или метод Варда. Полученное этими методами число кластеров и кластерных центроидов используют в качестве исходных данных в методе оптимизирующего распределения [ 13]. Выбор метода кластеризации и выбор меры расстояния взаимосвязаны. Например, квадраты евклидовых расстояний используют наряду с методом Варда и центроидным методом. Некоторые из неиерархических методов также используют квадраты евклидовых расстояний. Для иллюстрации иерархической кластеризации используем метод Варда. Результаты, полученные при кластеризации данных табл. 20.1, приведены в табл, 20.2.

г Таблица 20.2. Результаты иерархической кластеризации План агломерации на основании метода Варда Объединяемые кластеры Стадия Кластер 1 Кластер 2 Коэффициент (расстояние между объединяемыми кластерами) 1,000000 2,500000 4,000000 5,500000 7,000000 8,500000 10,166667 12,666667 15,250000 18,250000 22,750000 27,500000 32,700001 40,500000 51,000000 63,125000 78,291664 171,291656 330, Стадия, на которой впервые появился кластер Кластер 0 0 0 0 0 0 0 0 0 6 Кластер 0 0 и 0 0 Следующая стадия 2 3 4 5 б 13 12 11 ?, 2 15 10 11 16 !

14 20 'О 11 12 13 15 14 9 4 10 11 12 4 I ( 2 8 1) 10 15 5 А 14 12 15 5 17 18 19 18 ;

.' Часть III. Сбор, подготовка и анализ данных Окончание табл. 20. Принадлежность кластеру при использовании метода Барда Меня (HOMepJ случая Число кластеров 1 2 2 3 2 1 2 I 3 Х) 1 1 1 2 3 2 2 1 1 5 2 1 1 1 8 10 11 12 13 14 15 17 18 2 3 2 1 2 3 1 3 1 3 3 2 3 3 I 2 2 1 2 Полезную информацию можно извлечь из плана агломерации, где показано число случаев или кластеров, которые нужно объединить на каждой стадии. Первая строка представляет первую стадию, когда есть 19 кластеров. На этой стадии объединены респонденты 14 и 16, что показано в колонках, озаглавленных "Объединяемые кластеры". Квадрат евклидового расстояния между точками, соответствующими этим двум респондентам, дан в колонке "Коэффициент", Колонка "Стадия, на которой впервые появился кластер" показывает стадию, на которой впервые был сформирован кластер. Например, цифра (входа в кластер) 1 на стадии 7 указывает на то, что респондента 14 впервые включили в кластер на стадии 1. Последняя колонка, "Следующая стадия", показывает стадию, на которой другой случай (респондент) или кластер объединили с этим кластером. Поскольку число в первой строке последней колонки равно 7, значит, респондента 10 объединили с респондентами 14 и 16 на стадии 7, чтобы сформировать один кластер. Аналогично, вторая строка представляет стадию 2 с 18 кластерами. На стадии 2 респондентов 2 и 13 группируют вместе. Другая важная часть результата кластеризации содержится в сосульчатой диаграмме, представленной на рис. 20.7.

Глава 20. Кластерный анализ Число кластеров Is N гг I i l Г!I I I S Я I I I Столбики соответствуют объектам, которые подлежат кластеризации, в этом случае респондентам присвоили номера от I до 20. Ряды соответствуют числу кластеров. Эту диаграмму читают снизу вверх. Вначале все случаи считают отдельными кластерами. Так как мы имеем 20 респондентов, количество исходных кластеров равно 20. На первой стадии объединяют два ближайших объекта, что приводит к 19 кластерам. Последняя строчка на рис. 20.7 показывает эти 19 кластеров. Два случая, а именно респонденты 14 и 16, которых объединили на этой стадии, не имеют между собой разделяющего пустого (белого) пространства. Ряд с номером 18 соответствует следующей стадии с 18 кластерами. На этой стадии вместе группируют респондентов 2 и 13. Таким образом на этой стадии мы имеем 18 кластеров, 16 из них состоят из отдельных респондентов, а два содержат по два респондента. На каждой последующей стадии формируется новый кластер одним из трех способов: два отдельных объекта группируют вместе;

объект присоединяют к уже существующему кластеру;

два кластера группируют вместе. Еще одно полезное графическое средство отображения результатов кластеризации Ч это древовидная диаграмма (дендрограмма) (рис. 20.8).

Метка объекта Последовательность IО 410 Шкапа расстояний объединяемых кластеров Рис. 20.8. Древовидная диаграмма, используемая в методе Варда Древовидную диаграмму читают слева направо. Вертикальные линии показывают кластеры, объединяемые вместе. Положение линии относительно шкалы расстояния показывает расстояния, при которых кластеры объединили. Поскольку многие расстояния на первых стадиях объединения примерно одинаковой величины, трудно описать последовательность, в которой объединили первые кластеры. Однако понятно, что на последних двух стадиях расстояния, при которых кластеры должны объединиться, достаточно большие. Эта информация имеет смысл при принятии решения о количестве кластеров (см. следующий раздел). Кроме того, если число кластеров определено, то можно получить информацию о принадлежности к кластеру, Хотя эта информация следует и из сосульчатой диаграммы, табличная форма нагляднее, Табл. 20,2 содержит данные о кластерной принадлежности объектов, в зависимости от принятого решения;

два, три или четыре кластера. Информацию такого рода можно получить для любого числа кластеров, и она полезна при принятии решения о числе кластеров.

Глава 20. Кластерный анализ Принятие решения о количестве кластеров Главный вопрос кластерного анализа Ч вопрос о количестве кластеров. Здесь нет твердых правил, позволяющих быстро принять решение, но можно руководствоваться следующим. При определении количества кластеров руководствуются теоретическими и практическими соображениями. Например, если цель кластеризации Ч выявление сегментов рынка, то менеджмент может захотеть получить конкретное число кластеров. 2. В иерархической кластеризации в качестве критерия можно использовать расстояния, при которых объединяют кластеры, В нашем случае из плана агломерации в табл. 20.2 видно, что значение в колонке "Коэффициент" увеличивается больше, чем вдвое при переходе от 17 к 18 стадии. Аналогично, на последних стадиях древовидной диаграммы (рис. 20.8) кластеры объединяются при больших расстояниях. Следовательно, самое приемлемое решение Ч это решение о трех кластерах. 3. В неиерархической кластеризации чертят график зависимости отношения суммарной внутригрупповой дисперсии к межгрупповой дисперсии от числа кластеров. Точка, в которой наблюдается изгиб или резкий поворот, указывает на приемлемое количество кластеров. Увеличение числа кластеров за эту точку обычно безрезультативно. 4. Относительные размеры кластеров должны быть достаточно выразительными. Из табл. 20.2, просто подсчитав частоты кластерной принадлежности, мы увидим, что решение с тремя кластерами приводит к кластерам, содержащим 8, 6 и 6 элементов. Однако если мы перейдем к четырем кластерам, то размеры кластеров будут 8, 6, 5 и I. Бессмысленно создавать кластер с одним случаем, поэтому в данной ситуации предпочтительнее решение с тремя кластерами. 1.

Интерпретация и профилирование кластеров Интерпретация и профилирование кластеров включает проверку кластерных центроидов. Центроиды представляют средние значения объектов, содержащиеся в кластере по каждой из переменных. Они позволяют описывать каждый кластер, если присвоить ему номер или метку. Если компьютерная программа кластеризации не выдаст такую информацию, ее можно получить через д искри ми нантный анализ. В табл. 20.3 приведены центроиды или средние значения для каждого кластера в расматриваемом примере.

Таблица 20,3. Кластерные net Средние переменных Номер кластера Vi 5, 1, V 3,625 3,000 5, V 6, 1, V 3, V$ 1, Vs 3,875 3,333 6, I 2 3,500 6, 5,500 3, 3, 3, Кластер 1 имеет относительно высокие значения по переменной Vl (посещение магазинов Ч приятный процесс) и переменной К, (я совмещаю посещение магазинов с питанием вне дома). Он также имеет низкое значение по переменной У$ (меня не интересуют покупки). Следовательно, кластер I можно назвать так: "любители посещать магазины и делать покупки". Этот кластер состоит из случаев 1, 3, 6, 7, 8, 12, 15 и 17. Кластер 2 Ч прямая противоположность кластеру 1: он имеет низкие значения по переменным К, и К3 и высокое значение по переменной У5, значит, этот кластер можно назвать "апатичные покупатели". В кластер входят случаи 2, 5, 9, II, 13 и 20. Кластер 3 имеет высокие значения по переменным V2 (посещение магазинов плохо сказывается на моем бюджете), У< (я стараюсь сделать лучшие покупки, посещая магазины) и У6 (можно сэкономить много денег, сравнивая цены в разных магазинах). Таким образом, этот кластер можно назвать "экономные покупатели". Кластер 3 охватывает случаи 4, 10, 14,16,18и 19.

Часть III. Сбор, подготовка и анализ данных Часто имеет смысл профилировать кластеры через переменные, которые не явились основанием для кластеризации. Эти переменные могут включать демографические, психографические характеристики, использование продукта или другие переменные. Например, кластеры можно вывести, исходя из искомых преимуществ. Дальнейшее профилирование осуществляют через демографические или психографические переменные, чтобы определить маркетинговую стратегию для каждого кластера. Переменные, существенно различающиеся между кластерами, можно идентифицировать дискриминантным анализом и однофакторным дисперсионным анализом.

Оценка надежности и достоверности Имея несколько умозаключений, выведенных из кластерного анализа, не следует принимать никакого решения по кластеризации, не выполнив оценку надежности и достоверности этого решения. Формальные процедуры оценки надежности и достоверности решений кластеризации достаточно сложны и не всегда оправданы [14], поэтому мы их опустим. Однако следующие процедуры обеспечат адекватную проверку качества кластерного анализа. 1. Выполняйте кластерный анализ на основании одних и тех же данных, но с использованием различных способов измерения расстояния. Сравните результаты, полученные на основе разных мер расстояния, чтобы определить, насколько совпадают полученные результаты. 2. Используйте разные методы кластерного анализа и сравните полученные результаты. 3. Разбейте данные на две равные части случайным образом. Выполните кластерный анализ отдельно для каждой половины. Сравните кластерные центроиды двух подвыборок. 4. Случайным образом удалите некоторые переменные. Выполните кластерный анализ по сокращенному набору переменных. Сравните результаты с полученными на основе полного набора переменных. 5. В неиерархической кластеризации решение может зависеть от порядка случаев в наборе данных. Выполните анализ несколько раз, меняя порядок случаев, до получения стабильного решения. Ниже иерархическая кластеризация проиллюстрируется на примере изучения различий в маркетинговой стратегии фирм США, Японии и Великобритании. ПРИМЕР. Этот маленький и тесный мир Данные для исследования конкурирующих между собой 90 компаний из Соединенных Штатов Америки, Японии и Великобритании получены из подробных личных интервью с президентами и высшими должностными лицами, принимающими маркетинговые решения по группам определенных товаров. В основе методологии контроля рыночных различий лежало сопоставление 30 британских компаний с их главными американскими и японскими конкурентами на британском рынке. В исследование включено 30 триад компаний, каждая состояла из британских, американских и японских компаний, непосредственно конкурирующих между собой. Большинство данных, касающихся эффективности компаний, стратегии и организации, собраны с использованием пятибалльных семантических дифференциальных шкал. Первая стадия анализа включала факторный анализ переменных, описывающих стратегии фирм и маркетинговые виды деятельности. Для того чтобы идентифицировать группы аналогичных компаний методом иерархической кластеризации Барда, использовали значения факторов. В итоге получено шесть кластеров. Затем принадлежность к одному из шести кластеров интерпретировали относительно исходных переменных: деятельность, стратегия и организационная структура. Во все кластеры входило несколько преуспевающих компаний, хотя в некоторых кластерах таких компаний было существенно больше^ чем в других. Распределение фирм по кластерам подтвердило гипотезу о том, что успех компании не зависит от национальной принадлежности, поскольку американские, британские и японские компании обнаружились во всех кластерах. Однако j Глава 20. Кластерный анализ наблюдалось преобладание японских компаний в кластерах с наиболее преуспевающими компаниями и преобладание британских компаний в двух кластерах с наименее преуспеваюшими компаниями. По-видимому, японские компании не применяли свойственных только им уникальных стратегий, скорее большинство из них следовало стратегиям, которые эффективно работали на британском рынке. Стратегические кластеры 'Кластер Название Размер Преуспевающие компании (%) Принадлежность к стране {%) Японские Американские Британские / II III IV V VI Новаторы Продавцы товаров Законода ПродавцыЗрелые Агрессивные маловысокого качества гели цен производители продавцы ристые компании 22 55 11 59 18 46 36 14 31 31 15 54 18 53 Исследования показывают, что существуют общие стратегии, характерные для преуспевающих компаний, независимо от отрасли промышленности, к которой они относятся. Определены три стратегии успеха. Первая Ч это стратегия "Продавцов товаров высокого качества". Такие компании сильны в маркетинге и НИОКР (научно-исследовательских и опытно-конструкторских работах). Их технические разработки концентрируются больше на достижении высокого качества, а не на чистой инновации. Эти компании отличаются уме? нием принимать стратегические решения, долгосрочным планированием и хорошо развиI тым осознанием своей миссии, Вторая общая стратегия ("Новаторы") заключается в том, что, компании, которые слабее в проведении НИОКР, более предприимчивы и заняты поиском и внедрением новых идей. Последняя преуспевающая группаЧ "Зрелые продавцы", | которые сильно ориентированы на получение прибыли и обладают высоким мастерством в 1 области маркетинга. Как оказаюсь, все три типа состоят из компаний, которые сильно ори! ентированы на маркетинг [15].

ПРИМЕНЕНИЕ НЕИЕРАРХИЧЕСКОЙ КЛАСТЕРИЗАЦИИ Проиллюстрируем неиерархический метод, используя данные табл. 20.1 и метод оптимизирующего распределения. Исходя из результатов иерархической кластеризации, мы заранее определили, что количество кластеров равно трем (трехкластерное решение). Результаты представлены в табл. 20.4.

шяимнн^Н^^в^^^^Л^н^н^^в^^н^вв^шямш^^^^^вшщ^щ^нинмвяявц^шн^^^вщня^в^^^вшп Таблица 20.4. Результаты неиерархической кластеризации Vi 4,0000 2,0000 7,0000 Vz 6,0000 3,0000 2,0000 V3 3,0000 2,0000 6, Исходные кластерные центры Кластер Vt 7,0000 4,0000 4, Часть III, Сбор, подготовка и анализ данных Продолжение табл. 20. Кластер \ 2,0000 7,0000 ? 7,0000 2,0000 3 1,0000 3,0000 Классификационные кластерные центры Кластер V, 3,8135 1,85-7 6, V 5,8992 3,0234 2,8356 3,2522 1,8327 6,1576 6,4891 3,7864 3, 2 Кластер !

V, VB 2, 6, 6, 2, 3 1,3047 3,2010 Слисок кластерной принадлежности объектов Номер Щ объекта Кластер Расстояние 1, 2 !

2, 1,174 1, 5 2 2,525 2, 1,862 1,410 1,843 2,112 1, 3 3 2 1 2 2 1 3 1 В 10 11 12 13 14 15 2,400 3, 1, 3, 2, 3, 4, 18 19 Кластер V, 3,5000 1,6667 5, 0, 0, Конечные кластерные центры V2 V3 V* 1 2 5,8333 3,0000 3, 3,3333 1,8333 6, 6,0000 3,5000 3, Глава 20. Кластерный анализ Окончание табл. 20. Кластер 1 2 3,5000 5,5000 6,0000 3, 3 1,7500 3,8750 Расстояния между конечными кластерными центрами Кластер 1 2 0,0000 6,9944 3 1 0,0000 2 5,5678 3 5,7353 Дисперсионный анализ 0, Переменная MS (средний Степени квадрат) кластера свободы Ошибка MS Степени свободы F-статнстика 47,8879 21,5047 37,6700 21,5848 32,8440 11, Уровень значимости, р 0,000 0,000 0,000 0,000 0,000 0, V: VV, 29,1083 13,5458 31,3917 15,7125 24,1500 12, 0,6078 0,6299 0,8333 0,7279 0,7353 1, 17,0 17,0 17,0 17,0 17,0 17, Число объектов в каждом кластере Кластер Невзвешенные случаи Взвешенные случаи 6,0 6,0 8,0 0, 20,0 20, 2 Пропущенный Итого 6,0 6,0 8, Исходные кластерные центры Ч это значения первых трех объектов. Классификационные кластерные центры Ч это промежуточные значения центров, используемые для отнесения объекта к определенному кластеру. Каждый объект относят к ближайшему классификационному кластерному центру. Классификационные центры обновляют до тех пор, пока не достигнут критерия остановки. Конечные кластерные центры представляют средние значения переменных для объектов в конечных кластерах. В табл. 20.4- также показана кластерная принадлежность объектов и расстояние между каждым объектом и его классификационным центром. Следует отметить, что кластерные принадлежности, приведенные в табл. 20.2 (иерархическая кластеризация) и табл. 20.4 (неиерархическая кластеризация), идентичны (кластер 1 табл. 20.2 является кластером 3 в табл. 20.4, а кластер 3 табл. 20.2 Ч кластером 1 в табл. 20.4), Расстояния между конечными кластерными центрами указывают, что пары кластеров хорошо разделены. Для каждой переменной, лежащей в основе кластеризации, приведено только описательное значение /"-статистики для одномерной выборки. Случаи или объекты систематично относят к кластерам, чтобы максимизировать различия по переменным, лежащим в основе кластеризации, поэтому полученные значения вероятностей не следует интерпретировать как испытание нулевой гипотезы об отсутствии различий среди кластеров. Следующий пример о выборе больницы продолжает иллюстрацию неиерархической кластеризации.

Часть III. Сбор, подготовка и анализ данных ПРИМЕР. Сегментация с хирургической точностью Кластерный анализ использовался маркетологами для классификации пациентов, предпочитающих стационарное лечение. Цель анализа Ч идентификация этого сегмента пациентов, предпочитающих стационарное лечение. Кластеризация опиралась на причины, по которым респонденты предпочитали лечение в больнице. Для того чтобы узнать, насколько эффективно можно идентифицировать сегменты, сравнивали демографические профили сгруппированных респондентов. Для группирования респондентов на основе их ответов на вопросы, касающиеся выбора больницы, использовали метод кластеризации, минимизирующий дисперсию, который выполнили с помощью программы Quick Cluster (программный пакет SPSS). Минимизировали квадраты евклидовых расстояний между всеми переменными, лежащими в основе кластеризации. Поскольку разные респонденты воспринимали шкалы важности по-разному, перед кластеризацией персональные рейтинги нормировали. Результаты показали, что респондентов наилучшим образом можно классифицировать на четыре кластера. Достоверность результатов кластерного анализа проверили методом перекрестной проверки двух половинок общей выборки. Как и ожидалось, четыре группы существенно отличались по кривым распределения и средним значениям ответов, касающихся причин выбора стационарного лечения. Названия, присвоенные каждой из четырех групп, отразили демографические характеристики и причины выбора стационарного лечения;

клиенты со старомодными взглядами;

богатые клиенты;

клиенты, здраво оценивающие стоимость лечения;

клиенты, желающие получить 1 профессиональное медицинское обслуживание [16].

КЛАСТЕРИЗАЦИЯ ПЕРЕМЕННЫХ Иногда кластерный анализ используют для кластеризации переменных, чтобы определить однородные (гомогенные) группы. В этом случае элементами, используемыми для анализа, будут переменные, и меры расстояния вычисляют для всех пар переменных. Например, коэффициент корреляции либо по абсолютной величине, либо с присущим ему знаком можно использовать как меру сходства (в противоположность расстоянию) между переменными. Иерархическая кластеризация переменных помогает идентифицировать характерные переменные или переменные, которые вносят уникальный вклад в данные. Кластеризация также используется для уменьшения числа переменных. Связанную с каждым кластером линейную комбинацию переменных в кластере называют кластерным компонентом. Большой набор переменных часто можно заменить набором кластерных компонентов, потеряв при этом незначительную часть информации. Однако данное число кластерных компонентов обычно не объясняет столько дисперсии, сколько такое же количество главных компонентов. Тогда возникает вопрос: зачем же использовать кластеризацию переменных? Кластерные компоненты обычно легче интерпретировать, чем главные, даже если последние повернутые [17]. Проиллюстрируем кластеризацию переменных на примере из исследования рекламы. ПРИМЕР. Эмоции Ч и ничего, кроме эмоций Для того чтобы определить, какие эмоции вызывает у людей реклама, было проведено I маркетинговое исследование. Набор из 655 эмоций уменьшили до 180, после этого их оце- | нили респонденты, которые, вероятнее всего, наиболее подвержены рекламе. Эту группу | разбили на 31 кластер похожих эмоций, исходя из оценок респондентов о влиянии на них I | рекламы. Затем эти кластеры разделили на 16 кластеров с положительными эмоциями и ] I 15 Ч с отрицательными [18]. Глава 20. Кластерный анализ Положительные эмоции 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14.

15.

Отрицательные эмоции 1. Страх Игривость-несерьезность Дружелюбие Юмор Восхищение Интерес Сила-уверенность Сердечность-нежность Рассла&ленность Энергия-импульсивность Страстное желание-воэбуадение Размышление Гордость Убежденность-ожидание Бодрость-вызов Изумление 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.

12.

Испорченное настроение-досада Смущение безразличие Скука Грусть Беспокойство Беспомощность-робость Неприязнь-глупость Сожаление-обман Гнев Неловкость 13. 14. 15.

Отвращение Раздражение Дурное настроение-замешательство 16.

Горячее желание-осведомленность Таким образом 665 эмоций Ч откликов на рекламу, снизили до основного набора из 31 i эмоции. Теперь менеджеры в сфере рекламы имеют управляемый набор эмоций (чувств), I позволяющий понять и измерить эмоциональные отклики респондентов на рекламу. Буду| чи измеренными, эти эмоции предоставляют информацию о способности рекламы убеждать | целевых потребителей. Кластерный анализ может оказаться полезным при изучении проблем этики маркетинговых исследований (врезка 20.1 "Практика маркетинговых исследований" [19]). Врезка 20.1. Практика маркетинговых исследований Кластеризация профессионалов в маркетинге на основе оценки этичности ситуаций Кластерный анализ используется для объяснения различий в восприятии этических норм. Для измерения этичности различных ситуаций разработаны шкалы, состоящие из нескольких разделов и многих пунктов (многоразмерные шкалы). Одна из таких шкал создана Райденбахом и Робином (Reidenbach and Robin), она состоит из 29 пунктов, которые охватывают пять областей этики, и служит для оценки респондентом конкретного действия. Например, респондент прочтет о том, что исследователь-маркетолог предоставил частную информацию об одном из своих клиентов другому клиенту. Респондента попросят заполнить анкету из 29 пунктов. Например, его просят указать, каким является это действие: Справедливое (действие) ;

j ;

: : : : : Несправедливое Обычно приемлемое : : ;

: : : _: : Неприемлемое Имеет место нарушение: : :;

: :: : ;

Нет нарушения условий контракта Эту шкалу использовали при опросе специалистов-маркетологов. На основе ответов на 29 пунктов анкеты респондентов разделили на кластеры, при этом изучались два основных вопроса. Во-первых, чем отличаются кластеры с точки зрения таких этических компонентов, как справедливость, релятивизм, эгоизм, утилитаризм, деонтология (подробности Ч в главе 24). Во-вторых, какие типы фирм входят в каждый из кластеров? Кластеры можно описать с точки зрения стандартной промышленной классификации отраслей (SIC) и рентабельности фирм. Ответы на эти вопросы позволят увидеть, каким из Часть 111, Сбор, подготовка и анализ данных принципов этики руководствуется определенный тип руководителей фирм для оценки этичности ситуаций. Например, попадут ли крупные и мелкие фирмы в один и тот же кластер? Действительно ли рентабельные фирмы относятся к спорным ситуациям лояльнее, чем менее прибыльные фирмы?

ИСПОЛЬЗОВАНИЕ INTERNET И КОМПЬЮТЕРА В SPSS главной программой для иерархической кластеризации объектов является CLUSTER. Можно вычислить различные значения меры расстояний, доступны также все методы кластеризации, рассмотренные в этой главе. Для неиерархической кластеризации используется программа QUICK CLUSTER. Она чрезвычайно полезна для кластеризации большого количества случаев. Все опции по умолчанию приводят к кластеризации методом kсредних. Для кластеризации переменных следует вычислять значения меры сходства по всем переменным, используя программу PROXIMITIES. Матрицу близости можно получить с помощью программы CLUSTER В SAS используется программа CLUSTER для иерархической кластеризации случаев или объектов. Доступны все методы кластеризации, описанные в данной главе, а также некоторые дополнительные. Неиерархическая кластеризация случаев или объектов выполняется с помощью FASTCLUS. Для кластеризации переменных используется программа VARCLUS. Дендрограммы не вычисляются автоматически, их можно получить с помощью программы TREE. В программном пакете BMDP главной программой для кластеризации случаев с использованием иерархических методов является 2М. Она позволяет использовать несколько мер расстояний, но только одну из процедур кластеризации: метод одиночной связи, центроидный метод или правило k ближайших соседей. Для неиерархичсской кластеризации используется программа КМ, позволяющая выполнять кластеризацию объектов с ^-средними. Кластеризация переменных выполняется программой 1М. Она дает возможность использовать методы одиночной, полной и средней связи. Существует также специальная программа ЗМ для построения блок-кластеров для категориальных переменных. Поднаборы объектов объединяются в кластеры, аналогичные поднаборам переменных. В Minitab можно оценить кластерный анализ, используя функцию Multivariate>Cluster observation. Кроме того, существуют функции Clustering of Variables и Cluster K-Means. Кластерный анализ нельзя выполнить в Excel (версия 7.0 для PC). В центре внимания Burke Когда компания Burke представляет результаты кластерного анализа клиенту, он должен получить ответы на следующие три существенных вопроса. 1. Что я могут узнать с помощью кластеров о моем рынке? 2. Какие переменные лежат в основе кластеризации? 3. Насколько отличаются кластеры? Что я могут узнать с помощью кластеров о моем рынке? Чтобы ответить на этот вопрос, компания Burke обычно использует данные респонден1 тов, которые не были включены в процедуру кластеризации. Например, нам удалось опрег делить четыре кластера респондентов, исходя из их оценок преимуществ товара. Для проверки нашего предположения о наличии четырех кластеров мы также собрали фактические данные о поведении покупателей и их намерениях относительно покупок. Если кластеры не отражают каких-либо важных для руководства значимых различий по этим показателям, описывающим поведение при покупке товара и намерения купить его, то сложно убедить 1 руководство компании-заказчика в том, что деление клиентов на кластеры целесообразно. \ Поскольку цель кластеризации Ч создание групп, очень схожих между собой, то нет гаран| тии, что они будут отличаться чем-либо другим, кроме внешних признаков. Глава 20. Кластерный анализ Какие переменные лежат в основе кластеризации? Если для создания кластеров мы используем несколько переменных, то следует быть внимательным, чтобы не создать неявно взвешенную систему. Например, в маркетинговом исследовании в сфере автоиндустрии заказчик предложил сгруппировать респондентов в соответствии с ответами на 20 вопросов, касающихся желаемых преимуществ нового автомобиля. Уже при первом их рассмотрении стало ясно, что семь вопросов прямо или косвенно связаны с экономией денег, восемь Ч с имиджем, три Ч с ценой и два отражали скоростные качества автомобиля. Можно было спрогнозировать, что вопросы, лежащие в основе кластеризации, скорее всего приведут руководство компании к выводу о том, что группы респондентов, по-видимому, больше всего отличаются отношением к экономии денег и имиджу автомобиля. Но когда вы вычислите евклидовы расстояния, чтобы изучить различия между респондентами, то в формулу их расчета будет входить данные, полученные при ответах на !5 вопросов относительно экономии и имиджа и только пять, касающиеся вопросов из области ценовых и скоростных характеристик автомобиля. Если эти вопросы имеют сопоставимые шкалы, то явно будет завышено значение данных из первых двух категорий. Разумнее сократить как можно больше похожих вопросов, чтобы получить в каждой категории одинаковое число вопросов, отражающее высоко коррелированные группы вопросов. Если этого не сделать, то число вопросов, которые вы зададите по данной проблеме, может сильно повлиять на ваши результаты, сильнее, чем сама проблема. Насколько отличаются кластеры? Выше, в первом пункте, мы обсудили, насколько целесообразно выделять кластеры с точки зрения существования различий между переменными, Нам также необходимо проверить, действительно ли кластеры различаются с точки зрения переменных, которые лежали в основе создания кластеров. Вы можете ввести данные в алгоритм кластеризации, и если вы зададите остановку этого процесса на двух кластерах, то получите два кластера в силу самой природы этого процесса, а вовсе не из-за логики проблемы или структуры различий, существующих в изучаемой совокупности. Поэтому после деления на кластеры важно убедиться, что различия имеют достаточную величину и стабильность, чтобы вы были уверены в полученных результатах. 1. Маловероятно, что кластеры отличаются по всем вопросам, использованным в качестве исходных данных для процесса кластеризации. Хотя статистические процедуры не действенны применительно к систематически создаваемым кластерам, они помогают понять процесс формирования кластеров. Однофакторный дисперсионный анализ покажет, различаются ли отдельные вопросы между сформированными кластерами, исходя из значения статистики, которая больше всего подходит для вероятностной выборки (конечно, это не то, что вы хотите... но все же лучше иметь такой "коэффициент"). Привлекательнее использование дискриминантного анализа, поскольку он покажет, какие из вопросов станут потенциальными дискриминаторами групп, учитывая при этом коллинеарность между этими предикторами. 2. Значимость различий между кластерами с точки зрения руководства Ч это отдельная проблема. Предположим, ваши кластеры представляются различными по статистическим показателям (полученным в результате дисперсионного и дискриминантного анализа). Однако это вовсе не означает, что различия настолько велики, что руководство компании-заказчика сочтет их полезными для решения своих проблем. Рассмотрим, например, такую ситуацию. Вопрос, по которому было проведено различие кластеров, относился к экономии средств, и 90% ответов находилось в диапазоне от 6 до 9 по десятибалльной шкале. Чтобы убедить руководство принять во внимание такое разделение между кластерами, вам необходимо предоставить дополнительные убедительные доказательства. Дело в том, что оценки респондентов показывают различия в степени "положительного отношения" и ничего не говорят о величине различий в рамках одного кластера. Это трудный вопрос, и нет рецепта для ответа на него. Конечно, было бы лучше, если бы вы могли перевести эти численные различия в решения, имеющие смысл для высшего руководства.

Часть 111. Сбор, подготовка и анализ данных РЕЗЮМЕ Кластерный анализ используют для группирования (классификации) объектов (событиев, случаев), а иногда и переменных в относительно однородные группы. Образование кластеров зависит от имеющихся данных, а не определяется заранее. Переменные, которые являются основанием для кластеризации, следует выбирать, исходя из опыта предшествующих исследований, теоретических предпосылок, проверяемых гипотез, а также по усмотрению исследователя. Кроме того, следует выбрать соответствующую меру расстояния (сходства). Особенность иерархической кластеризации Ч разработка иерархической или древовидной структуры. Иерархические методы кластеризации могут быть агломеративными или дивизивными. Агломеративные методы включают: метод одиночной связи, метод полной связи и метод средней связи. Широко распространенным дисперсионным методом является метод Барда. Неиерархические методы кластеризации часто называют методами ^-средних. Эти методы включают последовательный пороговый метод, параллельный пороговый метод и оптимизирующее распределение. Иерархические и неиерархические методы можно применять совместно. Выбор метода кластеризации и выбор меры расстояния взаимосвязаны. Решение о числе кластеров принимают по теоретическим и практическим соображениям. В иерархической кластеризации важным критерием принятия решения о числе кластеров являются расстояния, при которых происходит объединение кластеров. Относительные размеры кластеров должны быть такими, чтобы имело смысл сохранить данный кластер, а не объединить его с другими. Кластеры интерпретируют с точки зрения кластерных центроидов. Часто интерпретировать кластеры помогает их профилирование через переменные, которые не лежали в основе кластеризации. Надежность и достоверность решений кластеризации оценивают разными способами.

КЛЮЧЕВЫЕ ТЕРМИНЫ И ПОНЯТИЯ агломеративная кластеризация (agglomerative clustering) дивизивная кластеризация (divisive clustering) дисперсионный метод (variance methods) древовидная диаграмма (дендрограмма) (dendrogram) евклидово расстояние (euclidean distance) иерархическая кластеризация (hierarchical clustering) кластерные центры (cluster centers) кластерный центроид (cluster centroid) матрица сходства/матрица коэффициентов (значений расстояний между объединяемыми объектами) (similarity/distance coefficient matrix) метод Варда (Ward's procedure) метод одиночной связи (single linkage) метод оптимизирующего распределения (optimizing partitioning method) метод полной связи (complete linkage) метод средней связи (average linkage) методы связи (linkage methods) неиерархическая кластеризация (nonhierarchical clustering) параллельный пороговый метод (parallel threshold method) план агломерации (allomeration schedule) последовательный пороговый метод (sequential threshold method) расстояния между центрами кластеров (distances between cluster centres) сосульчатая диаграмма (icicle diagram) центроидный метод (centroid method) Глава 20. Кластерный анализ УПРАЖНЕНИЯ Вопросы 1. Обсудите сходство и различие между кластерным и дискриминантным анализом. 2. Назовите примеры использования кластерного анализа в маркетинге. 3. Дайте краткие определения следующим терминам: дендрограмма, сосульчатая диаграмма, графи к агломерации и кластерная принадлежность. 4. Что является наиболее распространенной мерой сходства в кластерном анализе? 5. Дайте классификацию процедур кластеризации, 6. Почему обычно предпочитают использовать метод средней связи, а не одиночной и полной связи? 7. Назовите два главных преимущества процедур неиерархической кластеризации. 8. Чем следует руководствоваться при принятии решения о количестве кластеров? 9. Что понимают под интерпретацией кластеров? 10. Что представляют собой дополнительные переменные, используемые для профилирования кластеров? П. Опишите несколько процедур для оценки качества (надежности и достоверности) кластерного анализа. 12. Как кластерный анализ используют для группирования переменных?

Задачи 1. Верны ли следующие утверждения. a) Методы иерархической и неиерархической кластеризации всегда приводят к разным результатам. b) Перед выполнением кластерного анализа всегда следует нормировать данные. c) Небольшие значения расстояний между объединяемыми кластерами в плане агломерации означают, что объединяются непохожие объекты. d) He имеет значения, какая используется мера расстояния, так как итог кластеризации в принципе одинаковый. e) Рекомендуется один и тот же набор данных анализировать с помощью различных методов кластеризации.

УПРАЖНЕНИЯ С ИСПОЛЬЗОВАНИЕМ INTERNET И КОМПЬЮТЕРА 1. Проанализируйте данные табл. 20.1, используя следующие методы: (а) метод одиночной связи, (Ь) метод полной связи, и (с) центроидный метод. При этом используйте SPSS, SAS, BMDP или Minitab. Сравните полученные результаты с результатами, приведенными в табл. 20.2.

Часть III. Сбор, подготовка и анализ данных КОММЕНТАРИИ 1. Liz Stuart, "Haagen-Dazs Aims to Scoop a Larger Share", Marketing Week, February 21, 1997, p. 26;

Dwight J. Shelton, "Birds of a Geodemographic Feather Flock Together'', Marketing News, August 28, 1987, p. 13. 2. О применении кластерного анализа см. статью Sudhir H. Kale, "Grouping Euroconsumers: 1 A Culture-Based Clustering Approach", Journal of International Marketing, March 1995, p. 35Ч48. 3. Существуют также перекрывающиеся методы кластеризации, позволяющие отнести объект к более чем одному кластеру. См. статью Anil Ciiaturvedi, J. Douglass Carroll, Paul E. Green, John A. Rotondo, "A Feature-Based Approach to Market Segmentation via Overlapping KCentroids Clustering", Journal of Marketing Research, August 1997, p. 370Ч377. 4. Прекрасные дискуссии относительно различных аспектов кластерного анализа можно найти в работах В. Everitt, Cluster Analysis, 3rd ed. (New York, NY: Halstcd Press, 1993);

H. Charles Romsturg, Cluster Analysis for Researchers (Melbourne: Krieger Publishing Company, 1990). 5. Vicki Douglas. ""Questionnaires Too Long? Try Variable Clustering", Marketing News, February 27, 1995, p. 38;

Girish Punj, David Stewart, "'Cluster Analysis in Marketing Research: Review and Suggestions for Application", Journal of Marketing Research, May 1983, p. 134Ч148.

6. Об использовании кластерного анализа для сегментации см. статьи Mark Peterson, Naresh К. Malhotra, "'Comparative Marketing Measures of Societal Quality of Life: Substantive Dimensions in 186 Countries", Journal of Macromarketing, Spring 1997, p. 25Ч38;

Tung-Zong Chang, Su-Jane Chen, "Benefit Segmentation: A Useful Tool for Financial Investment Services", Journal of Professional Services Marketing, February 1995, p. 69Ч80;

"Using Cluster Analysis for Segmentation", Sawtooth News, Winter 1994/1995, p. 6-7. 7. Chul-Min Mo, Mark E. Havitz, Dennis R. Howard, "Segmenting Travel Markets with the Internationa! Tourism Role (ITR) Scale", Journal of Travel Research, Summer 1994, p. 24Ч31;

George Moschis, Daniel C. Bello, "'Decision-Making Patterns among International Vacationers;

A CrossCultural Perspective", Psychology & Marketing. Spring 1987, p. 75Ч89. 8. B. Everitt, Cluster Analysis, 3rd ed. (New York, NY: Haisted Press, 1993). 9. Более детально различные меры подобия и формулы для их вычисления обсуждаются в работах Victor Chepoi, Feodor Dragan. "Computing a Median Point of a Simple Rectilinear Polygon", Information Processing Letters, March 22, 1994, p. 281Ч285;

H. Charles Romsburg, Cluster Analysis fur Researchers (Melbourne: Krieger Publishing Company, 1990). 10. Tomio Hirata, "A Unified Linear-Time Algorithm for Computing Distance Maps", Information Processing Letters, May 13, 1996, p. 129Ч133;

Joseph F. Hair, Jr., Ralph E, Anderson, Ronald L. Tatham, William C. Black, Muitivariate Data Analysis with Readings, 5th ed. (Upper Saddle River, NJ: Prentice Hall, Inc., 1999). 11. Более подробно дискуссия по вопросам стандартизации рассматривается в работе H. Charles Romsburg, Cluster Analysis for Researchers (Melbourne: Krieger Publishing Company, 1990). 12. Richard A. Johnson, Dean A. Wichern. Applied Muitivariate Statistical Analysis, 4th ed. (Upper Saddle River, NJ: Prentice Hall, 1998);

G. Milligan, "An Examination of the Effect of Six Types of Error Perturbation on Fiften Clustering Algorithms", Psychometrica, September 1980, p, 325Ч342. 13. B. Everitt, Cluster Analysis, 3rd ed. (New York, NY: Haisted Press, 1993);

Punj Girish, David Steward, "Cluster Analysis in Marketing Research: Review and Suggestions for Application", Journal of Marketing Research, May 1983, p. 134-138. 14. Оценку надежности, достоверности и проверку значимости в кластерном анализе см. в работах S. Dibbs. P. Stern, "Questioning the Reliability of Market Segmentation Techniques", Omega, December 1995, p. 625Ч636;

G. Ray Funkhouser, "A Note on the Reliability of Certain Clustering Algorithms", Journal of Marketing Research, February 1983, p. 92Ч98;

SJ. Arnold, "A Test for Clusters", Journal of Marketing Research, November 1979, p. 545Ч551.

Глава 20. Кластерный анализ 15. John Saunders, Veronica Wong, Peter Doyle, "The Congruence of Successful International Competitors;

A Study of the Marketing Strategies and Organisations of Japanese and U.S. Competitors in the UK", Journal of Global Marketing, March 1994, p. 41Ч59;

Peter Doyle, John Saunders, Veronica Wong, ''International Marketing Strategies and Organisations: A Study of U.S., Japanese, and British Competitors", in Paul Bloom, Russ Winer, Harold H. Kassarjian, Debra L. Scammon, Bart Weitz, Robert E. Spekman, Vijay Mahajan, Michael Levy (eds.), Enhancing Knowledge Development in Marketing, Series № 55 (Chicago, 1L: American Marketing Association, 1989), p. 100Ч104. 16. Edward J. Holohean, Jr., Steven M. Banks, Blair A. Maddy, "Sysntem Impact and Methodological Issues in the Development of an Empirical Typology of Psychiatric Hospital Residents", Journal of Mental Healtk Administration, Spring 1995, p. 177-188;

Arch G. Woodside, Robert L. Nielsen, Fred Walters, Gale D. Muller, ''Preference Segmentation of Health Care Services: The Old-Fashioneds, Value Conscious, Affluents and Professional Want-It-Alls", Journal of Health Care Marketing, June 1988, p. 14-24. 17. Vicki Douglas, "Questionnaire Too Long? Try Variable Clustering", Marketing News, February 27, 1995, p.38. 18. Thorolf Helgesen, "The Power of Advertising Ч Myths and Realities", Marketing & Research Today, May 1996, p. 63Ч71;

David A. Aaker, Douglas M. Stayman, Richard Vezina, "Identifying Feelings Elicited by Advertising", Psychology & Marketing, Spring 1988, p. 1Ч16. 19. Ismael Akaah, "Organizational Culture and Ethical Research Behavior", Journal of the Academy of Marketing Science, Winter 1993, p. 59-63;

R.E. Reidenbach, D. Robin, "Some Initial Steps toward Improving the Measurement of Ethical Evaluations of Marketing Activities", Journal of Business Ethics, )u\ymS, p. 871-879.

Часть III. Сбор, подготовка и анализ данных Многомерное шкалирование и совместный анализ После изучения материала этой главы вы должны уметь...

1. Обсуждать основную идею и сферу применения многомерного шкалирования (ММШ) в маркетинговых исследованиях. 2. Описывать этапы многомерного шкалирования данных о восприятии потребителей, включая формулирование проблемы, получение исходных данных, выбор метода ММШ, принятие решения о размерности пространства, обозначение размерности и интерпретации конфигурации точек на карте, а также оценку надежности и достоверности. 3. Объяснять многомерное шкалирование данных о предпочтении потребителей и разбираться в отличиях внутреннего анализа предпочтений от внешнего. 4. Объяснять анализ соответствий и показывать его преимущества и недостатки. 5. Понимать взаимосвязь между многомерным шкалированием, дискриминантным и факторным анализом. 6. Обсуждать основные положения совместного анализа в сравнении с многомерным шкалированием, а также рассматривать различные аспекты его применения. 7. Описывать процедуру выполнения совместного анализа, включая формулирование проблемы, конструирование объектов восприятия, принятие решения о форме входных данных, выбор метода совместного анализа, интерпретацию результатов и оценивание надежности и достоверности. 8. Давать определение гибридному совместному анализу и объяснять, каким образом он упрощает сбор данных.

КРАТКИЙ ОБЗОР В заключительной главе, посвященной анализу данных, представлены два взаимосвязанных метода анализа восприятий и предпочтений потребителей Ч многомерное шкалирование (ММШ) и совместный анализ. Мы кратко изложим и проиллюстрируем этапы выполнения многомерного шкалирования и обсудим связь между многомерным шкалированием, факторным и дискриминантным анализом. Затем опишем совместный анализ и представим пошаговую процедуру его выполнения. Кроме того, мы кратко опишем гибридный совместный анализ. Начнем с примеров, иллюстрирующих применение многомерного шкалирования и совместного анализа. СКВОЗНОЙ ПРИМЕР, ВЫБОР УНИВЕРМАГА Многомерное шкалирование Маркетологи опросили посетителей универмага и получили оценку 10 различных универмагов по каждому из восьми критериев выбора, Эти оценки затем использовались для выведения степени сходства между магазинами. Для каждой пары магазинов вычислили евклидовы расстояния. С помощью многомерного шкалирования был проведен анализ данных, в результате которого исследователи получили пространственные карты, отображающие восприятие рес Глава 21. Многомерное шкалирование и совместный анализ пондентами 10 магазинов. На одной из таких карт престижные магазины расположились отдельно от обычных, а местные универмаги Ч отдельно от общенациональных. Магазины, которые напрямую конкурировали между собой (например, Saks Fifth Avenue и Neiman Marcus), были расположены близко один от другого в пространстве восприятия. Эти карты восприятия использовали для определения конкурентных позиций десяти универмагов.

ПРИМЕР. ММШ и безалкогольные напитки В данном маркетинговом исследовании респонденты оценили все возможные пары 10 торговых марок безалкогольных напитков с точки зрения их сходства. Эти данные затем обработали с помощью многомерного шкалирования. В результате получилась следующая пространственная картина расположения безалкогольных напитков.

0,8 0,6 0: Dr. Pepper 0, Coke>

ПРИМЕР. Кредитные карточки и совместный анализ Появление Complete MasterCard (кредитная карта MasterCard, выпущенная совместно с телефонной фирмой Ameritech Ч одной из семи региональных телефонных компаний фирмы Bell, Ч связано с удачным использованием результатов проведения фокус-группы и изучением данных совместного анализа. Кредитная карточка Complete MasterCard недавно ста Часть III. Сбор, подготовка и анализ данных I ] ;

? i ! I i ;

! I ла доступна 10 миллионам клиентов Ameritech, проживающих в штатах Иллинойс, Мичиган, Огайо и Висконсин. ;

'С ростом конкуренции на рынке телефонных карточек и с учетом запросов наших клиентов, мы вынуждены предлагать им дополнительные услуги Ч многоцелевую карточку, Ч заявил Рич Бялек, директор службы кредитных карточек фирмы Ameritech. Ч Мы хотели с помощью исследования рынка услуг определить, какой совокупностью свойств должна обладать кредитная карточка, чтобы полнее удовлетворять запросы наших клиентов". На первом этапе маркетологи провели восемь фокус-групп. В них приняли участие пользователи обоих видов карточек (кредитных и телефонных). Сотрудники компании, проводившей маркетинговое исследование (Kennedy Research, Inc), обратили особое внимание на то, как пользователи относятся к кредитной карточке, которая одновременно служит и телефонной карточкой, и что они ждут от нее. Во втором раунде фокус-групп маркетологи компании Kennedy попытались определить характеристики новой карточки для того, чтобы затем провести совместный анализ. В рамках проведения совместного анализа компания Kennedy пригласила 500 клиентов компании Ameritech Ч примерно по 100 человек в каждом из обслуживаемых ею штатов, для участия в компьютеризированном анкетировании, занимавшем 30 минут. В анкету включили 15 свойств кредитной и телефонной карточек: годовую плату за использование (четыре возможности), процентную ставку (три возможности) и название карточки (семь возможностей). Все вопросы позволяли респондентам выбрать один из двух предложенных ответов. Например, "Что для вас важнее: карточка без взимания годовой платы за обслуживание или карточка, которая предлагает плавающую процентную ставку?" Джемал Дин, проводивший совместный анализ, отметил: "После ответов примерно на половину вопросов участники исследования не были уверены, что же они хотят. Компьютерный анализ позволил определить относительную ценность различных свойств карточки, исходя из ответов каждого лица, а затем разработать одну карточку, которая, вероятнее всего, была бы наилучшим вариантом для этого лица". В результате этого исследования карточка получила название Complete Master-Card Ameritech. Карточка среди прочего имела следующие характеристики: отсутствие годовой платы за обслуживание и оплачиваемую банком-эмитентом 10%-ную скидку большинства местных телефонных переговоров и междугородных звонков, проведенных с ее помощью. О полезности совместного анализа при разработке Complete Master-Card Ameritech свидетельствуют благодарные отклики клиентов [2].

Первые два примера показывают, как получают и используют карты восприятия, которые являются ядром многомерного шкалирования. Пример с кредитной карточкой Complete MasterCard Ameritech демонстрирует компромиссы, на которые идут респонденты при оценке вариантов. Метод совместного анализа как раз и опирается на такие компромиссы.

Многомерное шкалирование (ММШ) (Multidimensional Scaling Ч MDS) Ч это класс методов для представления восприятий и предпочтений респондентов в пространстве с помощью наглядного изображения. Многомерное шкалирование (ММШ) (Multidimensional Scaling Ч MDS) Класс методов для представления восприятий и предпочтений респондентов в пространстве с помощью наглядного изображения.

Воспринимаемые (психологические) взаимосвязи между объектами представляют в виде геометрических с вязе и между точками в многомерном пространстве. Эти геометрические предГлава 21, Многомерное шкалирование и совместный анализ ставления часто называют пространственными картами. Оси координат на пространственной карте соответствуют психологическим факторам поведения человека или, иначе говоря, основным размерностям, которыми пользуются респонденты для формирования восприятия и предпочтения объектов [3]. Многомерное шкалирование используют в маркетинге, чтобы определить следующее. 1. Количество и природу измерителей, которые используют потребители, чтобы выразить свое отношение к торговым маркам на рынке. 2. Позиционирование имеющихся торговых марок согласно этим измерителям. 3. Позиционирование идеальных потребительских торговых марок по этим измерителям. Информация, полученная в результате многомерного шкалирования, используется для решения разнообразных задач в маркетинге. Отметим среди них следующие. Х Х Х Измерение имиджа. Восприятие фирмы потребителями и непотребителями ее продукции в сравнении с собственным восприятием фирмы самой себя. Сегментация рынка. Расположение в одном и том же пространстве торговых марок и потребителей для выявления относительно однородных по восприятиям групп потребителей. Разработка нового товара. Многомерное шкалирование позволяет увидеть пробелы на пространственной карте, которые указывают потенциальные возможности для размещения новых товаров. Кроме того, этот анализ используют, чтобы с помощью тестирования оценить новый товар и существующие торговые марки и таким образом определить, как потребители воспринимают новые идеи, заложенные в товаре. Доля предпочтений для каждого нового товара служит индикатором успеха этого изделия. Оценка эффективности рекламы. Пространственные карты можно использовать для определения эффективности рекламы с точки зрения занятия торговой маркой желаемого положения на рынке. Ценовой анализ. Сравнение пространственных карт, разработанных с учетом и без учета восприятия иены, позволяет определить влияние цены на поведение покупателей. Решение о числе каналов сбыта. Мнения респондентов о сопоставимости торговых марок с различными торговыми точками могут привести к пространственным картам, полезным для принятия решения о количестве каналов сбыта. Построение шкалы отношений. Методы многомерного шкалирования используются для разработки соответствующей по размерности и конфигурации шкалы отношений.

Я Х Х Х СТАТИСТИКИ И ТЕРМИНЫ, ИСПОЛЬЗУЕМЫЕ В МНОГОМЕРНОМ ШКАЛИРОВАНИИ Ниже перечислены основные статистики, связанные с многомерным шкалированием. Х Х Оценка сходства (similarity judgments). Рейтинги всех возможных пар торговых марок или других объектов, отражающие их сходство по шкале Лайкерта.

Ранги предпочтений (preference rankings), Ранги торговых марок или других объектов в порядке их уменьшения (от большего к меньшему). Обычно эти данные получают при опросе респондентов. Х Стресс (stress). Мера соответствия подогнанной модели исходным данным: чем выше значение стресса, тем ниже качество подгонки модели. Х R-квадрат (R-square). R-квадратЧ это квадрат коэффициента корреляции, который показывает долю дисперсии оптимально отображенных данных, которые могут быть учтены ММШ. Мера соответствия подогнанной модели исходным данным.

Часть III. Сбор, подготовка и анализ данных Х Пространственная карта (spatial map). Воспринимаемые взаимосвязи между торговыми марками или другими объектами, представленные в виде геометрических связей между точками в многомерном пространстве. Координаты (coordinates). Указывают расположение торговых марок или объектов на пространственной карте. Развертка (unfolding). Представление торговых марок и респондентов в виде точек в одном и том же пространстве.

Х Х ВЫПОЛНЕНИЕ МНОГОМЕРНОГО ШКАЛИРОВАНИЯ На рис. 21.1 показаны этапы многомерного шкалирования.

Формулу J Обозначение размерностей и интерпретация конфигурации точек на пространственной карте lie надежности и достоверности.

Рис. 21.1. Многомерное шкалирование Исследователь должен тщательно сформулировать проблему многомерного шкалирования, поскольку можно использовать большое разнообразие исходных данных. Задача маркетолога Ч определить соответствующую форму для получения данных и выбрать метод многомерного шкалирования для их анализа. Важный аспект решения включает определение размерности для пространственной карты. Кроме того, следует обозначить оси координат на карте и интерпретировать выведенную на основе данных конфигурацию точек. И наконец, исследователь должен оценить качество полученных результатов [4]. Мы опишем каждый из этих этапов, начав с формулирования проблемы.

Формулирование проблемы При формулировании проблемы исследователю необходимо конкретизировать цель использования результатов многомерного шкалирования и выбрать торговые марки или другие объекты, которые предполагается проанализировать. Именно они определяют размерность шкалирования и получаемые конфигурации. Чтобы получить хорошо определяемую пространственную карту, следует включить как минимум восемь торговых марок или объектов. Включение свыше 25 торговых марок, вероятно, будет громоздким и утомит респондендов при опросе.

Глава 21. Многомерное шкалирование и совместный анализ Очень внимательно надо подходить к выбору конкретных торговых марок или объектов. Предположим, что исследователь заинтересован узнать восприятия покупателей автомобилей. Если автомобили-люкс не включены в набор объектов, результаты могут быть искажены. В основе выбора количества торговых марок и их конкретных наименований должна лежать проблема, маркетингового исследования, теоретические предпосылки и интуиция исследователя. Многомерное шкалирование проиллюстрировано нами с позиции получения пространственной карты для 10 известных марок зубной пасты: Aqua-Fresh, Crest, Colgate, Aim, Gleem, Macleans, Ultra Brite, Close-Up, Pepsodent и Dentagard. Перед тем как начать анализ, ответим на вопрос: как получить данные по этим маркам.

Получение исходных данных Как показано на рис, 21.2, исходные данные, полученные от респондентов, должны быть связаны с восприятиями или предпочтениями.

Исходные данные ММШ Восприятия Предпочтения Прямые подходы (суждения респондентов о сходстве) Непрямые подходы (рейтинги характеристик) Рис, 21.2. Исходные данные для многомерного шкалирования Вначале мы обсудим данные, касающиеся восприятия объектов, которые могут быть прямыми или непрямыми. Восприятие объектов: прямые подходы. При использовании прямого подхода к сбору данных о восприятии респондентов просят оценить, используя их собственный критерий, насколько похожи или не похожи между собой различные известные торговые марки. От респондентов часто требуется оценить все возможные пары известных торговых марок, рассматривая ш сходство по шкале Лайкерта. Эти данные связаны с оценками респондентов о сходстве товаров. Например, оценки сходства по всем возможным парам марок зубной пасты можно получить в таком виде. Очень непохожи Crest п о сравнению с Colgate Aqua-Fresh п о сравнению с Crest Crest п о сравнению с A i m 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 6 6 6 7 Очень положи Colgate п о сравнению с Aqua-Fresh Число оцениваемых пар равно л.х(л Ч 1)/2, где п ~ число объектов. Существуют и другие методы сбора данных. Респондентов можно попросить проранжировать все возможные пары от наиболее похожих к наименее похожим. В другом методе респонденты ранжируют известные Часть III. Сбор, подготовка и анализ данных торговые марки по сравнению с определенной базовой торговой маркой. Каждая торговая марка, в свою очередь, служит такой базой. В нашем примере использовали прямой метод. Респондентов попросили высказать свое мнение о сходстве для всех 45 (10 х 9/2) пар торговых марок зубной пасты, используя семибалльную шкалу. Данные, полученные от одного из респондентов, представлены в табл. 21.1 [5].

Таблица 21.1. Рейтинги сходства известных торговых марок зубной пасты Crest Aqua- Fresh Crest Co/gate Am G/eem Macleans Ultra Brite Close-Up Pepsodent Dentagard 5 Colgate Aim Gieem Macleans Ultra Brite Close-Up 7 4 4 2 2 2 4 5 4 5 5 6 6 2 3 2 2 2 ;

?.

5 6 6 7 Pepsodent Dentagard 2 2 Восприятие объектов: непрямые подходы. Непрямые подходы (derived approaches) к сбору данных о восприятии основаны на характеристиках объектов и требуют, чтобы респонденты оценивали объекты, исходя из их определенных характеристик, используя семантическую дифференциальную шкалу или шкалу Лайкерта. Непрямые подходы сбора данных в ММШ (derived approaches) Методика сбора данных о восприятии в ММШ, основанная на характеристиках объектов и требующая, чтобы респонденты оценивали объекты по определенным характеристикам с использованием семантической дифференциальной шкалы или шкалы Лайкерта. Например, различные марки зубной пасты можно оценить на основе следующих характеристик: Отбеливает зубы Предотвращает кариес Ч Ч Ч Не отбеливает зубы Не предотвращает развитие кариеса Приятный вкус Неприятный вкус Иногда в набор объектов также включают идеальную торговую марку. Респондентов просят оценить гипотетическую идеальную торговую марку по одному и тому же набору характеристик. Если атрибутивные рейтинги получены, то для каждой пары торговых марок выводят меру сходства (евклидово расстояние). Прямые методы по сравнению с непрямыми методами. Прямые методы имеют то преимущество, что исследователю не приходится определять набор явных характеристик. Респонденты оценивают сходство объектов, используя собственный критерий. К недостаткам прямого подхода можно отнести то, что на критерий влияют рассматриваемые торговые марки. Если различные известные марки автомобилей находятся в одном псионом диапазоне, то цена не будет Глава 21. Многомерное шкалирование и совместный анализ важным фактором. Достаточно сложно определить перед началом анализа, надо ли и если надо, то как объединять оценки респондентов. Более того, может быть затруднительно дать название размерностям на пространственной карте. Преимущество непрямого подхода состоит в том, что легко разделить респондентов на однородные группы в соответствии с их отношением к объекту, т.е. исходя из оценок свойств объекта. Также легко обозначить размерности на пространственной карте. Недостатком метода считается то, что исследователь должен определить все явные характеристики, а это непростая задача. На основе идентифицированных характеристик получают пространственную карту. Прямые подходы используют чаще, чем непрямые (атрибутивные). Однако лучше всего использовать оба подхода как взаимодополняющие. Суждения респондентов о сходстве объектов, полученные прямым методом, используются для получения пространственной карты, а атрибутивные оценки Ч для интерпретации размерностей карты восприятий. Аналогичные процедуры используют для данных, касающихся предпочтений респондентов. Данные, касающиеся предпочтений респондентов. С помощью данных о предпочтениях маркетолог-исследователь может увидеть порядок предпочтения объектов респондентами с точки зрения какого-либо их свойства. Обычный способ получения таких данных Ч ранжирование предпочтений. От респондентов требуется проранжировать торговые марки в порядке снижения их предпочтения (от наиболее предпочитаемого к наименее). Альтернативно, респондентов можно попросить выполнить попарное сравнение и указать, какую торговую марку они предпочитают в данной паре. Другой метод сбора данных о предпочтениях Ч получение оценок предпочтений для разных торговых марок. (Ранжирование, попарное сравнение и определение рейтинга изложены в главах 8 и 9 при обсуждении методов шкалирования). Если в основе пространственной карты лежат данные о предпочтениях, то расстояние означает различие в предпочтениях. Конфигурация, выведенная из данных о предпочтениях, может сильно отличаться от конфигурации, полученной на основе данных сходства объектов. Две торговые марки можно воспринимать как различные на карте восприятий, и как одинаковые на карте предпочтений, и наоборот. Например, зубные пасты Crest и Pepsodent могут восприниматься группой респондентов как совершенно разные, и поэтому соответствующие им точки будут далеко отстоять друг от друга на карте восприятий. Однако респонденты могут в равной степени предпочитать эти две марки зубной пасты, и поэтому на карте предпочтений точки, соответствующие маркам этих зубных паст, находятся недалеко одна от другой. Чтобы проиллюстрировать процедуру многомерного шкалирования, мы используем данные восприятий, полученные в примере с зубной пастой, а затем рассмотрим шкалирование данных о предпочтениях.

Выбор метода многомерного шкалирования Выбор конкретного метода многомерного шкалирования зависит от того, какие именно данные Ч о восприятиях или о предпочтениях, подлежат шкалированию, или необходимо проанализировать оба их вида. Природа исходных данных определяющий фактор. Неметрические методы ММШ (nonmetric MDS) предполагают, что исходные данные будут порядковыми, но в результате анализа они преобразуются в метрические.

Неметрические методы ММШ (nonmetric MDS) Методы многомерного шкалирования, который используется тогда, когда исходные данные порядковые.

Предположим, что расстояния на полученной пространственной карте выражены в интервальной шкале. Неметрические методы ММШ определяют, в заданной размерности, пространственную карту, на которой ранговые порядки оцененных расстояний между торговыми марками или объектами наилучшим образом сохраняют или воспроизводят ранговые порядки исходных данных. В противоположность этому, метрические методы ММШ (metric MDS) предполагают, что исходные данные метрические.

Часть 111, Сбор, подготовка и анализ данных Метрические методы ММШ (Metric MDS) Методы многомерного шкалирования, используемый тогда, когда исходные данные метрические.

Поскольку выходные данные также метрические, между исходными и выходными данными сохраняется сильная взаимосвязь, а атрибуты исходных данных, выраженные в метрической шкале (интервальной или относительной), также сохраняются. Метрические и неметрические методы приводят к одинаковым результатам [6]. Другой фактор, влияющий на выбор метода, определяет, проводится ММШ на уровне отдельного респондента или на агрегатном уровне. В анализе на уровне респондента данные анализируют отдельно для каждого респондента и получают пространственную карту также для каждого респондента. Хотя анализ на индивидуальном уровне полезен с точки зрения перспектив исследования, по мнению менеджмента, он не очень привлекателен. Маркетинговые стратегии обычно формулируют на сегментном или агрегатном уровне, а не на индивидуальном. Если выполнять анализ на агрегатном уровне, то при объединении индивидуальных данных необходимо сделать некоторые допущения. Обычно принимают, что все респонденты используют одни и те же размерности для оценки торговых марок или объектов, но разные респонденты взвешивают эти общие размерности по-разному. Данные в табл. 21.1 представляют проранжированную оценку восприятия, для получения которой использовали порядковую шкалу. Поэтому маркетологи использовали неметрический метод ММШ. Поскольку эти данные получены от одного респондента, исследователи выполнили анализ на индивидуальном уровне. Для построения пространственных карт использовали от одной до четырех размерностей, а затем приняли решение о соответствующем количестве размерностей. Это решение (о количестве размерностей) Ч центральный пункт ММШ, поэтому мы подробно рассмотрим его в следующем разделе.

Принятие решения о количестве размерностей Цель многомерного шкалирования Ч получить пространственную карту с наименьшим количеством размерностей, которая наилучшим образом подходит для анализа исходных данных. Однако пространственные карты рассчитывают таким образом, что соответствие модели исходным данным увеличивается с ростом количества размерностей пространства. Поэтому следует идти на компромисс. Для определения того, насколько принятое в рамках ММШ решение соответствует точному отображению исходных данных, обычно используют показатель стресса. Он является мерой соответствия подогнанной модели исходным данным;

чем выше значение стресса, тем ниже качество подгонки модели. Для определения числа размерностей пространства нужно руководствоваться следующими принципами. Х Априорное знание. Теория или результаты прошлых исследований могут подсказать количество размерностей в конкретной ситуации. Х Интерпретируемость пространственной карты. Обычно трудно интерпретировать конфигурации или карты, полученные в более чем трех измерениях. Х Критерий изогнутости (elbow criterion). Следует изучить график зависимости стресса от размерности пространства. Точки на графике стресса обычно образуют выпуклую кривую, показанную на рис. 21.3. Точка, в которой наблюдается поворот или резкий изгиб, указывает на соответствующее число размерностей. Увеличение размерности после точки излома обычно не улучшает адекватность подогнанной модели исходным данным. Х Легкость в использовании. Обычно легче работать с двумерными картами или конфигурациями, а не с картами, включающими больше размерностей. Х Статистические методы. Опытные пользователи могут определять размерность статистическими методами [7].

Глава 21. Многомерное шкалирование и совместный анализ I Критерий изогнутости (elbow criterion) Используемый в многомерном шкалировании график зависимости стресса от размерности пространства. Точка, в которой наблюдается поворот или резкий изгиб, указывает на соответствующее число размерностей.

Число размерностей Рис. 21.3. График зависимости стресса от размерности Исходя из графика зависимости стресса от размерности пространства, интерпретируемости пространственной карты и критерия легкости в использовании данной размерности, маркетологи в рассматриваемом нами примере приняли решение о двумерном пространстве. Это показано на рис. 21.4.

Обозначение размерности и интерпретация конфигурации точек на карте Как только пространственная карта создана, необходимо дать название соответствующим размерностям (осям координат на пространственной карте) и интерпретировать конфигурацию точек на карте. Исследователь самостоятельно принимает решение об обозначении размерности, руководствуясь своим опытом. В этом помогут следующие указания. Х Даже если прямым метолом получены суждения респондентов о сходстве объектов, то все равно можно собрать рейтинги торговых марок по характеристикам объекта. С помощью регрессионного анализа эти атрибутивные векторы можно расположить на пространственной карте (рис. 21.5). Затем осям координат дается обозначение, исходя из того, насколько близко векторы совмещаются с соответствующими осями.

Часть lit. Сбор подготовка и анализ данных 1,0 0,5 0, Macleans Uftrabrite Aim Х Х Pepsodentя Dose-Up Gieem Х Crest Colgate -0,5 -1, Dentagard Х Aqua-Fresh -1,5 -2,0 -2, I -1. I -1, I I -0, I 0,5 1, l.b Рис. 21.4. Пространственная карта торговых марок зубной пасты После сбора прямым методом респондентами оценок сходства или восприятия их можно попросить указать критерий, используемый в их оценках. Затем эти критерии привязываются к осям пространственной карты. Х По возможности респондентам следует показывать пространственные карты, получившиеся на основе их оценок и попросить обозначить оси, анализируя получившуюся конфигурацию точек. Х Если существуют объективные характеристики товаров (например, лошадиная сила или количество пройденных километров на литр бензина для автомобилей), то их можно использовать как средство интерпретации субъективных размерностей пространственной карты. Часто ось представляет несколько характеристик объекта. Пространственную карту можно интерпретировать, изучив координаты и относительное расположение торговых марок. Например, торговые марки расположенные рядом, конкурируют более жестко. Изолированно расположенные торговые марки имеют свой уникальный имидж. Торговые марки, удаленные от начала осей координат, сильнее по данной характеристике. Таким образом, можно истолковать силу и слабость каждого товара. Пробелы на пространственной карте могут указывать на потенциальные возможности для внедрения на рынок новых товаров. На рис. 21.5 один отрезок горизонтальной оси можно обозначить как "защита от кариеса", а другой Ч "отбеливание зубов". Торговые марки с высокими положительными значениями на этой оси включают зубные пасты Aqua-Fresh, Crest, Colgate и Aim (сильная защита от кариеса). Торговые марки с высокими отрицательными значениями на этой оси включают зубные пасты Ultra Brite, Close-Up и Pepsodent (обладают хорошим отбеливающим эффектом, обеспечивают белизну зубов). Вертикальные оси можно интерпретировать: ''плохо удаляет зубной налет " по сравнению с "хорошо удаляет зубной налет". Обратите внимание, что зубная паста Dentagard, известная способностью удалять зубной налет, имеет отрицательное значение по вертикальной оси. Пробелы на пространственной карте показывают потенциальные возможности для предложения зубной пасты со свойствами высокой защиты от кариеса и хорошей способностью удалять зубной налет. Х Глава 21. Многомерное шкалирование и совместный анализ -0,fi - Отбеливает зубы -1,." -Х Oose-Up Х Colgate Х Aqua-Fresh Dentagard -1, -2, -1, -1, -0, 0, 1, 1, 2, Рис, 21.5. Использование атрибутивных векторов для обозначения осей координат Оценка надежности и достоверности Маркетологу необходимо оценить надежность и достоверность решений многомерного шкалирования. Для этого предлагаются следующие действия. Х Рассчитать коэффициент соответствия или R2 Ч квадрат коэффициента корреляции, указывающий на долю дисперсии оптимально шкалированных данных, которая может быть учтена методом многомерного шкалирования. Таким образом, этот коэффициент показывает, насколько хорошо модель многомерного шкалирования соответствует исходным данным. Несмотря на то, что желательно иметь высокие значения R2, допустимыми считаются значения 0,60 и выше. Х Значения стрессаЧ также показатели качества решений ММШ. R2 представляет собой меру соответствия модели исходным данным, а стресс Ч меру несоответствия модели или долю дисперсии оптимально шкалированных данных, которую не учитывает модель ММШ. Значения стресса варьируют в зависимости от метода ММШ и анализируемых данных. Для значений стресса, вычисляемых по стресс-формуле Краскела, даются следующие рекомендации [8]. Стресс (%) Критерий соответствия модели 20 Плохое 10 Удовлетворигельное 5 Хорошее 2,5 Отличное О Превосходное (полное) Х Если анализ проводят на агрегатном уровне, то исходные данные можно разбить на две или больше частей. Процедуру ММШ следует выполнить отдельно для каждой части, а затем результаты сравнить.

Часть III. Сбор, подготовка и анализ данных Некоторые из объектов можно выборочно исключить из исходных данных и решения принимать по оставшимся объектам. Х К исходным данным можно добавить случайный ошибочный член. Полученные в результате данные подвергают ММШ и решения сравнивают. Исходные данные можно собрать в разное время и сравнить проверочные тесты между собой. Для оценки достоверности ММШ существует ряд формальных процедур [9]. В нашем примере значение стресса, равное 0,095, указывает на удовлетворительное соответствие модели исходным данным. Одна торговая марка, Dentagard, отличается от других. Существенно ли изменит исключение Dentagard из набора стимулов относительную конфигурацию других торговых марок на пространственной карте? Пространственная карта, полученная после удаления из исходных данных Dentgard, показана на рис. 21.6. Х Х 1.0 0,5 00 -05 1, Close-Upя Aqua-Fresh Macleans Uitrabrtte Colgate Crest Х Х Pepsodent -го Рис. 21.6. Оценка стабильности расположения торговых марок за счет удаления одной торговой марки Наблюдается некоторое изменение относительного расположения торговых марок, особенно Gleem и Macleans. Поскольку изменения небольшие, это свидетельствует об удовлетворительной стабильности расположения торговых марок на пространственной карте [10].

ДОПУЩЕНИЯ И ОГРАНИЧЕНИЯ ММШ Укажем на некоторые допущения и ограничения многомерного шкалирования. При проведении ММШ предполагается, что объект А похож на объект В так же, как объект В Ч на объект А. Существует несколько примеров, в которых это допущение нарушается. Например, Мексику воспринимают как более похожую на США, чем С Ш А Ч на Мексику. Многомерное шкалирование допускает, что расстояние (сходство) между двумя объектами представляет собой некоторую функцию от их частичных сходств по каждой из нескольких воспринимаемых характеристик. После получения пространственной карты принимают, что расстояния между точками измерены в относительной шкале, а многомерные оси координат на карте выражены в интер Глава 21. Многомерное шкалирование и совместный анализ вальной шкапе. Ограничение ММШ состоит в том, что интерпретировать размерность, связанную с физическими изменениями в торговых марках, к изменениям на пространственной карте достаточно сложно. Эти ограничения справедливы и для данных о восприятиях.

Pages:     | 1 |   ...   | 16 | 17 | 18 | 19 | 20 |   ...   | 22 |    Книги, научные публикации