Рич Р. К. Политология. Методы исследования: Пер с англ. / Предисл. А. К. Соколова

Вид материалаАнализ

Содержание


Подготовка к контент-анализу
Проведение содержательного контент-анализа
Подобный материал:
1   ...   15   16   17   18   19   20   21   22   ...   35
[c.270]

ПОДГОТОВКА К КОНТЕНТ-АНАЛИЗУ

Контент-анализ может быть использован для ответа на исследовательские вопросы всегда, если имеется какой-то материальный носитель информации, так или иначе относящейся к интересующим нас политическим субъектам, и когда у исследователя есть доступ к этому информационному источнику. Примеры таких носителей – книги, памфлеты, журналы, газеты, фонограммы, аудио– и видеозаписи, фотографии, протоколы собраний или заседаний, правительственные документы, внутриведомственные циркуляры, фильмы, дипломатические коммюнике и инструкции, политические плакаты, карикатуры и лозунги, тексты речей и даже письма и дневники. Некоторые из этих носителей могут быть предельно подробными и точными (как, например, стенографический отчет о заседании конгресса) в отличие от других (например, от повестки дня того же самого заседания). Многие из них никак не зависят от исследовательского процесса (как, например, газетные публикации об изучаемом нами лице или организации), но есть и такие, которые исследователь должен воспроизвести сам (например, видеозаписи информационных телепрограмм). Однако все источники данных для контент-анализа имеют одну существенную черту: наличие материального носителя информации. Во всех случаях, когда он существует или может быть воссоздан, допустимо использование контент-анализа.

Первый шаг в подготовке к контент-анализу состоит в определении той совокупности сообщений, которую мы [c.270] будем изучать. Здесь перед нами открывается ряд возможностей. То, какая из них оптимальна, будет зависеть от конкретного исследовательского вопроса. Например, если объектом нашего исследования являются политические сюжеты в американской романистике XX в., то мы вправе определить искомую совокупность как все романы (тип сообщений), вышедшие из-под пера американских авторов (продуцент сообщений) и опубликованные в США (место распространения сообщений) в период между 1 января 1900 г. и сегодняшним днем (время появления сообщений). Если же нас интересует то, как освещалась в газетах определенная предвыборная кампания, искомая совокупность будет включать в себя все предвыборные газетные публикации (тип сообщений) размером в два и более газетных столбца (объем сообщений), опубликованные в ежедневных газетах (частота появления сообщений), которые были доставлены подписчикам (способ распространения сообщений) 6-го, 7-го и 8-го избирательных округов штата Огайо (место распространения сообщений) в период с 1 сентября по 5 ноября соответствующего года выборов (время появления сообщений).

Точно так же если мы хотим исследовать динамику развития напряженности в отношениях между США и Угандой в 70-е годы, то искомая совокупность может быть определена как все дипломатические послания (тип сообщений), которыми обменялись правительства США и Уганды (стороны, участвующие в процессе коммуникации) в течение определенного периода времени.

В каждом из этих примеров совокупность сообщений, подлежащих изучению, определяется с помощью набора заданных критериев, которым должно отвечать каждое сообщение. К этим критериям относятся: тип сообщений (романы, газетные публикации, дипломатические ноты), тип продуцента сообщений, стороны, участвующие в процессе коммуникации (отправитель, или получатель, или они оба), а также место распространения, частота появления, минимальный объем или длина, способ распространения и время появления сообщений. При необходимости могут быть использованы и другие критерии, однако те, которые перечислены нами выше, встречаются в большинстве исследований, где применяется контент-анализ. Первоочередная задача при подготовке к контент-анализу [c.271] состоит в том, чтобы выбрать среди этих критериев те, которые имеют наиболее непосредственное отношение к конкретному исследовательскому вопросу.

После того как мы определили совокупность сообщений, перед нами встает задача решить, какие из сообщений мы будем изучать наиболее детально. Поскольку подлежащие анализу случаи (сообщения) зачастую ограничены по числу и относительно хорошо доступны и поскольку контент-анализ в целом менее дорогостоящ (в расчете на каждое сообщение), чем другие методы (в особенности опрос), иногда удается подробно исследовать каждый случай (сообщение) из данной совокупности, т.е., по сути, произвести опись всех случаев. Именно возможность изучения большого количества случаев является одной из главных привлекательных черт контент-анализа как исследовательского метода. Чаще, однако, случается, что даже контент-анализ вынужден опираться на ограниченную выборку, взятую из более крупной совокупности.

Ввиду того что для документов, газетных статей и пр. обыкновенно существуют указатели или перечни, публикуемые в центральных изданиях и потому доступные для исследования, в контент-анализе из выборочных методов чаще всего применяются простой случайный отбор и систематический случайный отбор. Но даже тогда, когда необходимо выборочное обследование, размеры выборок для контент-анализа – благодаря доступности и относительной дешевизне исходных данных – обычно значительно превосходят те, которыми вынуждены довольствоваться другие виды исследования. Результатом этого, конечно же, является уменьшение ошибки выборки и повышение уровня надежности наших обобщений.

И наконец, готовясь к проведению контент-анализа, мы должны принять решение о единице измерения, или – если использовать более общеупотребительный термин – о единице анализа. В контент-аналитическом исследовании единица анализа – это просто отдельный элемент или признак того сообщения, которое мы собираемся изучать, обсчитывать или оценивать. Простейшим элементом сообщения является слово, и оно может быть использовано в контент-анализе наиболее непосредственным образом. [c.272]

Например, желая ответить на вопрос “Насколько интересовали проблемы мира во всем мире Р. Рейгана, Дж. Картера, Дж. Форда и Р. Никсона?”, мы могли бы взять выборки из выступлений каждого президента и подсчитать, сколько раз в тексте появится слово “мир” (и, возможно, некоторые другие, связанные с этим слова). Отвечая на вопрос “Какая страна – Израиль, Египет, Сирия или Саудовская Аравия – занимает наиболее миротворческую позицию по вопросам ближневосточного конфликта, если судить по выступлениям ее представителей в ООН в период с 1975 по 1990 г.?”, мы снова могли бы, взяв записи всех таких выступлений, подсчитать частоту появления слов типа “мир”, “братство”, “компромисс” и т.п. Таким образом, метод состоит в том, что устанавливаются определенные ключевые слова и подсчитывается частота их употребления в сообщениях.

Однако даже в столь простой процедуре надо следить за тем, чтобы избежать по меньшей мере двух характерных ошибок. Во-первых, следует помнить, что оперирование нестандартизированными мерами может приводить к смещениям в результатах. Если за рассматриваемый период времени представители Израиля в своих выступлениях произнесли 100 тыс. слов, причем интересующие нас ключевые слова были упомянуты ими 50 раз, а представители Египта произнесли 200 тыс. слов, включая 100 упоминаний соответствующих ключевых слов, то, исходя из этого, можно прийти к двум разным заключениям в зависимости от того, стандартизированы или нет наши показатели. Если мы просто подсчитаем общее число упоминаний ключевых слов, то у нас получится, что египтяне выказали вдвое большую заинтересованность в мирном урегулировании конфликта, чем израильтяне. Если же, однако, мы стандартизируем нашу меру так, чтобы с ее помощью можно было определять долю всех ключевых упоминаний (допустим, в расчете на каждую тысячу слов), то в итоге мы сможем заключить, что обе стороны одинаково заинтересованы в улаживании конфликта. Какой из этих подходов правильнее? Это основной вопрос при операционализации переменных, и ответ на него достигается успешнее всего, если более внимательно присмотреться к тому, как была изначально концептуализована исследовательская проблема. Дело в том, что использование даже [c.273] такого на вид конкретного показателя, как число произнесенных ключевых слов, может быть чревато определенной двусмысленностью. Исследователь должен видеть эту двусмысленность и уметь с нею справляться, поскольку принятые (или, наоборот, упущенные) в связи с этим решения могут оказать существенное влияние на окончательные выводы.

Вторая возможная ошибка, связанная с грубо прямолинейным подсчетом слов, состоит в том, что одно и то же слово может употребляться в самых разных контекстах, изменяющих его значение. “Мы стремимся к миру, но...”, “Арабское братство никогда не допустит...”, “О компромиссе не может быть и речи...” – при отсутствии каких-либо средств контроля такие упоминания слов “мир”, “братство”, “компромисс” будут сочтены упоминаниями в позитивном смысле, а это – самое меньшее – приведет к завышению оценки степени заинтересованности соответствующей стороны в достижении мирной договоренности. Если подобного рода употребления достаточно часты, они могут в конечном итоге совершенно нас дезориентировать. Поэтому когда мы беремся считать слова, то это следует делать с учетом контекста.

Тут у нас имеется по меньшей мере две возможности. С одной стороны, мы можем использовать мнения арбитров, или кодировщиков, т.е. членов исследовательской группы, в задачу которых входит прочтение и оценка контекстов ключевых слов с точки зрения их позитивности, негативности или нейтральности. Обычно, прежде чем будет достигнуто окончательное решение, каждое упоминание должно быть прочитано не менее чем двумя кодировщиками, оценки которых должны быть согласованы. (Позже мы еще вернемся к этому вопросу.) Подобные оценки контекста позволяют впоследствии подсчитать числовое соотношение позитивных и негативных упоминаний.

Другой возможный путь интерпретации отдельных слов в контексте (хотя это дает всего лишь частичное решение проблемы) состоит в том, чтобы добавить к рассмотрению вторую единицу анализа – тему. Тема – это некоторое вполне определенное сочетание слов или понятий, воплощенное во фразе, в предложении или даже в абзаце. Фактически, подсчитывая темы, мы занимаемся поиском упоминаний в тексте объектов обсуждения, например [c.274] в виде фраз “холодная война”, “проблема беженцев”, “государственное социальное страхование”, “христианское поведение”. Данная процедура является вариантом подсчета слов – но вариантом улучшенным в том отношении, что в состав тем входят пояснительный текст и слова-модификаторы (наречия, прилагательные), сопровождающие употребление конкретного слова и помогающие установить его значение.

Однако и в этой процедуре есть своя трудность. Дело в том, что хотя такой анализ действительно проясняет контекст употребления отдельных слов, но происходит это за счет значительного усложнения всей процедуры. Ведь одна и та же тема может упоминаться по-разному и с помощью самых разных словосочетаний. Иногда это – тонкий намек, почти или совсем лишенный тех эксплицитных признаков, по которым мы опознаём данную тему. Упоминание о “холодной войне”, например, вполне может быть завуалировано миротворческими словами о разрядке, а упоминание о христианском доброчестии может быть замаскировано националистической риторикой. Можно ли подобные слова и риторику считать ключевыми? Содержат ли они в себе данную тему или нет? На эти вопросы непросто ответить. Попытки сделать это заставляют приходить к четким, но ограниченным определениям, к формулировке целого ряда строго формализованных правил принятия решения (разрешающих, например, производить подсчет только по эксплицитным, заданным некоторым списком упоминаниям темы), которые делают наши результаты, возможно, более надежными, но одновременно и менее содержательными.

Третий элемент, часто используемый в исследованиях с применением контент-анализа, – это собственно предмет как таковой, рассматриваемый в целом. Каков процент книг, пропагандирующих социализм, опубликованных в США в 1935 году? Какому кандидату в президенты в 1992 г. симпатизировало наибольшее количество редакций газет? Как письма, написанные Ричардом Никсоном после того, как он ушел со своего поста, отличаются от писем, написанных ранее? В каком из этих случаев мы обрабатываем несущий информацию блок как некую целую единицу и изучаем его общие, всеохватывающие характеристики. Какой конкретный вопрос рассматривается в [c.275] этом случае? Отражаются ли определенные ценностные установки или пристрастия? При рассмотрении таких вопросов притупляется острота взгляда, необходимого при анализе более мелких структур. Неизбежным становится присвоение обобщающих определений, но именно в силу этих причин их анализ обычно легче выполнить, чем анализ слов или тем, в том смысле, что исследователю приходится делать меньше запросов. И это действительно так, поскольку можно оперировать переменными достаточно нейтрального уровня, – уровня, на котором события (то есть происшествия заметные, яркие) часто более очевидны и на котором оценки более достоверны.

Предметное изучение употребления слов и тем в последнее время стало легче проводить благодаря развитию компьютерных баз данных, таких, как LEXIS/NEXIX. Предположим, к примеру, что мы хотим узнать, как часто Дж. Буш сравнивал Саддама Хусейна с Гитлером в течение месяца, предшествующего войне 1991 г. в Персидском заливе. Используя NEXIS, мы можем сделать запрос на полнотекстовое исследование всех статей в “Нью-Йорк Тайме” (и любых других газетных статей и текстов передач широкого вещания), в которых слова “Дж. Буш”, “Саддам Хусейн” и “Гитлер” встречаются в хронологический период, выбранный для изучения. Тогда в соответствующем файле, с учетом особенностей пакета и языка, можно будет написать команду примерно следующего вида:

((George Bush) OR (President Bush) AND ((Saddam Hussein) w/10 Hitler)) AND (Date = September 1990)

Это длинное выражение задает команду, по которой в любой статье, опубликованной в сентябре 1990 г., будет опознан, во-первых, поименованный мистер Буш, а во-вторых, мистер Хусейн, если его имя отстоит в тексте от слова “Гитлер” не более чем на 10 слов в любую сторону. Такой запрос позволяет нам, кроме всего прочего, проверить (1), упоминалось ли имя мистера Буша вместе с его титулом чаще, чем без титула в то время, как становилось все яснее, что кризис будет разрешен военным путем (поскольку было бы возможно предположить ситуацию, что средства массовой информации неуловимо будут повышать весомость статуса президента, по мере того как [c.276] нация приближается к войне); (2) по сравнению с другими политиками мистер Буш лидировали или отставал по числу использования имени “Гитлер” в различных аналогиях, или (3) бесконечное число других гипотез, относящихся к формулированию восприятия конфликта обществом.

Результаты обобщенного анализа во многих отношениях не менее содержательны, чем результаты компонентного. Какой факт важнее: то, что египтянами в ходе одного из выступлений в ООН семь раз было упомянуто слово “мир”, или же то, что ими была произнесена в целом миротворческая речь? Более важно, посылали ли США в Ирак ноту с четырьмя открытыми упоминаниями об интервенции, тремя скрытыми намеками на неспособность разоружиться и двумя острокритическими намеками на военную экспансию, или что США послали ноту, которая может быть охарактеризована как вздорная по тону? В контент-анализе иногда – и всегда по недостатку средств – мы рискуем не увидеть леса за деревьями или , по аналогии, значение информации вообще за частями, ее составляющими. По этой причине мы должны быть очень и очень осторожными в выборе измеряемой единицы анализа и избрать наиболее перспективную и благоприятную для проведения исследования в целом. [c.277]

ПРОВЕДЕНИЕ СОДЕРЖАТЕЛЬНОГО КОНТЕНТ-АНАЛИЗА

Приняв решение о совокупности сообщений, выборке и единице анализа, мы можем приступать к самому анализу. Контент-анализ, основанный на исследовании слов, тем и сообщений, сосредоточивает внимание исследователя на содержании сообщения, на том, о чем в нем говорится. Таким образом, собираясь подвергнуть анализу эти элементы, мы должны уметь предвидеть их смысл и уметь определять каждое возможное наблюдение в соответствии с нашими ожиданиями.

На деле это означает, что в качестве первого шага при проведении контент-анализа этого типа мы должны создать своего рода словарь, в котором каждое наше наблюдение получит определение и будет отнесено к соответствующему классу. Допустим, например, нас интересует проблема идентификации в кубинских школьных учебниках [c.277] для 6-го класса всех упоминаний об американцах и США. Прежде чем приступать к анализу, мы должны определить, что же является в данном случае ключевым словом (словосочетанием). Должны ли мы обращать внимание только на слова “американец”, “американский” и “США”? Если да, то мы рискуем упустить из виду упоминания, состоящие из таких экспрессивно-оценочных терминов, как “агрессоры-янки”, “империалисты с Севера”, “гринго”, “захватчики”, “вторжение в Гуантанамо”, “беззаконный режим Вашингтона”. Более того, некоторые такие фразы могут употребляться в нескольких разных смыслах, из которых лишь один относится непосредственно к США. Рассмотрим следующие условия задач по арифметике:

1. Если кубинский народ владеет 1 тыс. акров пахотных земель, а неоколониалистские агрессоры отнимут у него 1 тыс. акров пахотных земель, то сколько акров пахотных земель останется кубинскому народу на пропитание?

2. Если африканцы владеют 1 тыс. акров пахотных земель, а неоколониалистские агрессоры отнимут у них 1 тыс. акров пахотных земель, то сколько акров пахотных земель останется африканцам на пропитание?

Допустим, что оба случая упоминания “неоколониалистских агрессоров” мы будем считать относящимися к США, тогда обе задачи будут восприняты нами как антиамериканские по смыслу. Однако тот, кто знаком с новейшей историей и идеологией Кубы, сочтет ключевым лишь первое из этих упоминаний, в то время как второе будет им интерпретировано скорее как выпад в адрес белого правительства ЮАР.

Проблема состоит в том, что мы должны предвидеть не только упоминания, которые нам могут встретиться, но и элементы их контекстуального употребления, а для этого мы должны разработать детальную систему правил оценки каждого случая употребления. Эта задача обычно решается посредством пилотажа подлежащей анализу совокупности сообщений (т.е. с помощью выявления на материале небольшой выборки сообщений тех типов ключевых упоминаний, которые с наибольшей вероятностью могут встретиться в последующем, более полном анализе) в сочетании с арбитражными оценками контекстов и способов употребления терминов. Здесь, как и в формальном [c.278] анализе, о котором речь пойдет ниже, предпочтительнее иметь дело с наблюдениями не одного, а нескольких исследователей.

==================================================================

Таблица 9.1

Образцы фраз из газетных передовиц в поддержку
некоторого кандидата (в случайном порядке)

Лучший из худших
Лучший из имеющихся
Лучше, чем его соперник
Наш главный избранник
Наилучший кандидат среди множества других
Кандидат, о каком можно только мечтать
Выдающийся деятель
Многообещающий деятель
Один из лучших сынов нации
Меньшее из двух зол
Лучшее из того, что мог бы дать процесс отбора
Наш неизменный любимец
Нужный сегодня человек
Приемлемый кандидат
Весьма приемлемый кандидат
Рекомендуем с рядом оговорок
Безоговорочно рекомендуем
Горячо поддерживаем
Искренне рекомендуем
Предлагаем свою поддержку
С радостью рекомендуем вашему вниманию
Призываем вас голосовать “за”

==================================================================

Более трудной является задача, заключающаяся в необходимости приписывания ключевым упоминаниям конкретных оценок, – когда мы должны решить, приводится ли данное упоминание в позитивном или негативном смысле, “за” или “против” интересующего нас объекта и т.д., а также когда нам надо ранжировать ряд упоминаний соответственно силе их оценок (т .е. в соответствии с тем, какое из них самое положительное, какое следующее за ним по положительности и т.д.). При этом мы нуждаемся в показателях достаточно тонких, которыми можно было бы измерять не только настроения политических субъектов, но и силу этих настроений. Ситуация подобного рода отражена в табл. 9.1, где в обобщенном виде перечислены возможные формы предвыборной поддержки газетой некоторой кандидатуры. Если целью является определить, какая из газет активнее всего поддерживает эту кандидатуру, то наша непосредственная задача будет [c.279] заключаться в том, чтобы решить, как следует ранжировать эти утверждения в соответствии с той силой поддержки, которую каждое из н их отражает.

Существует несколько методов, облетающих принятие такого решения. Два наиболее известных способа ранжирования – это метод Q-сортировки и шкалирование путем парного сравнения. Подобно методу шкалирования по Тёрстоуну, описанному в ссылка скрыта, они опираются на суждения группы арбитров о значении или силе (интенсивности) некоторого термина с той только разницей, что здесь арбитры могут отбираться из числа как отправителей, так и получателей сообщения, как из группы ученых, хорошо знакомых с предметом изучения, так и из населения в целом, а также из числа самих исследователей. Оба эти метода отличаются друг от друга и от метода Тёрстоуна по тем задачам, которые они ставят перед арбитрами.

Q -сортировка в этом отношении ближе к методике Тёрстоуна. В этом методе используется шкала жесткого распределения (forced distribution scale) из девяти пунктов: пункт 1 соответствует минимальной степени интенсивности измеряемого признака (например, наименьшей степени одобрения), а пункт 9 – максимальной степени интенсивности (например, наивысшей степени одобрения). В отличие от методики Тёрстоуна в рамках данной шкалы не предусмотрено отражение нейтрального или антитетического (прямо противоположного) суждения или оценки. Цель здесь состоит в том, чтобы просто ранжировать (упорядочить) все суждения вдоль единой оценочной оси. Кроме того, при пользовании Q-шкалой арбитры связаны ограничениями сильнее, чем в методике Тёрстоуна. Арбитру дается определенная жесткая квота на каждую категорию шкалы (т.е. ожидаемое число слов или фраз, которые должны быть им отнесены к данной категории), а затем ему предлагается распределить заданный набор терминов так, чтобы установленные квоты не нарушались. Квоты основаны на предположении (не обязательно верном), что колебания в интенсивности слов и фраз должны укладываться в рамки нормального распределения (когда изучаемые случаи максимально скучены в средней части шкалы, а по мере продвижения к ее полюсам их число равномерно убывает). Арбитры, таким образом, вынуждены давать относительные оценки конкретным словам и фразам