А. Н. Баранов Введение в прикладную лингвистику ббк 81я73 Издание осуществлено при поддержке Института «Открытое общество» (Фонд Сороса) в рамках конкурс

Вид материала

§4. Политическая лингвистика
4.2. Методика контент-анализа
Этапы подготовки и проведения эксперимента. Первый этап
Второй этап
Третий этап
Факторы контроля качества эксперимента
Фактор достоверности/обоснованности
Прагматическая достоверность
Виды контент-анализа

Подобный материал:

1 ... 23 24 25 26 27 28 29 30 ... 35

§4. Политическая лингвистика

4.1. Предмет и задачи политической лингвистики

Изучение политического языка было инициировано по крайней мере тремя факторами. Во-первых, внутренними потребностями лингвистической теории, которая с завидным постоянством в разные периоды истории лингвистики обращалась к реальным сферам функционирования языковой системы. «Примат речи» часто становился главным лозунгом реформаторов учения о языке. Во-вторых, чисто политологическими проблемами изучения политического мышления, его связи с политическим поведением; необходимостью построения предсказывающих моделей в политологии, а также разработки методов анализа политических текстов и текстов средств массовой информации для мониторинга различных тенденций в сфере общественного сознания. И, наконец, социальным заказом — малорезультативными попытками мыслящей части общества освободить политическую коммуникацию от манипуляций политиканов, обманывающих народ. Последний фактор одновременно стимулировал становление теории воздействия (см. предшествующий параграф), которая, однако, лишь частично пересекается с проблематикой политической лингвистики.

Предмет политической лингвистики — политический дискурс как совокупность дискурсивных практик, идентифицирующих участников политического дискурса как таковых или формирующих конкретную тематику политической коммуникации. Под дискурсивной практикой понимаются тенденции в использовании близких по функции, альтернативных языковых средств выражения определенного смысла. Эти тенденции, естественно, находят отражение в частоте употребления соответствующих феноменов фонетического, морфологического, синтаксического и семантического уровня. Очень близким аналогом в лингвистической поэтике можно считать понятие идиолекта писателя.

Опираясь на категорию вариативной интерпретации действительности, введенную во втором параграфе этой главы, можно сказать, что дискурсивные практики с лингвистической точки зрения определяются устойчивыми наборами языковых средств вариативной интерпретации, свойственными данному политическому субъекту или характерными для обсуждения данной темы политической коммуникации. В этом смысле можно говорить (и говорится) о таких предметах политической лингвистики, как «дискурс Рейгана», «дискурс Горбачева», «тоталитарный дискурс», «дискурс о безопасности», «дискурс свободы и справедливости», «парламентский дискурс». Иными словами, дискурс Рейгана — это совокупность дискурсивных практик Рейгана, проявляющихся в его политических выступлениях, интервью и т. д. Тоталитарный дискурс — это совокупность дискурсивных практик, характерных для политического языка тоталитарного общества, а дискурс о безопасности — совокупность дискурсивных практик, встречающихся в дискуссиях о безопасности государства и формирующих эти дискуссии как часть политического дискурса в целом.

Наиболее известные примеры дискурсов, на которых развивалась политическая лингвистика, «оселки» разработки методик изучения политического языка — русский политический язык советской эпохи (во французской лингвистике называемый «деревянный язык» — langue de bois), дискурс Великой французской революции, политический язык «Третьего Рейха» (взгляд филолога-литературоведа на этот феномен отражен в [Клемперер 1998]).

Теория воздействия исследует механизмы вариативной интерпретации действительности не только в политическом языке, но и при функционировании языковой системы в любой сфере деятельности человека. Тем самым она шире политической лингвистики и по постановке задачи и по предмету исследования, однако теория воздействия не исследует сочетания языковых механизмов ВИД, частоту их употребления, то есть сами дискурсивные практики. В этом отношении теория воздействия уже политической лингвистики.

Наиболее значительны различия между теорией воздействия и политической лингвистикой в сфере приложений. Основные области приложения политической лингвистики в политологии связаны с изучением политического мышления политиков по языковым данным и реконструкцией и мониторингом состояния общественного сознания по текстам средств массовой информации. Для работы с этими сложными феноменами были разработаны специальные методики — метод контент-анализа и методика когнитивного картирования.

4.2. Методика контент-анализа

Первые опыты использования количественных методов, близких к контент-аналитическим, относятся к концу XIX в. Именно тогда стало ощущаться влияние средств массовой информации — и особенно газет — на общество. В США по заказам некоторых общественных организаций и университетов был проведен ряд исследований тематики газетных статей. Тематика определялась на основе количественного анализа лексики. Общий вывод заключался в том, что пресса отдает предпочтение уголовной хронике, скандалам, сплетням и спорту, практически игнорируя сферу религии, науки и искусства [Speed 1893]. В 20-30-х гг. XX в. в США по текстам прессы отрабатываются техники изучения общественного мнения. В центре внимания контент-аналитических исследований оказываются более сложные категории, такие как установки, стереотипы, ценности.

Лассуэлл, с именем которого связывают существенный прогресс в технике контент-анализа, провел исследование основных тем и идей, превалировавших в официальной пропаганде стран-участников Первой мировой войны [Lasswell, Leites 1949; Lasswell 1952]. Во время Второй мировой войны контент-анализ стал составной частью оборонной политики. Эксперты лондонского радио проводили методом контент-анализа регулярный мониторинг текстов нацистской пропаганды в средствах массовой информации. Это позволило им выявить типичные последовательности действий министерства пропаганды, связанные с обоснованием тех или иных политических и военных акций. В результате аналитиками были предсказаны некоторые важные события в политической и военной сферах. Изучение документов агентства Transocean в США с использованием методов контент-анализа позволило разоблачить его сотрудников как нацистских агентов [Grawitz 1996, р. 550-582].

Рассмотрим методику контент-анализа с лингвистической точки зрения. Рациональность такого подхода объясняется тем, что по сути контент-анализ использует чисто лингвистическую информацию о характеристиках текста и пытается выявить его семантические особенности. Сущность контент-анализа заключается в том, чтобы по внешним — количественным — характеристикам текста на уровне слов и словосочетаний сделать правдоподобные предположения о его плане содержания и, как следствие, сделать выводы об особенностях мышления и сознания автора текста — его намерениях, установках, желаниях, ценностных ориентациях и т. д. Для литературного текста может быть поставлена задача изучения особенностей изображения представленных в нем персонажей. Если количество привлекаемых текстов и авторов достаточно велико, то сделанные выводы могут быть распространены на большую социально значимую группу людей и даже на общественное сознание в целом. Конечно, оценка мышления вряд ли относится к собственно лингвистической проблематике, впрочем, такие задачи, как изучение идиолекта писателя, вполне рядоположены исследованию особенностей мышления.

Важнейшей категорией контент-анализа является концептуальная переменная — понятие, которое стоит в центре проводимого исследования. Например, концептуальной переменной (К-переменной) могут быть такие категории, как «СВОЙ-ЧУЖОЙ», «ДЕМОКРАТИЯ», «ПРАВА ЧЕЛОВЕКА», «ЖЕНСКИЙ ВОПРОС», «МАТЕРИАЛЬНОЕ БЛАГОПОЛУЧИЕ». В конкретном тексте концептуальная переменная представлена своими значениями — языковыми представителями. Так, концептуальная категория «СВОЙ—ЧУЖОЙ» в текстах может иметь следующие значения: мой, наш, мы, я, привычный, знакомый, близкий vs. их, его, ее, он, она, оно, они, их, ее, его, непривычный, дальний, незнакомый. С другой стороны, концептуальная переменная «ДЕМОКРАТИЯ» может быть представлена в текстах следующими языковыми коррелятами: демократия, демократический, демократично, демократический выбор, власть народа, народовластие, выборность, возможность выбора, разделение властей.

Абсолютная частота концептуальной переменной определяется как совокупность абсолютных частот ее значений (языковых репрезентантов). Отсюда следует, что для правильности контент-анализа очень важно определить весь список значений, иначе будут пропущены некоторые вхождения концептуальной переменной и результаты исследования будут неточны.

Этапы подготовки и проведения эксперимента. Первый этап подготовки эксперимента заключается в выборе материала — корпуса языковых данных. Классический для контент-анализа пример корпуса данных — газетные публикации за определенный период времени или программы политических партий в разные периоды существования партий. Как правило, структура корпуса данных и отбор материала тесно связаны с самой постановкой задачи исследования. Например, если предметом исследования являются языковые и стилистические особенности русского рассказа XIX в., то и создаваемый корпус должен охватывать соответствующие литературные тексты того времени. Для формирования корпуса можно использовать принципы, разработанные в корпусной лингвистике — см. §3 главы 3.

Второй этап — выбор концептуальной переменной и определение ее значений — языковых репрезентантов выбранного понятия в тексте. Если значения К-переменной можно выявить в предварительном эксперименте на незначительном количестве материала (для часто исследуемых проблемных областей в социальных науках и политологии разработаны специальные словари-тезаурусы значений наиболее очевидных К-перемен-ных), то выбор самой К-переменной остается нетривиальной проблемой. Один из наиболее частых подводных камней при выборе К-переменной — это корреляция между частотой и значимостью, а также постулат о равнозначности вхождения значений К-переменной. Если эта корреляция отсутствует или одно вхождение (группа вхождений) перевешивает по значимости другие вхождения, то контент-анализ в классическом варианте неприменим. Например, если известно, что Эйзенхауэр, уходя со своего поста, произнес известную речь об опасности военно-промышленного комплекса, то любые контент-аналитические выкладки в связи с К-переменной «ВОЕННО-ПРОМЫШЛЕННЫЙ КОМПЛЕКС» не будут иметь никакого смысла по отношению к предшествующим выступлениям Эйзенхауэра, даже если бы они все были и позитивные или существенно превосходили отрицательные оценки. Иными словами, если исследователя интересует отношение данного политика к проблемам обороны и военного строительства, то в данном случае он должен выбрать другую переменную, например «АРМИЯ», «ВООРУЖЕННЫЕ СИЛЫ» и пр.

Третий этап — выбор единицы кодирования. Значения К-переменной могут приписываться текстам, их фрагментам, абзацам, предложениям и отдельным словам и словосочетаниям. Выбор единицы кодирования зависит от объема и характера корпуса данных и от типа контент-анализа. Если корпус данных — заголовки статей, то выбор единицы кодирования предопределен. С другой стороны, чем больше корпус данных, тем крупнее могут быть единицы кодирования. Для ручного контент-анализа зависимость единицы кодирования от объема корпуса очевидна. Если корпус насчитывает тысячи статей, а кодировщиков — два-три человека, то выбор в качестве единицы кодирования одной статьи вполне оправдан. Учитывается также и объем единиц хранения корпуса. Если корпус состоит из относительно небольших заметок, то опять-таки они и могут стать единицами кодирования.

Отбор кодировщиков и формулировка инструкций по кодированию образуют четвертый этап подготовки эксперимента. Ручной контент-анализ требует точной формулировки инструкций. Кодировщиков может быть несколько и они должны руководствоваться едиными принципами кодирования. Часто для обеспечения единообразия кодирования между кодировщиками и руководителями эксперимента проводятся семинары, позволяющие всем участникам уточнить и унифицировать принципы обработки материала. При компьютерном контент-анализе подготовка инструкций практически заменяется перечислением языковых форм выбранных значений К-переменной. Общие принципы кодировки задают два вида контент-анализа — жесткий и мягкий. При жестком варианте инструкции формулируются таким образом, что кодируются только явные вхождения К-переменной в текст, то есть только тогда, когда в тексте эксплицитно представлено одно из значений К-переменной. При мягком варианте контент-анализа инструкции позволяют кодировщику кодировать не только явные, но и неявные, имплицитные вхождения К-переменной и текст. Это допустимо в тех случаях, когда трудно исчислить все значения К-переменной. Например, К-переменная «ПРАВА ЧЕЛОВЕКА»

может реализоваться и в тексте о правилах техники безопасности на производстве. Предсказать такие значения К-переменной довольно трудно. Понятно, что компьютерный контент-анализ пока используется только как средство жесткого контент-анализа. Использование разрабатываемых в настоящее время интеллектуальных процессоров может в перспективе изменить ситуацию.

На пятом этапе происходит кодировка данных. И, наконец, на шестом этапе осуществляется подсчет данных и интерпретация результатов. Для обработки результатов часто используются сложные статистические методы анализа, в том числе факторный и кластерный анализ.

Факторы контроля качества эксперимента. В теории контент-анализа уделяется большое внимание обеспечению адекватности и точности проведения эксперимента. Для подготовки экспериментов и оценки их результатов учитываются факторы надежности (reliability) и достоверности/обоснованности (validity). Фактор надежности проявляется в трех основных формах — стабильности, повторяемости и тщательности (accuracy). Стабильность — самая слабая форма надежности. Она определяется тем, насколько один и тот же кодировщик через некоторое время после первой кодировки так же сможет обработать данные. Понятно, что для компьютерной версии контент-анализа эта характеристика надежности выполняется постольку, поскольку не меняется программа кодировки. Повторяемость является более сильной формой надежности, она характеризует возможность получения тех же результатов разными кодировщиками в разное время и в разных ситуациях по тем же инструкциям. Если разные кодировщики в разное время похожим образом кодируют одни и те же данные, используя одинаковые инструкции, то повторяемость эксперимента достаточно велика. Самой сильной формой надежности является тщательность, под которой понимается соответствие некоторой норме кодирования, выработанной экспертами. В элементарном случае тщательность проявляется в следовании выработанным инструкциям.

Фактор достоверности/обоснованности проявляется во многих разнообразных формах. Одна из них — семантическая достоверность — определяется тем, насколько инструкции кодировщику учитывают многозначность языковых выражений, являющихся значениями К-переменной. Так, при проведении контент-анализа на К-переменную «ВОЙНА-МИР» (по отношению к межгосударственным связям) инструкция кодирования, учитывающая фактор семантической достоверности, должна делать различие между значениями слова война, отсеивая употребления типа (1).

(1) После этого тихо тлевшая война перешла в открытые боевые действия. «Мослифт» полностью перестал обращаться на тот самый завод, чьи технологии — капельная пропитка статоров, централизованная нарезка канатов с обваркой концов, автоматизированная очистка редукторов главного привода и тому подобные лифтовые премудрости, — существенно улучшают качество ремонта.

[«Известия»]

Для достижения семантической достоверности в компьютерном контент-анализе широко используется метод Key-Word-In-Context, сводящийся к построению конкордансов на каждое из значений К-переменной. Эксперт (иногда в интерактивном режиме) помогает компьютерной программе и отбрасывает те контексты, в которых языковой репрезентант К-переменной употребляется не в том значении, которое нужно.

Семантическая достоверность может быть усилена и в том случае, если в качестве концептуальной переменной и ее репрезентантов выступает не одно слово, а словосочетание, более точно указывающее на сферу поиска. Например, в только что рассмотренном случае К-переменную «ВОЙНА-МИР» (по отношению к межгосударственным связям) можно переформулировать в виде «МЕЖГОСУДАРСТВЕННЫЙ КОНФЛИКТ» или «ПРОБЛЕМЫ В МЕЖДУНАРОДНЫХ ОТНОШЕНИЯХ» со значениями типа кризис в межгосударственных отношениях, международный конфликт/международные конфликты, напряженность в отношениях между странами X и Y и т. п. В литературе это иногда не вполне удачно называется введением темы [Мангейм, Рич 1999, с. 274, 275].

Еще одна форма достоверности — достоверность отбора данных (sampling validity) — относится к формированию корпуса данных. Выборка данных для кодирования должна быть репрезентативна для проблемной области. В контент-анализе для отбора данных часто используется метод случайной выборки, а также метод стратификационной выборки. В последнем случае проблемная область разбивается по релевантным параметрам и на каждое значение параметра подбирается пример. Наконец, для некоторых типов данных, характеризующихся регулярностью, привлекается систематический отбор. Анализ объявлений о найме жилья предполагает сплошной отбор материала из определенных изданий за фиксированный промежуток времени. В принципе, здесь могут использоваться те же критерии репрезентативности, которые разрабатывались в корпусной лингвистике — см. § 3 главы 3. Другим аспектом достоверности отбора данных является отбор единицы кодирования, которая может определяться самим кодировщиком или диктоваться структурой данных.

Прагматическая достоверность или достоверность предсказания, будучи довольно сильной формой фактора достоверности, характеризует возможность распространения выбранного метода и/или результатов на другие данные.

Виды контент-анализа. Выше уже говорилось о том, что в зависимости от принципов кодировки контент-анализ может быть жесткий и мягкий. Выделяется также содержательный и структурный контент-анализ. Контент-анализ, основанный на выделении концептуальной переменной и исследовании ее значений (репрезентантов) в тексте, называется содержательным. Возможен и другой вариант контент-анализа, при котором также предполагается выделение концептуальной переменной, однако ее репрезентанты изучаются с точки зрения формы. Например, К-переменная «ВЫБОРЫ ПРЕЗИДЕНТА РОССИИ» может анализироваться с точки зрения того, сколько места посвящалось тому или иному кандидату в средствах массовой информации — страниц, колонок в статьях, статей, количество появлений на телевидении; были ли фотографии кандидата в прессе или нет, были ли какие-нибудь другие иллюстрации, на каких полосах газет, журналов появлялись сообщения о кандидате и пр. Такой контент-анализ получил название структурного. За единицу анализа в этом случае принимается «материал о кандидате» или «сообщение о кандидате», которое может определяться как любое газетное сообщение о кандидате или любое его упоминание в новостных, информационных и общеполитических передачах на телевидении.

Структурный контент-анализ по сравнению с содержательным более прост в разработке и проведении, однако он дает не окончательный результат, а полуфабрикат, который требует дальнейшего изучения и содержательной интерпретации.