Iv методы и операции сбора данных, подлежащих количественному анализу
Вид материала | Документы |
- «Нарочанский». Анализ синантропного компонента флоры, 701.71kb.
- Понятие типа данных. Переменные и константы. Основные типы данных в языке Си: общая, 143.1kb.
- Устанавливает единые требования к выборочным проверкам в аудите, а также к методам, 323.84kb.
- Литература по курсу "химия", 457.46kb.
- Маслова О. М. Вопрос как инструмент получения эмпирических данных // Методы, 604.21kb.
- Лекция 05-10-09 оу сзи методы обследования (сбора данных), 229.04kb.
- План характеристика основных этапов технологического процесса Технологические операции, 234.25kb.
- Структура программы. Часть Структуры данных. 24. Классификация структур данных. Операции, 41.26kb.
- Пример рабочей программы дисциплины ооп основы построения современных систем, 65.27kb.
- Конспект лекций по курсу "базы данных" (Ч., 861.92kb.
Глава V
"ЖЕСТКИЙ" АНАЛИЗ ЭМПИРИЧЕСКИХ ДАННЫХ1
1 "Жестким" мы называем статистический анализ в отличие от "мягкого" — качественного (гл. VI ).
Анализ собранной информации — самый увлекательный этап исследования. Мы проверяем, насколько верны были исходные предположения, получаем ответы на заданные вопросы и выявляем новые проблемы. Методологический инструмент анализа — гипотезы, сформулированные в программе, и те, что возникают по мере их проверки и отвержения уже в процессе анализа собранных данных.
Вспомним, что гипотезы подразделяются на описательные и объяснительные. Соответственно этому выделим два класса процедур анализа. К первому отнесем дискриптивные процедуры: группировку, классификацию и с некоторыми оговорками типологизацию2. Второй класс образуют аналитике-экспериментальные процедуры, назначение которых — установление связей взаимодействия и детерминации.
2 Строго говоря, типологизация — промежуточный этап, совмещающий группировку и переход к анализу данных для проверки гипотез; ниже, при рассмотрении теоретической типологизации мы в этом убедимся (см. раздел 2 этой главы).
Цель этой главы — рассмотрение основных методов, но не техники анализа данных. Из технических средств мы используем наипростейшие и при необходимости будем отсылать читателей к соответствующей литературе.
И последнее. В этой главе речь идет об анализе данных массового социологического обследования, о качественно-количественном анализе, а в заключительном параграфе — о стратегии качественного анализа.
1. ГРУППИРОВКА И ЭМПИРИЧЕСКАЯ ТИПОЛОГИЗАЦИЯ
Группировка и классификация — элементарные процедуры упорядочения данных, предваряющих их анализ. С помощью этих действий мы "уплотняем" информацию, как бы расширяем области подобия и уста-навливаем новые границы различий в массе эмпирических данных, не выходя при этом за пределы индикативных свойств (т. е. на "языке" фиксированных данных наблюдения» опроса, документов). Типологический анализ опирается на те же или аналогичные процедуры» но предусматривает более высокий уровень обобщения, основанием которого выступают не сочетания признаков-индикаторов, но понятия, с ними соотносимые. Это уже стратегия анализа на качественно ином уровне обобщения.
Простая группировка — это классификация или упорядочение данных по одному признаку. Связывание фактов осуществляется здесь в соответствии с описательной гипотезой относительно ведущего признака группировки (или признака классификации). Так, в зависимости от гипотез можно сгруппировать выборочную совокупность по возрасту, полу, роду занятий, образованию, по высказанным суждениям и т. д.
Квалифицированные данные или количественные показатели группируются в ранжированные ряды по возрастанию (убыванию) признака, качественные или атрибутивные группируются по принципу построения неупорядоченных номинальных шкал.
Все операции последующего анализа покоятся на изучении сгруппированных данных.3
3 О технике группировки, классификации и статистическом анализе рядов распределения см. [12, 79, 109, 199, 259]. Наиболее полное пособие по методам анализа данных — новейшая публикация Г. Г. Татаровой [2вО]. См. также "Аннотированный список" в приложении 2.
Число членов группы называют частотой или численностью группы, а отношение данной численности к общему числу наблюдений — долей или относительной частотой. Статистические приемы поиска средней тенденции (мода, медиана, среднеарифметическая), подсчет дисперсии отклонения позволяют оценить сгруппированный ряд в емком показателе и отобразить результаты графически (с. 155, рис. 6). Простейший анализ группировки — исчисление частот по процентам.
Перекрестная группировка (или перекрестная классификация) — это связывание данных предварительно упорядоченных по двум признакам (свойствам, показателям) с целью: (а) обнаружить какие-то взаимозависимости, (б) осуществить взаимоконтроль показателей (например, ответов на основной и контрольный вопросы — с. 261, схема 20), сформировать новый составной показатель (индекс) на основе совмещения двух свойств или состояний объекта, определить (об этом ниже) направление связей влияния одного явления (характеристики, свойства) на другое.
Перекрестная классификация (группировка) производится в таблицах, где указывается наименование таблицы (какие признаки, свойства сопрягаются) и общая численность включенных в группировку объектов (см. схему 8, с. 161).
Одна из задач перекрестной классификации — поиск устойчивых связей, выявляющих структурные свойства изучаемого явления. Например, можно выявить типические соотношения возрастов мужей и жен (табл. 6).
Мужья в большинстве случаев старше жен. Так, из 719 мужчин в возрасте 20—24 лет 158 (21%) имеют супруг моложе себя, а 62 (8,6%) — старше. Из 850 жен-Щинвтом же возрасте только 10 старше своих мужей, но в 336 случаях (39,5%) они моложе мужей.
Табл. 7 иллюстрирует использование перекрестной группировки для установления зависимости между предметной областью научного знания и длительностью "долужизни" публикаций (последняя определяется как период сокращения ссылок вдвое сравнительно с первоначальным периодом).
Таблица 6 Перекрестная классификация возраста супругов | |||||||||
Возраст | Возраст жены (лет) | Итого | |||||||
| | | | | | | | | (чел.) |
мужа (лет) | 15-19 | 20-24 | 35-29 | 30-34 | 35-39 | 10-44 | 45-19 | 50-» | |
15-19 | 42 | 10 | 3 | | | | | | 55 |
20.24 | 158 | 504 | 51 | 10 | 1 | | | | 719 |
25-29 | 52 | 271 | 184 | 22 | 7 | 2 | | | 538 |
30-34 | 5 | 52 | 87 | 69 | 13 | 5 | | | 231 |
35-39 | 1 | 12 | 27 | 29 | 21 | 2 | 3 | | 95 |
40-44 | | 1 | 9 | 18 | 17 | 8 | 2 | 1 | 50 |
48-49 | 1 | | 3 | в | IS | 16 | 7 | 1 | 49 |
50 | | | 1 | 4 | 11 | 15 | 21 | 43 | 95 |
Итого | 259 | 850 | 365 | 188 | 8в | 47 | 33 | 45 | 1838 |
(чел.) | | | | | | | | | |
Источник: [270. С 801]. Данные по США. |
Из таблицы видно, что наибольшим "долголетием" обладают публикации по экономике, наименьшим — в ряде естественно-научных экспериментальных дисциплин и в математике.
Таблица 7 Время "полужизни" публикаций (период, за который число ссылок сокращается вдвое) в зависимости от области знания | |||
Наука | Время "полужизни" (лет) | Наука | Время "полужизни" (лет) |
Экономика | 33,0 | Биология | 5,0 |
География | 16,0 | Вычислительная | |
Геология | 11,8 | математика | 4,95 |
Ботаника | 10,0-11,8 | Физика | 3,9-4,6 |
Химия Математика | 8,1 5,42-10,5 | Биомедицина | 3,0 |
Источник: [278. С. 96]. |
Наконец, типичный случай использования перекрестной группировки—поиск тенденции, динамики процесса (табл. 8). Приведенные в табл. 8 данные хорошо иллюстрируются графически (рис. 13).
Таблица 8 Распределение рабочих, занятых в народном хозяйстве СССР, по уровню образования (в % к общей численности занятых) | ||||
Уровень образования | Доля рабочих, имеющих данный уровень образования. | |||
| 1959 г. | 1970 г. | 1979 г. | 1984г. |
Высшее, незаконченное высшее, среднее специальное | 2 | 4 | 9 | |
Полное среднее | 6 | 16 | 33 | 82 |
Неполное среднее | 32 | 39 | 34 | |
Начальное и более низкое | 60 | 41 | 24 | 8 |
Источник: [270. С. 96]. |
Эмпирическая типологизация — наиболее сильный прием анализа по описательному плану. Этот метод можно характеризовать как поиск устойчивых сочетаний свойств социальных объектов (или явлений), рассматриваемых в соответствии с описательными 'гипотезами в нескольких измерениях одновременно.
Основную идею подобной типологизации сформулировал применительно к социологии П. Лазарас-фельд. Он ввел понятие "пространство свойств" [360. С. 40—53].
Так, нетрудно вообразить свойства социальной группы в трехмерном физическом пространстве, т. е. в декартовой системе координат. Скажем, свойство А будем откладывать в "высоту", свойство В - в "ширину", а С – в "длину".
В этом трехмерном пространстве следует теперь определить, какова же упорядоченность свойств. Можно ли, допустим, сказать, что слабому выражению свойства А преимущественно соответствует слабое же выражение свойства В и сильное выражение свойства С или все три переменные ведут себя хаотически в отношении друг друга?
Чтобы определить степень упорядоченности свойств, образующих трехмерное пространство, И- А. Таганов и О. И. Шкаратан применили статистический критерий энтропии (Я). При значении Н=1 наблюдается полная упорядоченность состояний трех свойств, при значении Н=0 фиксируется полный хаос.
Указанные авторы провели массовое обследование рабочих для выявления признаков, образующих устойчивые подгруппы рабочих. Всего было исследовано 27 признаков, из которых построено 2925 всевозможных трехмерных сочетаний, и для каждого сочетания рассчитан показатель энтропии. Обнаружилось, что наибольшую упорядоченность связей дают три переменные: профессия, квалификация и образование. Именно они являются свойствами, детерминирующими возникновение неоднородных групп [257].
Более сложная задача — проанализировать степень скопления или рассеяния признаков (свойств) в многомерном пространстве. Такое пространство нельзя наглядно представить в трехмерной системе координат, его можно описать в математических символах. Задачи многомерной эмпирической типологизации свойств решают с помощью математических процедур распознавания образов — таксономии и кластерного анализа, причем в этом случае исходные данные могут быть представлены в упорядоченных (метрических также) или в неупорядоченных шкалах.
Рассмотрим для примера таксономический анализ мигрирующих из села в город и из города в село жителей Сибири [94].4 Т. И. Заславская и ее коллеги, впервые применившие метод таксономии к социальным объектам, при массовом обследовании мигрантов фиксировали десятки признаков: пол, возраст, семейное положение, профессию, образование, занятие до и после переезда, направление миграции, район выезда и въезда, цели миграции и т. д. Задача — на основе этих сведений определить, какие крупные половозрастные и социальные группы образуют миграционные потоки из села в город и обратно — из города в село. Выявление подобных социальных типов важно для практической регуляции миграционных потоков.
4 Литература о методах многомерной классификации: 206, 204, 2в4, 259, 260, 264].
Таблица 9 Направление миграционных потоков в различных типологических группах населения | ||||||
Направление миграции | Типологические группы (в % к численности группы) | |||||
I | II | III | IV | V | VI | |
Из крупного или среднего города в село | 7,3 | 0,8 | 0,0 | 1.2 | 0,0 | 3,0 |
Из малого города в село | 8,0 | 6,6 | 3,2 | 10,0 | 0.0 | 21,2 |
Из села в село | 47,7 | 14,6 | 13,8 | 41,7 | 22,8 | 15,2 |
Из села в малый | 16,2 | 47,0 | 35,0 | 4,1 | 31,0 | 22,7 |
город | | | | | | |
Из села в средний или крупный город | 20,8 | 31,0 | 48,0 | 42,4 | 46,2 | 37,9 |
В итоге таксономического анализа было обнаружено, в частности, шесть различных групп (таксонов): (I) — семейные мужчины и женщины, (И) — неженатые молодые мужчины, (III) — молодые девушки и незамужние женщины, (IV) — престарелые женщины без мужей, (V) — одинокие женщины среднего возраста без специальности, (VI) — одинокие женщины, имеющие специальность. Эти таксоны существенно различаются по характеру миграции (табл. 9).
Так, группа семейных (I) в основном перемещается из села в село, что также свойственно группе IV (это "бабушки", переезжающие из села в село к взрослым детям). Молодежь (группы II и III) по преимуществу движется в город, причем девушки больше, чем юноши.
Выделенные здесь типы довольно обобщены. Продолжая таксономический анализ, авторы обнаружили аемало более специфических и относительно малочисленных групп, различающихся по набору свойств.
Интереснейший результат получил А. М. Демидов5, который подверг кластерному анализу данные массового опроса россиян в проекте изучения стилей жизни с интервалом в 1 год.
5 Публикуется с согласия автора (ВЯ.)
Исходные данные фиксировали ценностные ориентации, поведенческие установки, образцы поведения, потребительские привычки, восприятия некоторых стандартов жизни.
Весь этот колоссальный по объему и взаимосочетаниям материал был подвергнут кластерному анализу — типологиэа-ции на осаове выявления устойчивых сочетаний множества признаков. Полученная типология поддается интерпретации в пространстве свойств двух векторов: "надежды — разочарования" и "амбиции — пассивность" (рис. 14).
Стили жизни ("со-циостили", как обозначил это автор) образовали следующие кластеры (сочетания свойств): "ретрограды" — характеризуются пассивным восприятием жизни, пессимизмом, разочарованием, ценностной дезориентацией, страхом перед будущим, социальной дезориентацией. Сильно выражены стремление к порядку и стабильности, патернализму, авторитарные тенденции при одновременном недоверии существующим социальным институтам. Преобладают материалистические, меркантильные ориентации, обусловленные в основном тяжелыми условиями жизни;
"победители" — также отличаются ценностной дезориентацией, разочарованием, отсутствием социальных надежд и иллюзий. Однако в отличие от "ретроградов" это группа активных амбициозных людей, ориентированных на достижение личного материального успеха без оглядки на общество, социальные ценности и идеологии. Сильно выражены индивидуализм, стремление к личной свободе, неверие в социальные институты. Эта группа ориентирована на быстрое достижение материальных благ без долгосрочной социальной перспективы;
"традиционалисты" — как и "ретрограды", характеризуются пассивным отношением к жизни, отсутствием амбиций, скептическим отношением к модернизации общества и социальным новациям. В то же время "традиционалисты" в отличие от "ретроградов" обладают твердой системой традиционных ценностей, верят в общество, социальные институты, глубоко моральны. Этот ценностный потенциал позволяет им более уверенно чувствовать себя в жизни, с большим оптимизмом смотреть в будущее;
"новаторы" — как и "традиционалисты", обладают устойчивой системой ценностей, однако это скорее ценности завтрашнего дня, мораль XXI века. Они открыты ко всему новому, верят в общественный прогресс и в общество. "Новаторы" активны, как и "победители", стремятся к успеху, однако в отличие от последних их амбиции не имеют столь эгоцентричного, циничного характера. Моральные ценности преобладают над материальными, социальные надежды и оптимизм — над разочарованиями;
"истэблишмент" — представляют собой группу людей, в наибольшей степени разделяющих ценности либерального общества, сочетание индивидуальных свобод и социальной ответственности. Стремление к благополучию, которого они в основном достигли, сочетается с высокими социальными целями и долгосрочной социальной перспективой. По своему образу действия они могут быть как более активны, так и пассивны. Разделяют современные ценности, не отрываясь от традиционных. Отличаются высокой толерантностью, стремлением к гуманистическим идеалам. "Истэблишмент" можно обозначить как наиболее адаптированный к данным социальным условиям тип.
Результаты исследования 1997 г. свидетельствуют о том, что по многим показателям кризис системы ценностей и поляризация общества продолжают углубляться.
По сравнению с 1996 г., еще больше снизилась доля групп населения, находящихся в поле социальных надежд (с 18% в 1996 г. до 12% в 1997 г.), и выросла доля тех, кто находится в поле социальных разочарований (с 81% в 1996 г. до 87% в 1997 г.).
Пропорция социально уверенных сократилась: "традиционалистов" — с 8% в 1996 г. до 5% в 1997г., "новаторов" — с 8% до 6% и тип "истэблишмент" с 2% до 1%.
Российское общество поляризуется на активных "беспринципных" "победителей" 28% в 1996 г. и 30% — в 1997 г. и пассивных потерянных "ретроградов" 53% и 57%.
Сопоставление этого анализа с общеевропейским обследованием по той же методике показало, что средневзвешенные данные по странам Центральной и Восточной Европы свидетельствуют о противоположной тенденции: там на 3% сократилась доля социально разочарованных и соответственно выросла — социально уверенных.
Автор заключает: тенденция социально-ценностной дезориентации, разочарований, социального нигилизма и аномии продолжает усиливаться. При этом растет социально-ментальная база как активных сторонников "нецивилизованного капитализма" ("победители"), так и пассивных сторонников возврата к неким потерянным корням, которые, однако, четко не идентифицируются ("ретрограды").
В исследованиях последних лет Г. А. Сатаров успешно использовал разработанную им технику многомерной эмпирической классификации (кластерный анализ) для изучения расстановки политических сил в Верховном Совете, а позже — Государственной Думе России. На базе информации поименного голосования по принципиальным вопросам может быть представлена типологическая структура политических позиций депутатского корпуса, конфигурации депутатских групп, позволяющая прогнозировать их действия в парламенте [236].