Методика и техника проведения прикладного социологического исследования утверждено Редакционно-издательским советом университета в качестве учебно-методического пособия

Вид материала

Раздел 3. ОСНОВЫ АНАЛИЗА ОДНОМЕРНЫХ РАСПРЕДЕЛЕНИЙ В СОЦИОЛОГИИ
Независимо от способа обработки информации (вручную или на компьютере), весьма полезным перед началом анализа является составлен
12.Почему вы поступили именно на эту специальность?
14. Вы работаете? Если да, то где?
19.Проявляете ли вы инициативу в процессе обучения в вузе, если существует возможность повышения оценки?
Таблица 3.1 Словарь переменных для исследования учебно-познавательной активности (
Тема 2. Типы шкал и правила их построения
Тема 3. Номинальная шкала: способы измерения и анализа
Таблица 3.2 Распределение опрошенных по курсам обучения
Таблица 3.3 Досуговые практики студентов

Подобный материал:

1 2 3 4 5 6 7

Тема 2. Логическая схема обработки и анализа информации

Еще до начала полевого этапа вы должны представлять, в каком виде, и в каких сочетаниях варьируюших признаков вы можете получить подтверждение ваших гипотез. Иными словами, вы должны заранее предусмотреть необходимые связи признаков, чтобы при обработке массива информации получить перекрестные (двумерные или трехмерные) таблицы. Кроме того, неплохо предусмотреть и возможности индексации некоторых признаков, что сделает информацию более компактной и наглядной. Осуществлению этой задачи служит логическая схема обработки и анализа информации, которая представляет собой краткое описание алгоритма действий исследователя в процессе математической и логической обработки полученной базы данных. Это своего рода маршрут продвижения исследователя к конечной цели исследования – формулированию выводов и рекомендаций. Каким бы образом вы не обрабатывали информацию – вручную, самостоятельно, или на компьютере, с помощью программы SPSS, без этой логической схемы вам не обойтись. Составить блок-схему расчетов, а затем табулировать полученные результаты, то есть перевести расчетные данные в табличные данные, можно лишь в том случае, когда имеешь перед глазами опросный лист (анкету, бланк формализованного интервью), где каждый из пронумерованных вопросов и представляет собой отдельную переменную.

Рассмотрим на конкретном примере вариант логической схемы анализа и обработки информации (макет анкеты исследования «Учебно-познавательная активность студентов» см. в Приложении). В том случае, если обработка информации осуществляется самостоятельно, без применения программного продукта, ваша схема может выглядеть примерно так:

для вопросов №27,29 разработать интервальную шкалу для более эффективной обработки информации;
вопросы № 9,12,21,27- 31 нуждаются в предварительной смысловой обработке открытой части вопросов;
Простые распределения ответов на все вопросы анкеты;
Связи (перекрестные таблицы) для подтверждения гипотез:

Гипотеза1- 12х10,12х16,12х19,12х20,12х21,12х22,12х24,12х26,31х10,31х18.

Гипотеза2- – 24х16,24х17,24х18,24х19,24х20,24х21,24х22.

Гипотеза 3 – (28 + 29) х7,8,16,17,18,19,20,21,24,26.

Гипотеза5– 5х16,15х17,15х18,15х19,15х20,15х21,15х24,15х26,15х30,15х31.

Гипотеза6- 14х16,14х17,14х18,14х19,14х20,14х21,14х24,14х26,14х31.

Индексирование признаков: 10х7х8; 19х7х8; 24х7х8; 26х7х8.

Тема 3. Предварительная обработка массива информации

Предварительная обработка социологической информации заключается в подготовке анкет к обсчету. Этот этап предусматривает проверку социологического инструментария на точность, полноту и качество заполнения. Проверка на точность направлена на выявление так называемых «добросовестных ошибок». Предположим, на вопрос: «Занимаетесь ли вы научной деятельностью?» респондент ответил «нет». А следующий вопрос: «Есть ли у вас научные публикации?» остался без ответа. В этом случае у нас имеются достаточные основания в этом вопросе отметить позицию «нет». В более сложных случаях, когда противоречие в ответах на два и более вопроса, неразрешимо, эти вопросы исключаются из обработки. Проверка на полноту заполнения означает выбраковку (то есть исключение из массива информации) тех анкет, в которых отсутствуют ответы более чем на 30% основных вопросов, так как их просто нельзя считать информативными. Безусловной выбраковке подлежат те анкеты, в которых остались без ответа вопросы паспортички (социально-демографического блока). Если же в анкете отсутствуют отметки по предлагаемым вариантам ответов на отдельные вопросы, следует отметить позицию «нет ответа». Проверка на качество заполнения предполагает внимательный просмотр на предмет ясности и четкости отметок. Нередко случается так, что, несмотря на подстрочное инструктивное указание в вопросе – выбрать один, два или три варианта ответа, респондент обводит на несколько позиций больше. Коррекция ответа в таких случаях затруднена. Однако на практике обычно сохраняют первые обведенные позиции, зачеркивая остальные.

Особую процедуру представляет собой предварительная работа с анкетами, содержащими открытые вопросы. Ответы на такие вопросы респонденты дают на языке собственных мыслей, в произвольной форме, с использованием собственной, привычной для них лексики. Например, в нашем исследовании при выборе суждения о ценности высшего образования (вопрос №31), респондент выбрал позицию «другое» и написал: «Высшее образование у нас не айс». Разумеется, статистическая обработка их в первозданном виде невозможна в принципе. Основное неудобство открытых вопросов как раз и состоит в необходимости предварительной формализации для перевода в числовую форму. Чаще всего исследователь осуществляет подготовку этой формализации уже на предварительном этапе, на стадии разработки инструментария. При этом предусматриваются более или менее однородные группы, в которые могли бы объединяться смысловые содержания различных вариантов ответов на открытые вопросы независимо от способов их словесного выражения. Каждой из таких групп присваивается код, и вопрос об отнесении данного конкретного ответа решается исследователем на этапе обработки информации к предусмотренным кодам, несмотря на всю оригинальность ответа. Однако иногда бывают ситуации, когда ответы на открытые вопросы подвергают дополнительному изучению способами традиционного интуитивного анализа документов.

Раздел 3. ОСНОВЫ АНАЛИЗА ОДНОМЕРНЫХ РАСПРЕДЕЛЕНИЙ В СОЦИОЛОГИИ

Тема 1. Общие принципы анализа

Когда полевой этап социологического исследования закончен и в ходе опроса собрано много информации, это еще не означает, что социологическое исследование уже завершено. Теперь предстоит еще три важных этапа – обработка полученных данных, их анализ и составление итогового отчета. Необходимо помнить, что данные, представленные в отчете, должны выглядеть четко, сжато и наглядно. Подумать об этом следует заранее, еще при разработке методического раздела программы исследования, возможно, следует заранее составить макеты таблиц с указанием расположения переменных по строкам и столбцам. Это во многом упростит процедуру обработки информации, сделает ее более четкой и компактной. Можно предусмотреть также возможные варианты графической интерпретации результатов исследования.

Анализ собранной информации – это своеобразный итог вашей работы, момент подтверждения или опровержения ваших предположений о том, или ином социальном явлении. Мы знаем, что достаточно глубокое изучение интересующих социолога закономерностей невозможно без опоры на анализ конкретных фактов, в которых эти закономерности и проявляются. Основой любых теоретических построений является эмпирический материал, эмпирические факты. Любой исследователь знает, что эмпирический материал предстает перед ним в виде совокупности чисел, описывающих те или иные объекты (в качестве таких совокупностей могут выступать, например, возраст респондентов, успеваемость и т.д.), каких-либо индикаторов отношений между объектами (к примеру, при изучении студенческой группы такими индикаторами могут быть указания каждого члена группы на то, нравится ли ему учиться с любым другим членом группы), совокупности высказываний (например, ответы на вопрос о выборе профессии, либо о степени удовлетворенности выбором вуза). И прежде чем говорить о том, как на основе такого рода информации можно приходить к определенным теоретическим выводам, необходимо вдуматься в ее смысл, в то, что она отражает. Дело в том, что, в информации подобного рода присутствуют как бы два уровня: 1)совокупность реальных объектов (студенческих групп, семей, респондентов) во всей их уникальности и неповторимости, и, 2)получаемая в результате сбора данных, совокупность чисел, отражающих эти объекты. Поэтому, рассматривая второй уровень (работа с числами), необходимо все время помнить о первом уровне, только так анализ данных может быть действительно эффективным. Как правило, характер и способ сбора данных во многом определяется видением проблемы социологом, исследователем. Например, в нашем исследовании мы задавали респонденту вопрос об удовлетворенности выбранной специальностью и предлагали пять вариантов ответа от «совершенно не удовлетворен» до «полностью удовлетворен» (что обычно кодируется цифрами от 1 до 5). При этом предполагалось, что респондент действительно является «носителем» такой удовлетворенности и что он в состоянии выбрать ответ, адекватный его жизненной ситуации. В действительности же это положение не всегда является очевидным: так, вместо «общей» удовлетворенности у респондента может быть несколько «частных», не всегда сводимых к общей удовлетворенности. Например, он удовлетворен тем, что учится именно в этой группе, удовлетворен тем, что получает профессию, которая позволит ему получать большую зарплату и т.д. Все вышеизложенное еще раз напоминает о том, что использование математических методов в социологии по настоящему эффективно лишь при условии многомерного видения объекта социологического анализа.

Анализ данных позволяет за специфичностью и неповторимостью каждого респондента увидеть некоторые общие закономерности, уловить тенденции. В обществе действуют некоторые закономерности (назовем их содержательными), на изучение которых и направлены все действия социолога. Судить об этих закономерностях он может лишь на основе имеющихся в его распоряжении данных, которые, собственно говоря, для этого и собираются. Данные служат для социолога как бы набором фактов, характер которых объясняется именно действием упомянутых закономерностей. Однако в анализе они выступают в виде закономерностей другого рода – формальных. Таким образом, интересуют нас закономерности содержательные, но ищем мы в процессе анализа – формальные. Отсюда следует, что анализ по существу всегда является способом некоего усреднения, сжатия той информации, которая заключена в исходных данных. Основная цель такого усреднения – выявление или подтверждение каких-то интересующих исследователя закономерностей. Однако эта цель может достигаться не сразу, а в несколько этапов, что должно учитываться в процессе анализа. Поэтому, наряду с указанной основной целью анализа представляется целесообразным иметь ввиду еще две цели: описание исходных данных (цель, достичь которую часто бывает необходимо прежде, чем приступать к поиску закономерностей) и осуществляемое на основе выявленной закономерности предсказание того или иного явления. Описание исходных данных связано обычно с применением методов математической статистики.

Независимо от способа обработки информации (вручную или на компьютере), весьма полезным перед началом анализа является составление словаря переменных. Это таблица, в которой сведены переменные данного исследования с указанием всех возможных значений, которые может принимать каждая из них. Кроме того, с соответствующими кодами, обозначенными в анкете, а также номерами тех позиций, которые занимает данная переменная в матрице базы данных. Рассмотрим фрагмент словаря переменных на примере нашего исследования. Возьмем из анкеты три вопроса: №12, №14, №19.

12.Почему вы поступили именно на эту специальность? (можно указать 2 основных мотива)

1- просто хотелось получить высшее образование;

2- нравилась эта область знаний;

3- хотелось получить соответствующую профессию;

4- эта специальность престижна;

5- устраивали предметы на вступительных экзаменах;

6- по совету друзей, родителей, знакомых;

7- убедился в правильности выбора на курсах при СамГТУ;

8- был меньше конкурс, чем на других факультетах и в других вузах;

9- затрудняюсь ответить.

14. Вы работаете? Если да, то где?

1- работаю на кафедре по специальности;

2- работаю в организации, связанной с будущей профессией;

3- работаю в организации, не связанной с будущей профессией;

4- не работаю

19.Проявляете ли вы инициативу в процессе обучения в вузе, если существует возможность повышения оценки?

1- всегда;

2- иногда, когда ситуация с оценкой совсем «плачевная»;

3- никогда, даже возможность повышения оценки не заставит меня проявить инициативу;

4- затрудняюсь ответить.

Таблица 3.1

Словарь переменных для исследования

учебно-познавательной активности (фрагмент)

п о з и ц и и	Переменная	Варианты значений	№ переменной (для программы SPSS)
1 2	Мотивация выбора профиля образования	0-нет ответа 1-ориентация на высшее образование 2-ориентация на область знания 3-ориентация на профессию 4-ориентация на престижность профессии 5-ориентация на предметную область знания 6-ориентация на советы окружающих 7-ориентация на предварительное знакомство с профессией 8-ориентация на легкость поступления 9-затрудняюсь ответить	Var00012
4	Трудовая занятость студента	0-нет ответа 1-работа по специальности на кафедре 2-работа по специальности в организации 3-работа не по специальности в организации 4-не работает	Var00014
9	Инициативность в учебном процессе	0-нет ответа 1-всегда 2-иногда 3-никогда 4-затрудняюсь ответить	Var00019

Итак, мы уже говорили о том, что сущность процесса первичной обработки информации состоит в ее обобщении, упорядочивании и уплотнении. Этот процесс осуществляется с помощью статистической группировки. Метод группировки заключается в том, что обследуемая совокупность расчленяется на однородные группы, отдельные единицы которых обладают общим для всех них признаком. Группировки по количественным и по качественным признакам имеют свои специфические особенности. В случае количественных признаков (возраст, стаж, доход) группировка состоит в разбиении всего диапазона изменения переменной на определенные интервалы с последующим подсчетом числа единиц, входящих в каждый из них. При группировке по качественным признакам должна быть предусмотрена возможность отнесения каждой единицы анализа к одной из выделенных градаций. Причем делать это необходимо однозначным образом, так, чтобы суммарное число единиц анализа, отнесенных ко всем градациям, было бы в точности равно общей численности изучаемой совокупности. Поэтому наряду с ответами «не знаю», «затрудняюсь ответить», в словаре переменных всегда предусматривается вариант «нет ответа» для тех анкет, где не отмечено ни одного варианта ответа, он кодируется обычно нулем.

Завершая характеристику общих принципов анализа социологической информации, важно еще раз подчеркнуть два момента. Во-первых, не следует увлекаться излишне сложными моделями анализа, так как это способно отвлечь от главной специфики объекта исследования в социологии – это все-таки люди. И, во-вторых, проводя анализ, всегда надо помнить о главной цели исследования, то есть о том, что мы хотим получить в итоге, на какие вопросы ищем ответ.

Тема 2. Типы шкал и правила их построения

Разумеется, главная цель эмпирических исследований состоит в том, чтобы проверить гипотезы об интересующих нас общественных явлениях или закономерностях поведения людей в той или иной ситуации. Однако перед тем как исследователь начинает проверять свои гипотезы, он обычно бросает общий взгляд на свои данные и пытается резюмировать или описать их по каждой из переменных. Для того чтобы сделать выводы из результатов произведенных измерений одной переменной, используется так называемая описательная статистика. Соответствующие такому анализу таблицы называют линейными или одномерными распределениями. Из курса математической статистики известны некоторые способы анализа одномерных распределений. Например, средний оценочный балл студенческой группы – это не что иное, как описательная статистика, которая описывает и суммирует экзаменационные ведомости как отражение курса оценок. Если мы вычертим график того, как меняется со временем коэффициент безработицы в г. Самаре, что позволит увидеть, возрастает он или падает, - это и будет представлять собой анализ одномерных данных, где в качестве предмета описательной статистики выступает коэффициент безработицы. Таким образом, описательная статистика – это не что иное, как способы математического суммирования многочисленных наблюдений в ясной и осмысленной форме.

Обычно для обобщенного описания того, что является наиболее характерным для наблюдаемых нами явлений, используют два основных типа способа анализа: 1- измерение центральной тенденции, то есть выявление того, какие из значений переменных встречаются в линейных распределениях наиболее часто, а значит, определяют общую или центральную закономерность; 2 – измерение разброса, или дисперсии, которое показывает насколько плотно или слабо распределяются все зафиксированные значения данной переменной вокруг среднего, или центрального значения. При обработке эмпирических данных мы должны принимать во внимание шкалу, с помощью которой производилось измерение той или иной переменной. Шкала – это алгоритм, по которому производится отображение изучаемых социальных объектов в ту или иную числовую математическую систему.

Шкалы различаются по степени своей сложности и по объему тех математических действий, которые можно производить с полученными в результате наблюдений значениями переменных. Известно, что в социологии чаще всего используются шкалы следующих типов (в порядке возрастания уровня измерения): номинальные, порядковые (ранговые), интервальные, пропорциональные. Обычно все использующиеся в социологии шкалы разбивают также на две группы: так называемые качественные и количественные. К качественным шкалам относятся номинальные и порядковые, к количественным – интервальные и пропорциональные. Основой такого деления служит то обстоятельство, что результаты измерений, отвечающие количественным шкалам, в большей мере похожи на действительные числа и поэтому представляются лучше отражающими то понимание количества, которое обычно связывают с измерением.

Существует ряд требований, предъявляемых к социологической шкале, которые повышают надежность измерительных процедур, а, следовательно, и качество получаемой социологической информации. Обоснованность шкалы (валидность) – это ее способность измерять именно необходимое социологу свойство, а не какое-либо другое. Устойчивость шкалы – способность давать при повторных измерениях близкие результаты. Точность шкалы – это ее достаточная чувствительность как оптимальная дробность, дающая устойчивое измерение без систематических погрешностей.

Тема 3. Номинальная шкала: способы измерения и анализа

С помощью номинальной шкалы мы измеряем такие переменные, которые в принципе не могут количественно отличаться друг от друга, то есть, только упорядочиваем измеряемое свойство. Другое название этого уровня измерений — шкала наименований, что довольно точно отражает его сущность: каждое значение здесь представляет собою отдельную категорию, и значение является просто своего рода ярлыком или именем. Значения присваиваются переменной безотносительно к упорядочиванию или установлению какой-то дистанции между категориями — во многом в том же смысле, в каком люди носят свои имена. Их невозможно сравнивать между собою по принципу «больше — меньше», «выше — ниже» и т. п. Так, если бы мы захотели рассчитывать средние значения переменных, измеренных по номинальной шкале, то это было бы пустой тратой времени, поскольку полученные значения были бы лишены всякого смысла. В самом деле, можно ли рассчитать среднее значение пола или рода занятий? В измерениях номинального уровня отсутствуют те свойства, какими обладают реальные числа, а значит, такие переменные невозможно складывать, вычитать, умножать и делить^.Поэтому данные, полученные по номинальной шкале, обычно резюмируются с помощью простого частотного распределения так, как это показано в табл. 3.2 и 3.3, где, в качестве примера представлены распределения респондентов по курсам обучения и

по роду их занятий на досуге.

Таблица 3.2

Распределение опрошенных по курсам обучения

Курс обучения	Частота	Проценты
1 курс	87	30,7
3 курс	93	32,9
4 курс	103	36,4
Всего	283	100,0

Мы видим, что в таблице, помимо указания частоты в абсолютных цифрах, приведены данные в процентах (что указывает на пропорцию, удельный вес каждого из значений определяемой переменной курса или вида досуга). Процентные доли в процессе анализа предпочтительнее распределений абсолютных цифр вследствие того, что они облегчают процесс сравнения двух популяций различных размеров.

Таблица 3.3

Досуговые практики студентов

Предпочитаемые занятия в свободное время	Частота	Процент
Спорт	52	18,4
Чтение книг	73	25,8
музыка	24	8,5
Интернет, компьютер	91	32,1
Танцы	18	6,4
Кино, телевидение	10	3,6
Другие виды	15	5,2
Всего	283	100,0

Поэтому нередко, особенно в достаточно больших по размерам таблицах, в целях экономии места показывают только проценты. Частотные распределения в абсолютном выражении допускаются, однако при этом желательно приводить общее число наблюдений и тем самым давать возможность читателю в случае необходимости вычислить долю соответствующего частотного распределения. Пропорции и проценты сообщают нам информацию, которая оказывается более убедительной, значимой и легко запоминаемой, нежели частотное распределение в абсолютных значениях частот. Преимущество становится особенно бесспорным при необходимости последовательного сравнения достаточно длинных рядов распределений.

Для данных номинального уровня измерение центральной тенденции производится с помощью определения моды. Модой, или модальной категорией, называется то значение переменной, которое встречается среди данных наиболее часто, то есть характерно для наибольшего количества респондентов в исследуемой социальной группе. В распределении, представленном в таблице 3.1, модальную категорию представляют собою студенты 4 курса обучения; в таблице 3.2 — это увлечение в свободное время компьютером и, в частности, Интернетом, таких студентов оказалось большинство среди респондентов.

Частотное распределение раскрывает не только центральную тенденцию, но и дисперсию данных. Дисперсия характеризует разброс значений переменной. Для данных номинального уровня наибольший уровень дисперсии проявляется, когда наблюдения распределены поровну между категориями. Поэтому можно считать, что данные табл. 3.2 весьма дисперсны, поскольку имеется приблизительно одинаковое число студентов разных курсов обучения. Полное отсутствие дисперсии проявляется в тех случаях, когда все наблюдаемые значения переменной совершенно однородны, т. е. попадают в одну и ту же категорию.

При проведении одномерного анализа могут обнаружиться такие характеристики данных, которые представляют собой существенные препятствия для дальнейшего анализа данных. Представьте, например, что вы намереваетесь изучить взаимосвязь между полом и родом занятий, и обнаружили, что в выборке опроса оказались одни лишь мужчины. Поскольку налицо отсутствие дисперсии (т. е. нет вариаций по одной из ключевых переменных—полу), каких-либо сравнений провести нельзя. Урок, который необходимо из этого усвоить, состоит в следующем: нет изменения — нет сравнения. А процедура сравнения являет собою, по своей сути, ядро анализа. При отсутствии изменений вы можете обнаружить какое-то интересное единообразие, но не сможете изучить связей между переменными, то есть выявить, что же происходит с одной из них, когда другая варьирует (изменяется). Самый простой одномерный анализ уже в ходе сбора данных (хотя бы беглый взгляд на частотное распределение) мог бы предостеречь вас от такой опасности.

При анализе рядов распределений, когда мы выявляем центральную тенденцию, следует сразу обращать внимание на максимальные и минимальные значения изучаемой переменной. Другими словами, когда вы имеете дело с переменной, принимающей целый ряд значений, анализ следует начинать с акцента на самом большом и самом маленьком значении — это сразу дает вам представление о масштабах изменения рассматриваемой переменной и о дисперсии.