Методика и техника проведения прикладного социологического исследования утверждено Редакционно-издательским советом университета в качестве учебно-методического пособия

Вид материалаДокументы
Таблица 3.4 Взаимосвязь различных причин пропуска занятий и
Тема 5. Интервальная и пропорциональная шкала: способы измерения и анализа.
Таблица 3.5 Посещаемость занятий студентами двух групп
Таблица 3.6 Параметры для вычисления дисперсии
Таблица 3.7 Оценка студентами своей успеваемости по результатам двух последних сессий
Таблица 3.8 Рабочая таблица расчета средней успеваемости
Раздел 4. ВЫЯВЛЕНИЕ СВЯЗЕЙ МЕЖДУ
Таблица 4.1 Динамика изменения успеваемости по факультетам
Таблица 4.2 Причины, мешающие повышению успеваемости
Таблица 4.2а Причины, мешающие повышению успеваемости
Подобный материал:
1   2   3   4   5   6   7
Тема 4. Способы измерения и анализа распределений ранговой шкалы


С помощью ранговой шкалы измеримо большинство признаков и свойств социальных явлений, так как для них трудно найти объективные индикаторы. Поэтому измерение в социологии основано большей частью на субъективных индикаторах, выражающих отношение респондентов к кому-либо, чему-либо. В принципе, та же одномерная статистика, что используется для суммирования данных номинального уровня, может быть применена и для данных рангового уровня. Данные рангового уровня измерений включают в себя категории наблюдения, которые размещены по порядку (от большего значения какого-то признака к меньшему его значению или, наоборот — от меньшего к большему). Таким образом, существуют некоторые дополнительные допустимые методы описательной статистики, дающие нам информацию о характере упорядоченности измерений. Так, в дополнение к определению моды для выявления центральной тенденции в распределении значений переменной, измеренной по ранговой шкале, может быть выявлена медиана. Медиана — это категория или значение в распределении значений, лежащих выше и ниже того уровня, на который приходится половина всех частот. Иными словами, это категория (значение переменной), к которой принадлежит серединное наблюдение.

Можно посмотреть, как определяется медиана, на примере распределений ответов на вопрос о том, какова степень проявления инициативы в учебном процессе среди групп студентов, пропускающих занятия по разным причинам (табл. 3.4).

Таблица 3.4

Взаимосвязь различных причин пропуска занятий и

проявления инициативы в учебном процессе

Причины пропуска занятий

Проявляете ли вы инициативу в учебном процессе?

Всего

Всегда (3)

Иногда (2)

Никогда (1)

Пропускаю только по уважительным причинам

72

14

3

89

Пропускаю по собственной недисциплинированности

65

16

8

89

Пропускаю, если нет учета посещаемости

11

25

4

40

Пропускаю, если занятия проходят скучно

12

25

28

65

Итого

160

80

43

283


Здесь значения переменных — частоты причин пропуска занятий — соотнесены с ранговой шкалой степени инициативности студентов, значения которой меняются от категории «всегда» (которой присвоен ранг 3) до «никогда» (ранг 1). Учитывая, что общее число опрошенных (или число наблюдений) равно 283, то половина наблюдений составит 141. Это означает, что медиана для такой причины пропуска занятий как скука приходится на категорию с рангом 1 (никогда); для пропускающих по уважительным причинам и по собственной недисциплинированности — на категорию с рангом 3 (всегда); для тех, кто пользуется отсутствием контроля за посещаемостью — медиана приходится на категорию 2 (иногда).

Отметим, что при использовании для измерений порядкового уровня (от большего к меньшему или наоборот) методы описательной статистики более информативны, нежели для измерений номинального уровня. Для измерений порядкового уровня центральную тенденцию частотного распределения можно оценить как с помощью моды, так и с помощью медианы, а для измерений номинального уровня подходит только мода. Для измерений порядкового уровня разброс частотного распределения можно выявить с помощью дисперсии и среднеквадратического отклонения, тогда как для измерений номинального уровня разброс можно только «ощутить», просматривая все категории. Такова одна из причин, по которым измерения высокого уровня часто оказываются предпочтительнее по сравнению с измерениями более низкого уровня.


Тема 5. Интервальная и пропорциональная шкала: способы измерения и анализа.


Измерения интервального и пропорционального уровня редко анализируются с помощью прямого указания частот или процентных отношений. В отличие от номинальных или ранговых измерений, значения переменных, измеряемых с помощью интервальных шкал, изменяются непрерывно, они представляют собой численные величины, а не сами по себе категории, поэтому может реально существовать такое большое число различных наблюдаемых значений, что частоты и процентные отношения не в состоянии эффективно просуммировать данные. В самом деле, при измерении такой переменной как возраст, мы можем получить набор значений, ни одно из которых не будет повторять другого (если в нашем выборочном массиве не окажется какого-то количества респондентов, чьи даты рождения совпадают день в день). При измерении доходов также трудно рассчитывать, что суммы доходов различных респондентов или их семей будут совпадать до рублей и копеек. По этой причине значения таких переменных и размещают в тех или иных интервалах, размеры которых определяются исследовательским замыслом.

Критериями центральной тенденции для интервального и пропорционального уровней измерений выступают мода, медиана и среднее арифметическое. Среднее арифметическое представляет собой сумму значений переменной, поделенную на число значений. Общая формула для ее вычисления алгебраически выглядит следующим образом:

Х= ∑Хi / N = (Х1 +Х2 + …Хi)/ N: (3.1)

где Хi – числовое значение i-й позиции,

N – Общее число наблюдений (объем выборки).

Это так называемая простая средняя арифметическая. Она вычисляется в том случае, когда группировка осуществляется по признаку, не имеющему собственных вариаций.

Рассмотрим вычисление средней арифметической величины на примере расчета средней посещаемости занятий в двух студенческих группах по данным проверок. Данные о посещаемости изложены в таблице 3.5. Сложив числа в правых колонках и разделив их на 4 (число проверок), мы получим, что средняя посещаемость занятий в группах составила:

Таблица 3.5

Посещаемость занятий студентами двух групп

Номер занятия

Число присутствующих

Группа «А» (N=20)

Группа «Б» (N=30)

1

18

15

2

20

23

3

20

10

4

18

28


в группе «А» Х =19, в группе «Б» Х =19. Понятно, что полученное число – 19 студентов – не может иметь реального физического смысла, оно пригодно лишь для сравнения между собой уровня посещаемости студентов двух и более групп. Однако, как видим, среднее может оказаться обманчивым показателем центральной тенденции, если в объеме выборочной совокупности среди значений интересующей нас переменной появится какая-то экстремальная величина. Другими словами, недостаток средней арифметической как характеристики опрашиваемых по некоторому признаку заключается в том, что она может скрывать за собой различную степень «разброса» значений, и тем самым затруднять качественное сравнение различных групп по данным характеристикам. Данные таблицы 3.4 свидетельствуют, что, несмотря на одинаковые значения средней, в группе «Б» этот показатель подчинен воздействию неких специфических факторов. В подобных случаях, чтобы измерить степень равномерности или неравномерности распределения интересующей исследователя характеристики опрашиваемых, используется формула вычисления степени разброса значений признака, называемого дисперсией и обозначаемого (сигма квадрат):


σ 2 = Ni ×( XiX)2 ;

N (3.2)

где N – общее число респондентов;

Ni – число респондентов, выделенных по i-й позиции;

Хi – числовое значение i-й позиции

Х – средняя арифметическая.

Значение дисперсии легче вычислять, предварительно представив отдельные элементы и их расчеты в таблице 3.6.


Таблица 3.6

Параметры для вычисления дисперсии

Посещаемость в группе «А»

Отклонение от средней

Квадратичное отклонение

Посещаемость в группе «Б»

Отклонение от средней

Квадратичное отклонение

18

18 – 19 = -1

1

15

15 - 19 = -4

16

20

20 - 19 =+1

1

23

23 – 19 =+4

16

20

20 – 19 =+1

1

10

10 – 19 = -9

81

18

18 – 19 = -1

1

28

28 – 19 =+9

81


Вычисляем дисперсию для обеих групп:

σ2 = (18х1 +20х1 +20х1 +18х) / (18+20+20+18) = 1 для группы «А»

σ2 = (15х16 +23х16 +10х81 +28х81) /(15+23+10+28) =48,5 для группы «Б»

Большему значению дисперсии соответствует больший разброс признака (в нашем случае – неравномерность посещения занятий). Таким образом, для вычисления дисперсии и среднеквадратического отклонения надо последовательно пройти семь шагов:

1) вычислить среднее;

2) вычислить разности между средним и каждым значением;

3) возвести в квадрат разности, вычисленные на этапе 2;

4) умножить квадраты разностей на частоты наблюдений каждого из значений;

5) просуммировать квадраты разностей, вычисленные на 4 этапе;

6) разделить сумму квадратов на N;

7) извлечь квадратный корень из числа, вычисленного на этапе 6.

Это будет среднеквадратичное отклонение. В том случае, если значения переменных измеряются не однозначно определенными числами (как в предыдущем примере), а изменяются вдоль непрерывного ряда значений, вместо средней арифметической рассчитывается средневзвешенная. Так, предположим, что нам требуется вычислить средний балл успеваемости респондентов, и распределение по баллам оказалось таким, как в таблице 3.7.

Таблица 3.7

Оценка студентами своей успеваемости по

результатам двух последних сессий

Успеваемость (баллы)

Частота

Процент

До 3,5

53

18,7

3,5 – 4

100

35,3

4 – 4,5

56

19,8

4,5 – 5

74

26,2

Всего

283

100,0


Вначале мы должны определить середину каждого интервала. Это делается путем вычисления простого среднего, то есть сумма крайних значений делится пополам. Затем необходимо умножить это значение на число респондентов, выбравших данный интервал успеваемости, сложить полученные произведения и разделить на общий объем выборки. Различные этапы этого процесса отражены в таблице 3.8.

Таблица 3.8

Рабочая таблица расчета средней успеваемости

Успеваемость (баллы)

Частота

Середина интервала

Произведение

До 3,5

53

3,25

172,25

3,5 – 4

100

3,75

375

4 – 4,5

56

4,25

238

4,5 – 5

74

4,75

351,5

Всего

283

4,02

1136,75


Разделив полученную сумму на 283 (общее число опрошенных), мы получим средний балл успеваемости в 4,02. Таким образом, формула для средневзвешенного выглядит также, как и формула для вычисления простой среднеарифметической, однако Хi в ней относится к середине интервала.

Итак, средняя арифметическая и средневзвешенная дают нам возможность увидеть центральное распределение признака в исследуемой совокупности. Что касается дисперсии, то напомним, что дисперсия означает дословно «разбрасывание, рассеяние». В данном случае – это рассеяние реально полученных данных вокруг среднего значения. В зависимости от того, насколько велика (или мала) дисперсия, либо вычисленное с помощью ее среднеквадратичное отклонение, мы можем судить, насколько единодушны были респонденты в своих оценках (при меньшем значении дисперсии), или наоборот – насколько сильно они расходятся в своих мнениях (при большем значении дисперсии).


Раздел 4. ВЫЯВЛЕНИЕ СВЯЗЕЙ МЕЖДУ

ПЕРЕМЕННЫМИ


Тема 1. Табличное представление данных


Таблицы и графики в аналитическом отчете служат не просто иллюстративными материалами, а содержат в себе саму суть, ядро полученной в ходе исследования информации, так как без них просто невозможно выразить в чисто словесной форме выводы исследования. В этом параграфе речь пойдет как о технике составления и обработки, редактирования таблиц и, так и о некоторых областях их применения.

Все группировки значений различных переменных, предусмотренные программой исследования, ложатся в основу статистических таблиц, которые обобщают обработанную первичную социологическую информацию. Таблица — это перечень сведений, обычно числовых данных, приведенных в определенную систему и разнесенных по графам — строкам и столбцам. Строго говоря, процедура составления таблиц не представляет собою какой-то особой математической операции. Это скорее определенная форма отображения рядов распределений, полученных в результате расчетов. Основное преимущество этой формы заключается в том, что в ней кратко и емко даются пояснения значений соответствующих группировок. Хорошо сконструированная таблица позволяет более четко представить, описать и объяснить смысл и сущность изучаемого социального явления.

Построение таблицы производится по определенным правилам. Любая социологическая статистическая таблица описывается с помощью следующих параметров.

Заголовок — название таблицы, которое раскрывает структуру группировки описываемых переменных, либо характер связи (зависимости) между двумя и более переменными. Наряду с этим в названии (или чаще в подзаголовке) иногда указываются общие для всех переменных единицы измерения (число ответов, проценты, средний балл и т. д.).

Подлежащее — то, что подлежит описанию, то есть указание переменной, подвергаемой анализу, и тех конкретных значений, которые она может принимать.

Сказуемое — само описание, то есть числовые значения, разнесенные по графам — ячейкам или клеткам таблицы.

Таблицы бывают простые (линейные), групповые и комбинационные.

Простые таблицы представляют собою простой перечень (список) отдельных значений той или иной переменной с количественной или качественной характеристикой каждой из них в отдельности. Поэтому иногда их называют также перечневыми. Примером простой таблицы могут служить одномерные распределения опрашиваемой совокупности по полу респондентов, по их возрасту или курсу обучения (см. напр. табл. 3.2).

Что касается групповых таблиц, то они обычно содержат группировку единиц совокупности по одному признаку, а комбинационные — по двум и более признакам. Такие таблицы являют собою нечто большее, нежели простой перечень данных. Это одновременно и способ, и вместе с тем результат определенной систематизации данных. В комбинационных таблицах, чтобы избежать излишнего нагромождения данных, затрудняющего их восприятие, иногда опускают абсолютные величины (частоты) тех или иных значений переменных, оставляя лишь пропорции или проценты. Примером комбинационной разработки статистической таблицы может служить, например, таблица 4.1.


Таблица 4.1

Динамика изменения успеваемости по факультетам.

(в % к числу опрошенных)

Средний балл

ФАИТ

ХТФ

Всего по выборке

Средний балл аттестата

Средний балл на момент исследования

Изменения

+/-

Средний балл аттестата

Средний балл на момент исследования

Изменения +/-

Средний балл аттестата

Средний балл на момент исследования.

Изменения +/-

До 3,5

5,0

22,0

+17,0

2,8

13,9

+11,1

4,2

18,9

+14,7

3,5-4

28,0

37,3

+9,3

13,9

45,8

+31,9

22,6

40,5

+17,9

4-4,5

33,0

17,8

-15,2

44,4

18,0

-26,4

37,4

17,9

-19,5

4,5-5

34,0

22,9

-11,1

38,9

22,3

-16,6

35,8

22,7

-13,1

Итого

100,0

100,0

-

100,0

100,0

-

100,0

100,0

-


Такая таблица являет собою уже нечто большее, нежели простой перечень данных. Она, с одной стороны, является как способом, так и результатом определенной организации, систематизации данных, а с другой — может стать удобным инструментом для анализа связей между сразу тремя переменными — факультетом, уровнем довузовской подготовки и успеваемостью на момент исследования. Хорошо сконструированная таблица позволяет исследователю более четко представить и описать смысл и сущность изучаемого им социального явления.

Прежде чем перейти к методическим рекомендациям по созданию и редактированию таблиц, следует отметить некоторые важные моменты, связанные с их конструированием. Прежде всего, следует отметить, что наиболее рациональным было бы продумать конструкцию таблиц еще на стадии разработки методического раздела программы социологического исследования, а именно той его части, которая называется «Логическая схема обработки и анализа данных». В этой части фактически и задается конструкция и формат таблиц. Обычно не возникает особых сложностей с конструкцией таблиц простых (линейных) распределений. Что же касается комбинационных таблиц, то здесь необходимо учитывать некоторые методические рекомендации, исходя из практического опыта проведения исследований.

Большинство комбинационных таблиц при расчетах формируется в ходе операции, именуемой кросстабуляция. Получаемые в результате кросстабы должны быть, как и любые другие таблицы, наглядны, обозримы и, по возможности, размещаться в пределах одной страницы. Поэтому первая рекомендация состоит в следующем. Поскольку ориентация текста на странице в абсолютном большинстве случаев бывает «книжная», а не «альбомная» (то есть страница больше по высоте, чем по ширине), нужно обращать внимание на соотношение числа значений (вариантов) тех переменных, связь между которыми будет отражена в кросстабе. При этом целесообразно руководствоваться простым правилом: ту переменную, которая имеет больше возможных значений, лучше размещать по строкам, а ту, у которой значений меньше,— по столбцам.

Вообще характер размещения переменных по строкам или по столбцам особо принципиального значения не имеет, однако такой вариант предпочтительнее в силу своей компактности и лучшей обозримости. Хотя, конечно, во многом здесь дело вкуса, и преимущества предлагаемого варианта становятся более очевидны, когда одна из переменных имеет достаточно большое число возможных значений. Однако для дальнейшего анализа необходимо принять во внимание еще одно правило: внимательно отслеживайте, где вы размещаете независимую переменную — по строкам или по столбцам, и, соответственно этому, при обработке массива данных задавайте команду на расчет процентов в кросстабе.

Аналогично производится составление и редактирование таблиц в тех случаях, когда мы производим расчет не в процентах, а в средних значениях баллов тех или иных оценок.

Иногда в аналитических целях возникает необходимость ранжировать полученные частоты и проценты с тем, чтобы сразу расставить приоритеты. Так, в нашем исследовании респондентам был задан вопрос относительно их оценки причин, мешающих повышению успеваемости. Этот вопрос был представлен в анкете в виде веера ответов и выглядел довольно хаотичным, чтобы подчеркнуть ценностный нейтралитет авторов анкеты, кодировка же — с 18 по 24 - просто определяет их порядок.

В данном случае необходимо заготовить шаблон пустой таблицы и последовательно, раз за разом, перенести в ее ячейки все полученные значения. Теперь отразим полученную в результате расчетов таблицу, в которой расставим процент ответов, полученный каждым из этих значений в ходе опроса; при этом мы пока сохраняем тот порядок следования, который был принят в анкете (см. табл. 4.2).

Таблица 4.2

Причины, мешающие повышению успеваемости

(в % к числу ответов)

Что вам мешает учиться лучше?

В целом по выборке

18. Нет особого интереса в получении знаний

13,1

19. Многие предметы считаю бесполезными для будущей профессии

24,0

20. Недостаточная довузовская подготовка

9,4

21. Плохие бытовые условия для занятий

7,2

22. Трудно заставить себя заниматься

29,3

23. Неважная организация учебного процесса

7,8

24. Разочарование в профессии, которую получаю

9,2

ИТОГО

100,0


В этой таблице мы выделили полужирным шрифтом модальное значение переменной — так оно сразу бросается в глаза. Однако для удобства более детального анализа можно применить и другой прием – проранжировать данные в таблице, то есть разместить их в порядке убывания от самого частого – того значения переменной, которое получило наибольшее число ответов, до наименее частого — того, которое получило наименьшее число голосов. В результате мы получим несколько иную таблицу (см. табл. 4.2а), из данных которой мы сразу сможем сделать вывод о том, как оценивают опрошенные причины, мешающие повышению успеваемости. Здесь уже нет необходимости выделять модальные или, наоборот, самые низкие значения переменных — они окажутся на самом верху или в самом низу.

Из данных этой таблицы уже совсем не представляет труда рассмотреть, какие причины являются наиболее существенными и оказывают значимое влияние на успеваемость студентов. Отсюда видно, что иногда составление и редактирование таблиц нельзя назвать чисто механической операцией. Такая процедура может значительно облегчить анализ полученных данных.

Таблица 4.2а

Причины, мешающие повышению успеваемости

(в % к числу ответивших)

Что вам мешает учиться лучше?

В целом по выборке

18. Трудно заставить себя заниматься

29,3

19. Многие предметы считаю бесполезными для будущей профессии

24,0

20. Нет особого интереса в получении знаний

13,1

21. Недостаточная довузовская подготовка

9,4

22. Разочарование в профессии, которую получаю

9,2

23. Неважная организация учебного процесса

7,8

24. Плохие бытовые условия для занятий

7,2

ИТОГО

100,0