Программа дисциплины Математико-статистические методы в социологии для подготовки бакалавров по направлению «Социология» (1 ступень высшего профессионального образования)

Вид материалаПрограмма дисциплины

Содержание


2 курс очной формы обучения
Утверждено Советом факультета
Требования к студентам, начинающим изучение дисциплины
Задачи обучения по дисциплине
Формы учебной работы
Тема 2. Нормальное распределение.
Тема 3 Выборочный метод.
Тема 4. Описательная статистика: оценка центральной тенденции и дисперсии данных.
Тема 5. Графическое представление данных.
Тема 6. Статистический вывод.
Тема 8 Перекодировка данных, селекция данных.
Тема 9. Двух- и трех мерные таблицы сопряженности.
Тема 10. Меры связи и ассоциации.
Тема 11 Причинный анализ и регрессии.
2 модели регрессии
2 модели регрессии
Тематический расчет часов
Vi. тематический план изучения дисциплины
Подобный материал:

Правительство Российской Федерации


Государственное образовательное бюджетное учреждение

высшего профессионального образования

«Государственный университет - Высшая школа экономики»


Санкт-Петербургский филиал Государственного университета – Высшей школы экономики


Факультет социологии


Кафедра методов и технологий социологических исследований

Программа дисциплины


Математико-статистические методы в социологии

для подготовки бакалавров по направлению «Социология»

(1 ступень высшего профессионального образования)

^ 2 курс очной формы обучения


Автор – к. псих. н., доцент А.В.Лисовский



Согласовано УМО

о

Одобрена

на заседании кафедры методов и технологий социологических исследований

«___» ______________ 2010 г.





зав. кафедрой _________А.А. Вейхер


«___» _ 2010 г.







^ Утверждено Советом факультета


Председатель ___________________


«___» _________ _____ 2010 г.


Санкт-Петербург

2010


i. ПоЯСНИТЕЛЬНАЯ ЗАПИСКА


1. Краткая характеристика дисциплины:

Курс рассчитан на студентов-социологов второго курса и должен познакомить их с основами математической статистики и анализа данных при помощи математико-статистических методов. Студенты должны научиться использовать математико-статистические методы и пакет статистических программ SPSS версий 15-18 для анализа первичных и вторичных социологических и маркетинговых данных. Освоить методы статистической проверки гипотез и статистического вывода.

Каждый из студентов применяет во время практических занятий в компьютерном классе те понятия, методы и приемы анализа, о которых сообщается на лекциях. Акцент делается на тех навыках, которые наиболее важны в практической работе социолога-исследователя и маркетолога-исследователя. На практических занятиях используются не абстрактные примеры, а данные реальных исследований, проведенных за последние два-три года.

Одна из основных проблем – преодолеть дефицит школьной математической подготовки и не «напугать студентов» сложными математическими концепциями, как это происходит, когда подобные курсы читают для обществоведов математики. Поэтому курс в полной мере «настроен» на практические потребности социологов. Все математико-статистические концепции преподаются на основе примеров из практики реальных социологических исследований.


2. ^ Требования к студентам, начинающим изучение дисциплины:

Студенты должны быть знакомы с элементами теории вероятности и алгеброй в пределах школьной программы, а также обладать базовой компьютерной грамотностью – умением пользоваться программами MS Excel и MS Word.

3. ^ Задачи обучения по дисциплине:


Успешно прошедшие курс студенты должны…

знать:

- точечное и интервальное оценивание статистической достоверности

- выборочный метод и его разновидности

- математико-статистические методы описания и анализа количественных данных

- допущения и ограничения для различных методов математико-статистического анализа

уметь:

- выбирать методы математико-статистического анализа с учетом специфики данных

- делать вывод о статистической достоверности обнаруженных зависимостей

- содержательно интерпретировать количественные данные

- писать научные отчеты с использованием анализа количественных данных

4. ^ Формы учебной работы:

Занятия, как лекции, так и семинары, проводятся в компьютерном классе. Студенты отрабатывают каждый из методов с использованием данных реальных социологических и маркетинговых исследований.

5. Формы контроля успешности обучения:

Студенты выполняют три контрольные работы.

6. Методика формирования результирующей оценки:

Итоговая оценка складывается из двух компонентов:
  • активность на практических занятиях – 10%
  • три контрольные работы (по 30% каждая) – 90%

II. Содержание программы

Тема 1. Основы теории вероятности.

Случайность и случайный выбор. Случайные переменные. Зависимые и независимые события. Дополнительные события и полная вероятность. Некоторые приемы оценки и расчета вероятностей. Теоремы сложения и умножения вероятностей.


^ Тема 2. Нормальное распределение.

Нормальная кривая, ее параметры и свойства. Единичное нормальное распределение как стандарт. Применение нормальной кривой. Нормализация данных.


^ Тема 3 Выборочный метод.

Генеральная совокупность и выборки: определение, параметры и статистики. Идея выборочного распределения. Свойства оценок..Оценка параметров генеральной совокупности по параметрам выборки. Расчет размера простой вероятностной выборки. Различные типы выборок: простая вероятностная выборка, многоступенчатая кластерная выборка, квотные и «удобные выборки» (прессовые опросы, построение выборки методом «снежного кома»).


^ Тема 4. Описательная статистика: оценка центральной тенденции и дисперсии данных.

Методы оценки центральной тенденции и вариации для различных типов шкал. Мода, медиана, среднее, их интерпретация. Выбор меры центральной тенденции. Меры рассеяния и вариации: размах полу-междуквартильный интервал, дисперсия, стандартное отклонение, коэффициент вариации. Коэффициент вариации как мера однородности.


^ Тема 5. Графическое представление данных.

Различные типы графиков: круглые диаграммы, гистограммы, «линейки». Соответствие типа диаграммы особенностям данных. «Читаемость» графиков и типичные ошибки при построении графиков.


^ Тема 6. Статистический вывод.

Основные понятия статистического вывода. Нулевая и альтернативная гипотезы. Ошибки первого и второго рода.


Тема 7 Интервальное оценивание.

Понятие доверительного интервала. Z-тест. Распределение Стьюдента и t-тест. Биномиальное распределение. Уровни значимости.


^ Тема 8 Перекодировка данных, селекция данных.

Перекодировка данных в шкалы с другой размерностью. Представление множественных номинальных переменных как набора бинарных переменных. Связь размерности шкал с содержательной интерпретацией данных.


^ Тема 9. Двух- и трех мерные таблицы сопряженности.

Сравнение пропорций. Использование критерия хи-квадрат для проверки гипотезы о независимости двух переменных. Степени свободы. Критическое значение.


^ Тема 10. Меры связи и ассоциации.

Коэффициент корреляции моментов Пирсона. Коэффициенты ранговой корреляции Спирмэна и Кэндалла, проблема связанных рангов. Двумерная диаграмма рассеивания. Эффект «потолка» и «подвала», проблема неоднородной выборки и нелинейность. Интерпретация коэффициентов корреляции и их величины. Определение их статистической значимости. Причинность и корреляция.


^ Тема 11 Причинный анализ и регрессии.

Модели линейной регрессии. Метод наименьших квадратов. Коэффициент детерминации. Требования к зависимой и независимой переменной в регрессии. Частные и множественные корреляции. Номинальные независимые переменные в регрессии. Мультиколлинеарность. Интеракция независимых переменных.


Контроль


Контрольные работы.

Контрольная работа 1:

Студенты получают задание рассчитать и проинтерпретировать на основе выборочных данных доверительные интервалы для различий средних генеральной совокупности.


Контрольная работа 2:

Студенты получают задание рассчитать и проинтерпретировать двумерные таблицы сопряженности и коэффициенты корреляции.


Контрольная работа 3:

Студенты рассчитывают, сравнивают и интепретируют три регрессионные модели.


Пример контрольной работы:

Контрольная 5 ноября 2008 года


Вариант 1.


Используйте фай ASI 281104.sav


Вам необходимо:

Рассчитать и проинтерпретировать регрессионную модель.
  • Зависимая переменная
  • СПИД Вы лично боитесь заразиться СПИДом (ВИЧ)?
  • Обязательные независимые переменные: пол, возрастная группа, образование, оценка материального положения, принадлежность к социальным группам (перекодируйте в бинарные переменные 3 наиболее интересные, по Вашему мнению, группы).
  • Три независимые переменные по Вашему выбору.


!!!! Внимание, проверьте, монотонно ли закодированы переменные и, если нужно, перекодируйте их !!! Напишите как и что Вы перекодировали

    1. Рассчитайте таблицы сопряженности с верными процентами для независимых переменных: пол, возрастная группа, образование, оценка материального положения, принадлежность к социальным группам. Определите по ХИ-квадрату статистическую значимость взаимосвязи с независимой переменной. Проинтерпретируйте содержательно значимые взаимосвязи.
    2. Рассчитайте и сравните ^ 2 модели регрессии: 1) модель только с 5-ю демографическими переменными, 2) модель с 5-ю демографическими переменными плюс еще 3-мя по Вашему выбору.
    3. Оцените значимость коэффициентов и проверьте, как они меняются после добавления новых переменных (нет ли мультиколлинеарности?)
    4. Опишите, каким образом связана зависимая переменная со значимыми независимыми переменными.
    5. Проинтерпретируйте изменения R2 а также определите на основе стандартизованных коэффициентов бета, какие независимые переменные наиболее важны.
    6. Рассчитайте оптимальную модель и напишите уравнение регрессии и напишите уравнение регрессии для нее.



Вариант 2.


Используйте фай ASI 281104.sav


Вам необходимо:

Рассчитать и проинтерпретировать регрессионную модель.
  • Зависимая переменная
  • ФИНСКАЯ_ВОЙНА В этом году исполняется 65 лет со дня советско-финской войны 1939-1940 годов. Как Вы считаете, русско-финская война была…
  • Обязательные независимые переменные: пол, возрастная группа, образование, оценка материального положения, принадлежность к социальным группам (перекодируйте в бинарные переменные 3 наиболее интересные, по Вашему мнению, группы).
  • Три независимые переменные по Вашему выбору.


!!!! Внимание, проверьте, монотонно ли закодированы переменные и, если нужно, перекодируйте их !!! Напишите как и что Вы перекодировали

    1. Рассчитайте таблицы сопряженности с верными процентами для независимых переменных: пол, возрастная группа, образование, оценка материального положения, принадлежность к социальным группам. Определите по ХИ-квадрату статистическую значимость взаимосвязи с независимой переменной. Проинтерпретируйте содержательно значимые взаимосвязи.
    2. Рассчитайте и сравните ^ 2 модели регрессии: 1) модель только с 5-ю демографическими переменными, 2) модель с 5-ю демографическими переменными плюс еще 3-мя по Вашему выбору.
    3. Оцените значимость коэффициентов и проверьте, как они меняются после добавления новых переменных (нет ли мультиколлинеарности?)
    4. Опишите, каким образом связана зависимая переменная со значимыми независимыми переменными.
    5. Проинтерпретируйте изменения R2 а также определите на основе стандартизованных коэффициентов бета, какие независимые переменные наиболее важны.
    6. Рассчитайте оптимальную модель и напишите уравнение регрессии и напишите уравнение регрессии для нее.


Iv. ЭКЗАМЕНАЦИОННЫЕ ВОПРОСЫ

^ ТЕМАТИЧЕСКИЙ РАСЧЕТ ЧАСОВ

(дневное отделение)


Экзамен и темы экзаменационных заданий

Для сдачи экзамена студент должен выполнить практическую работу с использованием статистического пакета SPSS и проинтерпретировать ее результаты.

После сдачи файла с выполненной работой преподаватель оценивает ее качество.

Для сдачи финального экзамена студенты должны изучить следующие темы:

  • Случайность и случайный выбор. Случайные переменные. Зависимые и независимые события.
  • Некоторые приемы оценки и расчета вероятностей. Теоремы сложения и умножения вероятностей.
  • Типы шкал: номинальная, порядковая, интервальная и шкала отношений.
  • Индикаторы и концепты. Операционализация социологических концептов.
  • Точность и надежность измерения. Систематические и случайные ошибки измерения.
  • Валидность шкалы. Методы проверки валидности шкалы.
  • Методы оценки центральной тенденции и вариации для различных типов шкал. Мода, медиана, среднее, их интерпретация.
  • Меры рассеяния и вариации.
  • Нормальная кривая, ее параметры и свойства. Единичное нормальное распределение как стандарт.
  • Нормализация данных.
  • Основные понятия статистического вывода. Нулевая и альтернативная гипотезы.
  • Ошибки первого и второго рода.
  • Сравнение пропорций.
  • Использование критерия хи-квадрат для проверки гипотезы о независимости двух переменных.
  • Различные типы графиков: круглые диаграммы, гистограммы, «линейки».
  • Коэффициент корреляции моментов Пирсона.
  • Коэффициенты ранговой корреляции Спирмэна и Кэндалла, проблема связанных рангов.
  • Эффект «потолка» и «подвала», проблема неоднородной выборки и нелинейность при анализе ассоциации.
  • Понятие доверительного интервала. Z-тест. Уровни значимости.
  • Распределение Стьюдента и t-тест. Биномиальное распределение.
  • Генеральная совокупность и выборки: определение, параметры и статистики. Идея выборочного распределения.
  • Оценка параметров генеральной совокупности по параметрам выборки.
  • Различные типы выборок: простая вероятностная выборка, многоступенчатая кластерная выборка, квотные и «удобные выборки» (прессовые опросы, построение выборки методом «снежного кома»).
  • Модели линейной регрессии. Метод наименьших квадратов.
  • Коэффициент детерминации. Требования к зависимой и независимой переменной в регрессии. Частные и множественные корреляции.
  • Перекодировка многозначных переменных в бинарные. Аддитивные и мультипликативные элементы регрессионной модели.
  • Номинальная зависимая переменная и модель логистической регрессии.



v. УЧеБНАЯ И НАУЧНАЯ ЛИТЕРАТУРА, рекомендуемая студентам

Базовые учебники

  • SPSS: искусство обработки информации. Анализ статистических данных и восстанов­ление скрытых закономерностей: Пер. с нем./Ахим Бююль, Петер Цёфель - .СПб.: ООО «ДиаСофтЮП», 2002.- 608 с.
  • А. О. Крыштановский АНАЛИЗ СОЦИОЛОГИЧЕСКИХ ДАННЫХ с помощью пакета SPSS – М., изд-во ВШЭ 2006.



Литература

  1. Батыгин Г.С. Лекции по методологии социологических исследований. М.: Аспект
    Пресс, 1995
  2. Гласс Дж., Дж. Стэнли. Статистические методы в педагогике и психологии. М., «Прогресс»,1976.
  3. Кендэл М. Ранговые корреляции. М.: Статистика, 1995
  4. Гмурман В.Е. Теория вероятностей и математическая статистика. М.: Высшая школа, 1998
  5. Интерпретация и анализ данных в социологических исследованиях. М.: Наука, 1987
  6. Калинина В.Н., Панкин В.Ф. Математическая статистика. М.: Высшая школа, 1998
  7. Малхотра Н. Маркетинговые исследования. Практическое руководство. М., «Вильямс», 2002.
  8. Окунь, Ян. Факторный анализ. М., Статистика 1983.
  9. Ноэль Э. Массовые опросы. Введение в методику демоскопии. М.: Ава-Эстра, 1993.
  10. Основы прикладной социологии. М.: Интерпракс, 1996.
  11. Паниотто В.И. Количественные методы в социологических исследованиях. Киев: Наукова думка, 1982
  12. Рабочая книга социолога. М.: Наука, 1983.
  13. Рукавишников В.О., Паниотто В.И., Чурилов Н.Н. Опросы населения. М.: Финансы и
    статистика, 1984.
  14. Справочник по прикладной статистике. В 2-х томах.М.: Финансы и статистика, 1989, 1990
  15. Статистические методы анализа социологической информации. М.: Наука, 1989
  16. Татарова Г.Г. Методология анализа данных в социологии. М., 1998
  17. Территориальная выборка в социологических исследованиях. М.: Наука, 1980
  18. Чурилов Н.И. Проектирование выборочного социологического исследования. Киев:
    Наукова думка, 1986
  19. Толстова Ю.Н. Измерение в социологии. М.: ИНФРА-М, 1998
  20. Ядов В.А.Стратегия социологического исследования: описание, объяснение, понимание социальной реальности. М., «Добросвет», 2003.
  21. Freedman et.al. Statistics. NY, W.W. Norton & Company, 1991.


^ VI. ТЕМАТИЧЕСКИЙ ПЛАН ИЗУЧЕНИЯ ДИСЦИПЛИНЫ



1 № п/п

Наименование темы

Аудиторные часы

Самостоя-тельная работа



Всего часов







Лекции

Практика

Всего

1

Основы теории вероятности.

2

2

4

4

8

2

Нормальное распределение.

2

2

4

6

10

3

Выборочный метод.

2

2

4

6

10

4

Описательная статистика: оценка центральной тенденции и дисперсии

2

2

4

4

8

5

Графическое представление данных

2

2

4

4

8

6

Статистический вывод.

2

2

4

4

8

7

Интервальное оценивание

2

2

4

4

16

8

Перекодировка данных, селекция данных

2

2

4

6

10

9

Двух- и трехмерные таблицы сопряженности

2

2

4

4

8

10

Меры ассоциации и связи

2

2

4

4

814

11

Причинный анализ и регрессия

4

4

8

6




Всего

24

24

48

50

98



Автор программы: ____________________________/Ф.И.О./