Программа дисциплины: программа spss разработано в соответствии с Государственным образовательным стандартом высшего профессионального образования по специальности 020300 социология

Вид материалаПрограмма дисциплины

Содержание


1. Требования к уровню подготовки студента
2. Объем дисциплины и виды учебной работы
3. Тематический план дисциплины
Работа с программами статистического анализа данных на компьютере.
Тема 1. Работа с программами статистического анализа данных на компьютере.
Тема 2. Знакомство с пользовательским интерфейсом программы SPSS.
Подобный материал:

МИНИСТЕРСТВО ОБЩЕГО И ПРОФЕССИОНАЛЬНОГО

ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ


ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ГУМАНИТАРНЫХ НАУК


ФАКУЛЬТЕТ СОЦИОЛОГИИ


ПРОГРАММА ДИСЦИПЛИНЫ:

ПРОГРАММА SPSS


Разработано в соответствии с Государственным образовательным

стандартом высшего профессионального образования

по специальности


020300 - социология


Автор:

К.соц.н. А.В. Стрельникова


Одобрено на заседании кафедры:

Математическое моделирование и анализ данных в социологии.

Зав. кафедрой

___________

«____»________200 г.

Рекомендовано Ученым советом факультета социологии ГУГН


Председатель

___________


«____»_________200 г.


Дисциплина «Программа SPSS» является базовой при подготовке по специальности 020300 - социология.


Целью курса является освоение основных методов анализа количественной социологической информации. В ходе изучения курса предлагается ознакомить студентов с программой SPSS, являющейся мощной системой статистического анализа и управления данными. При помощи этой программы можно создавать и редактировать базы данных, считывать данные из файлов практически любого типа и работать с ними, создавая табличные отчеты, строя графики и диаграммы различных распределений и временных рядов, вычислять описательные статистики и выполнять сложный статистический анализ.


В процессе изучения дисциплины студенты знакомятся с характеристиками современных программных средств анализа социологических данных и осваивают технику работы с многозадачным пакетом SPSS. Студенты учатся работать с базами социологических данных, преобразовывать данные, работать с файлами, синтаксисом и результатами вывода, изучают как простые методики статистического анализа (частотный анализ, расчет статистических характеристик, таблицы сопряженности), так и более сложные методики (кластерный, факторный анализ).


В ходе практических занятий предполагается научить студентов работать с данными различного типа на основе массивов RLMS и других массивов, доступных в учебных целях и подбираемых в соответствии со сферой интересов студентов. При этом работа с данными подразумевает не только владение техническими процедурами, но также и возможность грамотно интерпретировать и использовать полученные результаты.


Занятия проводятся в компьютерном зале, поэтому лекции и семинары проводятся в виде практических занятий в совмещенном режиме.


1. ТРЕБОВАНИЯ К УРОВНЮ ПОДГОТОВКИ СТУДЕНТА,
ЗАВЕРШИВШЕГО ИЗУЧЕНИЕ КУРСА «ПРОГРАММА SPSS»


Уровень подготовки студента, изучившего курс «Программа SPSS» в Государственном университете гуманитарных наук, характеризуется его способностью проявлять следующие знания и навыки:


Уметь работать с программным пакетом SPSS на уровне уверенного пользователя: вводить данные в виде переменных с заданными свойствами, редактировать имеющиеся данные, ориентироваться как в консольном языке SPSS (Syntax), так и на уровне графического интерфейса (главное и контекстное меню).

Владеть навыками работы с файлами данных (поиск данных, конвертация, разбиение и агрегирование, сортировка, отбор, преобразование).

Владеть навыками работы с различными методами статистического анализа: производить расчет одномерных и двумерных статистик, иметь представление о дисперсионном, регрессионном, факторном и кластерном анализе.

Уметь социологически интерпретировать результаты статистического анализа.

Уметь выбирать адекватные методы анализа в зависимости от (1) исследовательских задач, (2) типа доступных данных, (3) взаимодополняемости методов.

Ориентироваться в современных программных средствах анализа социологических данных.


2. ОБЪЕМ ДИСЦИПЛИНЫ И ВИДЫ УЧЕБНОЙ РАБОТЫ

Виды занятий

Количество часов

Лекции

4

Практические занятия

52

Всего часов

56



3. ТЕМАТИЧЕСКИЙ ПЛАН ДИСЦИПЛИНЫ


№ п/п

Темы

Лекции / семинары

1.

Работа с программами статистического анализа данных на компьютере.


4

2.

Знакомство с пользовательским интерфейсом программы SPSS.

4

3.

Ввод и редактирование данных.

4

4.

Преобразование данных.

4

5.

Операции с файлами данных: объединение и разбиение.

2

6.

Одномерные частотные распределения.

4

7.

Двумерные частотные распределения.

6

8.

Регрессионные модели.

6

9.

Модели дисперсионного анализа.

4

10.

Модели факторного анализа.

6

11.

Модели кластерного анализа.

6

12.

Многомерное шкалирование.

4

13.

Вторичный анализ данных в социологии.

2



4. ПРОГРАММА ПО ТЕМАМ

Тема 1. Работа с программами статистического анализа данных на компьютере.


Особенности ввода социологических данных в компьютер. Формализация и способы контроля. Понятие переменной, основные характеристики переменной. Понятие о базах данных. Различные форматы данных и проблема их сопоставимости.

Общая характеристика современных программных средств анализа социологических данных. Многозадачные и специализированные программные пакеты (NTCS, Statistica, Cluster, DA-system и др.). SPSS как многозадачный пакет, его возможности и ограничения.

Виды и причины ошибок в данных, возможности их диагностирования и исправления. Проблема пропущенных данных.

Тема 2. Знакомство с пользовательским интерфейсом программы SPSS.


Главное меню и диалоговые окна. Панели инструментов. Окно редактора данных, окно синтаксиса и окно вывода. Функциональная и пользовательская настройка (шрифты, стили вывода результатов и т.д.) Окно описания переменных.

Открытие уже существующего файла с данными. Возможность конвертации (импорта) файлов с данными, созданных в других программах. Сохранение файла данных в различных форматах (экспорт данных). Использование результатов в приложениях WORD, EXCEL, вставка и копирование объектов.


Тема 3. Ввод и редактирование данных.

Создание новой базы данных. Наблюдение и переменная. Создание имен переменных, создание метки переменных и метки значений, использование специальных кодов для пропущенных значений. Ввод данных (числовых и нечисловых), ввод данных в выбранную область.

Изменение типа данных, возможность вырезать, копировать и вставлять значение данных, добавление и удаление наблюдений, добавление и удаление переменных, изменение порядка переменных, изменение описания переменных.

Поиск переменных, поиск наблюдений, поиск значений данных.


Тема 4. Преобразование данных.

Формирование новых переменных (вычисление значений, отбор по условию). Арифметические и логические операторы. Встречаемость значений в наблюдениях. Подсчет встречаемости значений в наблюдениях.

Перекодировка значений. Перекодировка в те же самые переменные, определение значений для переменной; перекодировка в другие переменные, определение значений перекодировки, пропущенные значения.

Вычисление рангов нормальных и грубых оценок.


Тема 5. Операции с файлами данных: объединение и разбиение

Слияние файлов, объединяя те же самые переменные, но разные наблюдения, добавление наблюдений, переменные без пары, переменные нового рабочего файла, переменная источник, выбор переменных, удаление переменных, переименование переменных, объединение файлов, содержащих разные переменные.

Агрегирование данных. Разделяющие переменные, агрегируемые переменные, создание нового файла данных, агрегирующие функции. Отбор подмножества наблюдений по условию, использование переменной фильтр, генерация случайной выборки, выбор интервала.


Тема 6. Одномерные частотные распределения.

Методы построения одномерных распределений.

Получение значений частот и статистик, частотные статистики, диаграммы частот, работа с таблицами. Среднее арифметическое, медиана, мода, дисперсия, стандартное отклонение, процентили распределения. Вычисление доверительного интервала для оценки среднего значения переменных, для оценки доли, t-статистика.

Понятие математической модели. Статистики одномерного распределения как показатели качества модели.


Тема 7. Двумерные частотные распределения.

Модели статистической связи в двумерных таблицах. Идея коэффициента связи. Коэффициент связи Хи-квадрат и производные от него коэффициенты для номинальных шкал.

Идея коэффициента ранговой корреляции. Коэффициенты гамма, Спирмена, Кендалла.

Коэффициент корреляции Пирсона. Множественная зависимость и вычисление частных коэффициентов корреляции. Коэффициент детерминации.

Построение таблиц сопряженности, слои таблиц сопряженности, пучковые столбиковые диаграммы для таблиц сопряженности, содержание клеток таблиц, статистики, вычисляемые для таблиц сопряженности, формат таблиц.


Тема 8. Регрессионные модели.

Простая и множественная линейная регрессионная модель. Коэффициент множественной корреляции. Регрессионные коэффициенты.

Возможности и ограничения регрессионной модели. Мультиколлинеарность и гомоскедастичность: социологический смысл ограничений.

Понятие остатков в регрессионной модели. Анализ остатков, требование нормальности их распределения.

Особенности интерпретации результатов регрессионного анализа.

Конструирование условных переменных (dummy). Модели нелинейной регрессии. Логистическая регрессия.


Тема 9. Модели дисперсионного анализа.

Оценка значимости различия средних с помощью теста Стьюдента.

Возможности и ограничения дисперсионного анализа. Однофакторная и многофакторная дисперсионные модели.


Тема 10. Модели факторного анализа.

Явные и латентные переменные. Поиск латентных переменных. Возможности и ограничения факторного анализа.

Проблема определения числа факторов. Интерпретация результатов факторного анализа.


Тема 11. Модели кластерного анализа.

Возможности и ограничения кластерного анализа. Различные алгоритмы для кластеризации. Понятие формы кластера и функции расстояния. Иерархический кластерный анализ. Анализ объектов и анализ переменных.


Тема 12. Многомерное шкалирование.

Возможности и ограничения многомерного шкалирования. Неметрическое многомерное шкалирование. Визуализация результатов, проекция модели. Область применения.


Тема 13. Вторичный анализ данных в социологии.

Возможности использования данных ранее проведенных исследований. Проблемы вторичного анализа. Банки и архивы социологических данных – их организация, методы хранения, правила доступа.


Литература к курсу:


Обязательная

Крыштановский А.О. Анализ социологических данных с помощью пакета SPSS. М.: ГУ-ВШЭ, 2006.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. М.: Мир, 1982. 

Батыгин Г.С. Соотношение понятий и переменных в социологическом исследовании // Социологические исследования. 1981. № 3.

Бююль А., Цёфель П. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. СПб: ООО «ДиаСофт», 2002.

Елисеева И.И., Рукавишников В.О. Логика прикладного статистического анализа. М.: Финансы и статистика, 1982.

Bourque L.B., Clark V.A. Processing data. L.: Sage Publications. Sage University Paper series on Quantitative Applications in the Social Sciences, № 85.

Marsh C. Exploring Data. Cambridge: Polity Press, 1988.


Дополнительная


Андреенков В.Г., Маслова О.М. Эмпирический базис социологической науки: Проблемы качества // Социологические исследования. 1987, № 6.

Клигер С.А., Косолапов М.С., Толстова Ю.Н. Шкалирование при сборе и анализе социологической информации. М., 1978.

Комплексное применение математических методов в социологических исследованиях / Отв. ред. В.Г. Андреенков, Г.Г. Татарова, Ю.Н.Толстова. М.: ИСИ АН СССР, 1983.

Миркин Б.Г. Группировки в социально-экономических исследованиях. М.: Финансы и статистика, 1985.

Паниотто В.И. Качество социологической информации. Киев: Наукова думка, 1986. Гл. 1.

Паниотто В.И., Максименко В.С. Количественные методы в социологических исследованиях. Киев: Наукова Думка, 1982.

Ракитов А.И. Статистическая интерпретация факта и роль статистических методов в построении эмпирического знания. М., 1981.

Ростегаева Н.И. Банк социологических данных: проблемы функционирования и тенденции развития // Социология 4М. 1998.

Ростовцев П.С. Алгоритмы анализа структуры прямоугольных матриц “пятна” и “полосы” // Анализ нечисловой информации в социологических исследованиях. М.: Наука, 1985.

Ростовцев П.С. и др. Анализ структур социологических данных. Устойчивость  // Анализ и моделирование экономических процессов переходного периода в России. Новосибирск: Ин-т экономики и организации промышленного производства. 1997.

Саганенко Г.И. Сопоставление несопоставимого: обоснование сравнительного исследования на базе открытых вопросов  // Социологический журнал, 1998. № 3-4.

Сваффорд М., Косолапов М.С., Козырева П.М. Международные стандарты оценки качества социологических исследований // Мир России. 1999. № 1-2.

Статистические методы анализа информации в социологических исследованиях. М.: Наука, 1979.

Сычева В.С. Метод вторичного анализа // Социологические исследования. 1995. № 11.

Татарова Г.Г. Методология анализа данных в социологии. М.: Nota Bene, 1999.

Толстова Ю.Н. Методы измерения в социологии. М., 1998.

Толстова Ю.Н. Анализ социологических данных: Методология, дескриптивная статистика, изучение связей между номинальными признаками. М.: Научный мир, 2000.

Толстова Ю.Н. Принципы анализа данных // Социология: 4М. 1991. №1.

Ядов В.А. Социологическое исследование: методология, программа, методы. Самара, 1995.

Cramer D. Introducing statistics for social research using SPSS. 1992.

Hakim C. Secondary analysis in social research. A guide to data sources and methods with examples. L.: George Allen & Unwin, 1982.

Kritzer H.M. The data puzzle: The nature of interpretation in quantitative research // American journal of political science. Austin, 1996. Vol. 40, № 1.

Lovell M. Data mining // The Review of Economics and Statistics. 1983. № 65.

Walsh A. Statistics for the Social Sciences with computer-based applications. N.Y.: Harper  Row Publishers, 1990.