Программа дисциплины «Системы статистического анализа данных (spss)» для направления Магистратура (третья ступень высшего

Вид материалаПрограмма дисциплины

Содержание


I. Организационно-методический раздел
Цель курса
Место курса в системе формируемых инновационных квалификаций
II. Содержание курса.
Тематический план учебной дисциплины
Тема 10. Логистическая регрессия
Итого часов
Основные требования, примерный объем и критерии оценки письменной работы
Критерии оценки эссе.
1 балл - текстуальное совпадение всего эссе с каким-либо источником, т. е. плагиат.Организация проведения контрольной работы
Базовые учебники
Практическое занятие 1. Подготовка данных для статистического анализа пакете SPSS
Практическое занятие 2. Описательные статистики
Практическое занятие 4. Регрессионный анализ
Практическое занятие 7. Дискриминационный анализ
Практическое занятие 8-1. Экспоненциальное сглаживание
IV. Цель написания письменных работ (эссе)
V. Примерный перечень вопросов для оценки качества освоения учебного курса
Подобный материал:

Министерство экономического

развития и торговли

Российской Федерации

Министерство

образования

Российской Федерации

Государственный университет-

Высшая школа экономики

Факультет Бизнес-информатики

Программа дисциплины

«Системы статистического анализа данных (SPSS)»

для направления - Магистратура

(третья ступень высшего

профессионального образования)


Автор доцент Перминов Г.И.


Москва, 2006 г.

I. Организационно-методический раздел


Учебный курс читается на факультете Бизнес-Информатика по специализации «Информационная бизнес-аналитика». Приступая к изучению этого учебного курса, студенты должны знать основы компьютерной грамотности и математическую статистику, которые изучаются на данном факультете.

Программой учебного курса предусматривается проведение лекций (38 часов), семинарских занятий (40 часов), а также самостоятельная внеаудиторная работа студентов (84 часа). Самостоятельная работа студентов включает освоение теоретического материала, изучение рекомендованной учебной литературы и инструментальных средств статистического анализа, подготовку к практическим занятиям.

Учебным планом предусматривается написание студентами одного эссе и выполнение одной контрольной работы. По окончании изучения учебного курса проводится экзамен.
    1. Цель курса

Цель учебного курса - познакомить студентов с организацией и проведением статистического анализа реальных массивов данных, интерпретацией результатов анализа, выдвижением новых предположений и гипотез, научить студентов самостоятельно строить статистические модели данных, проводить многовариантный анализ и на этой основе вырабатывать навыки аналитической работы в управлении и бизнесе.


    1. Задачи курса



Задачами учебного курса являются:
  • изучение информационной технологии статистического анализа;
  • ознакомление студентов с основами организации статистического анализа в современных пакетах;
  • исследование базовых основ, характеристик и областей применения методов статистического анализа;
  • оценка эффективности применения статистического анализа ;
  • использование зарубежного опыта применения методов статистического анализа.


    1. Методическая новизна курса



Методической новизной данного учебного курса является комплексный подход к статистическому анализу: от предварительного анализа данных интерпретации результатов, полученных при работе статистических процедур.

Из универсальных пакетов наиболее известны и хорошо отработаны компьютерные системы SAS, SPSS, SYSTAT, Minitab, Statgraphics (или, по другому, STSC). Полу-универсальными» можно считать российские пакеты STADIA, ОЛИМП и белорусский пакет РОСТАН. К этому же классу следует отнести и американские пакеты ODA, WinSTAT, Statit, UNISTAT, Multivariance 7, JMP, SOLO, STATlab.

Кроме того, встречаются и явно специализированные пакеты по классификации и снижению размерности, как отечественные: КЛАСС-МАСТЕР, КВАЗАР, PALMODA, Stat-Media, STARC — так и зарубежные, например, MVSP. Довольно широко известными являются пакеты, которые решают смежные задачи. Ими являются американские системы BMDP/W, SigmaStat, Statistix, TURBO Spring-Stat-Win, а также отечественный пакет «Статистик-Консультант для Windows». Кроме того, на рынке имеются статистические экспертные системы, например, СТАТЭКС, Statistical Navigator Pro.

По методологии NSTL (США) оценки качества СПП по семи критериям1 (разнообразие алгоритмов; скорость работы; качество выходны форм; легкость использования; легкость обучения; общие оценки мощности; общие оценки удобства использования) лидирующее положение занимают универсальные пакеты SYSTAT, SAS и SPSS. Учитывая, что для факультетов психологии и социологии наилучшим из победителей является SPSS (Statistical Package for the Social Science- Статистический пакет для социальных наук) и он ежегодно закупается (обновляется) Высшей школой экономики, то выбор последнего для изучения на факультете Бизнес-информатики является предпочтительнее. Поэтому учебный курс базируется на SPSS версии 15,0.


    1. Место курса в системе формируемых инновационных квалификаций



Данный учебный курс может быть использован при формировании следующих инновационных квалификаций в области бизнес информатики:

-выявление закономерностей на фоне случайностей;

-прогноз состояния рынка и рентабельности вложений;

-инструментарий плановых, аналитических и маркетинговых расчетов;

- анализ временных рядов.

Программа может стать частью ряда инновационных совместных (междисциплинарных и межкафедральных ) магистерских программ:

-компьютерная поддержка принятия решений,

- управление знаниями в корпорации.


II. Содержание курса.
    1. Новизна курса



Программа учебного курса базируется на новейших информационных технологиях статистического анализа.

В данном учебном курсе впервые прослежена эволюция всех составляющих компонент информационной технологии поддержки принятия решений.

Данный курс до настоящего времени на факультетах информационного направления в российских высших учебных заведениях не читался. Наиболее близким по проблематике к предлагаемому учебному курсу является курсы «Информатика» и «Математическая статистика», включенные в учебные программы и планы большинства вузов.

В зарубежных университетах и иных высших учебных заведениях данная проблематика широко представлена в следующих корреспондирующих курсах: «Компьютерный анализ данных», «Прикладной анализ временных рядов» , «Технический анализ».
    1. Тематический план учебной дисциплины

      № п/п

      Наименования тем

      Всего часов

      Аудиторные часы

      Внеаудиторные часы

      Лекции

      Практические занятия

      Всего аудиторных

      1

      Тема 1. Назначение, область применения и характеристика пакета

      4

      2

      0

      2

      2

      2

      Тема 2. Подготовка данных для статистического анализа

      14

      4

      4

      8

      6

      3

      Тема 3. Методы описательной статистики

      16

      4

      4

      8

      8

      4

      Тема 4. Оценки связи между переменными

      14

      2

      4

      6

      8

      5

      Тема 5. Регрессионный анализ

      16

      4

      4

      8

      8

      6

      Тема 6. Факторный анализ и анализ главных компонент

      16

      4

      4

      8

      8

      7

      Тема 7. Кластерный анализ

      16

      4

      4

      8

      8

      8

      Тема 8. Дискриминантный анализ

      16

      4

      4

      8

      8

      9

      Тема 9. Анализ временных рядов

      34

      6

      8

      14

      20

      10

      Тема 10. Логистическая регрессия

      16

      4

      4

      8

      8

      11

      Итого часов

      162

      38

      40

      78

      84
    2. Формы рубежного контроля и структура итоговой оценки

Итоговая оценка складывается из оценок за:
  • работу на практических занятиях;
  • контрольную работу;
  • эссе;
  • ответ на экзамене.


Текущий контроль осуществляется на практических занятиях, а также путем проверки преподавателем эссе.

Промежуточный контроль осуществляется путем проведения контрольной работы по темам, вынесенным на самостоятельное изучение студентов.

Итоговый контроль осуществляется в форме экзамена по окончании изучения дисциплины.

Итоговая оценка складывается из следующих составляющих:


Для получения результирующей оценки итогового контроля усредняются оценки в 10-балльной шкале по отдельным формам текущего контроля и зачета.

Результирующая оценка итогового контроля выводится по формуле средней взвешенной с учетом введенных весов. В зачетную книжку и в ведомость выставляется результирующая оценка.

Вес итоговой оценки, полученной на экзамене, в результирующей оценке составляет 0,4; вес оценки за эссе - 0,3; вес оценки работы студентов на семинарских занятиях - 0,2; вес оценки за контрольную работу - 0,1.

Основные требования, примерный объем и критерии оценки письменной работы


Эссе - это краткая научная работа студента, в которой студент должен раскрыть один узкий проблемный вопрос. Отличие эссе от других научных работ студентов - в его краткости, лаконичности изложения материала на предложенную тему. Эссе сравнимо с устными высказываниями студентов по определенному научному вопросу на семинарах или докладом. В эссе студент выражает собственное мнение, обосновывая его ссылками на результаты анализа, учебную и научную литературу. Наличие авторской позиции, собственного отношения к вопросу в эссе обязательно. В эссе не требуется глубоко исследовать научную доктрину, сравнивать научные концепции и взгляды, в обязательном порядке использовать статистические методы анализа.

Эссе выполняется на отдельных листах формата А4, скрепленных между собой, шрифтом черного цвета. Нескрепленные эссе, а также эссе, выполненные от руки, напечатанные цветным шрифтом (синим, зеленым, красным и т.д.) на проверку не принимаются. Объем эссе - до 20 страниц печатного текста, включая титульный лист и список литературы.

Эссе начинается с титульного листа, считающегося первой страницей. На титульном листе номер страницы не ставится. План в эссе не обязателен, так как структура плана предполагает введение и заключение, а также деление основного вопроса на подвопросы, что в эссе сделать, как правило, затруднительно. Объем эссе не позволяет писать подробные введение и заключение на нескольких страницах. В начале эссе можно ограничиться одной или несколькими фразами, вводящим читающего в курс рассматриваемого вопроса. Вместо заключения достаточно сформулировать вывод, к которому пришел автор в результате анализа. В эссе обязательно должен быть список использованных источников и литературы.


Критерии оценки эссе.

10 баллов - блестящая работа, которая отвечает всем предъявляемым требованиям, а также отличается научной новизной и является вкладом в развитиестатистического анализа.

9 баллов - эссе соответствует всем требованиям, предъявляемым к такого рода работам. Тема эссе раскрыта полностью, четко выражена авторская позиция, имеются логичные и обоснованные выводы. Эссе написано с использованием большого количества источников на основе рекомендованной основной и дополнительной литературы, а также иной информации, чем та, что предложена в Программе соответствующей учебной дисциплины. На высоком уровне выполнено оформление работы.

8 баллов - те же требования, что и для оценки «9 баллов».Студентами не использована литература, помимо той, которая предложена в Программе учебной дисциплины.

7 баллов - тема эссе раскрыта полностью; прослеживается авторская позиция, сформулированы необходимые обоснованные выводы; использована необходимая для раскрытия вопроса основная и дополнительная литература и результаты статистического анализа, но небольшим количеством методов. Грамотное оформление.

6 баллов - в целом тема эссе раскрыта; выводы сформулированы, но недостаточно обоснованы; имеется анализ небольшим количеством статистических методов; использована необходимая как основная, так и дополнительная литература; недостаточно четко проявляется авторская позиция. Грамотное оформление.

5 баллов - тема раскрывается на основе использования нескольких основных и дополнительных источников; слабо отражена собственная позиция, выводы имеются, но они не обоснованы; материал изложен непоследовательно, без соответствующей аргументации и результатов анализа. Имеются недостатки по оформлению.

4 балла - тема раскрыта недостаточно полно; использовались только основные (более двух) источники; имеются ссылки на результаты анализа, но не выражена авторская позиция; отсутствуют выводы. Имеются недостатки по оформлению.

3 балла - тема эссе раскрывается неполно на основе двух источников; изложение материала без собственной оценки и выводов; отсутствуют ссылки на результаты статистического анализа. Имеются недостатки по оформлению работы.

2 балла - тема эссе не раскрыта; материал изложен без собственной оценки и выводов; отсутствуют ссылки на результаты статистического анализа. Имеются недостатки по оформлению работы.

1 балл - текстуальное совпадение всего эссе с каким-либо источником, т. е. плагиат.


Организация проведения контрольной работы

Контрольная работа выполняется студентом на семинарском занятии в течение 120 минут по одной из тем, вынесенных на самостоятельное изучение. Примерные задания контрольной работы представлены ранее.
    1. Базовые учебники

Литература основная
  1. Ахим Бююль, Петер Цефель. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. Торгово издательский дом Dia Soft Москва, Санкт-Петербург, Киев 2002.
  2. Макаров А.А., Тюрин Ю.Н. Статистический анализ на компьютере. М., Наука, 1997.

Литература дополнительная
  1. Айвазян С.А., Мхитарян В.С., Прикладная статистика и основы эконометрики. –М.: ЮНИТИ, 1998, гл.16.
  2. Сошникова Л.А., Тамашевич В.Н., Уебе Г., Шеффер М., Многомерный статистический анализ в экономике. Под ред. Тамашевича В.Н. -М.: ЮНИТИ_ДАНА, 1999.
  3. Дубнов П.Ю. Обработка статистической информации с помощью SPSS. М.: NT Press, 2004.
  4. Наследов А. SPSS. Компьютерный анализ данныхв психологиии социальных науках. –М:. ПИТЕР, 2007,
  5. SPSS для Windows. Руководство пользователя. Кн.1-6. М.: Статистические Системы и Сервис. 1996.
  6. SPSS statistical algorithms. 2nd ed. Chicago. SPSS Inc. 1991.
  7. SPSS Base 9.0 Руководство по применению
  8. SPSS Base 9.0 Руководство пользователя
    1. Содержание дисциплины

Тема 1. Назначение, область применения и характеристика пакета

Назначение, цели и функции системы, инструментальные средства. Особенности и основные черты пакета SPSS. Оболочка SPSS. Состав пакета, учебник, система помощи. Содержание и разделы главного меню. Преимущества системы по сравнению с другими статистическими пакетами и электронными таблицам.

Основные этапы статистических исследований. Последовательность действий при использовании пакета SPSS.

Литература основная
  1. Ахим Бююль, Петер Цефель. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. Торгово издательский дом Dia Soft Москва, Санкт-Петербург, Киев 2002, с. 14-19, с. 78-79.

Литература дополнительная
  1. SPSS для Windows. Руководство пользователя. Кн.1-6. М.: Статистические Системы и Сервис. 1996.

Тема 2. Подготовка данных для статистического анализа

1.

Основные требования, примерный объем и критерии оценки письменной работы 6

Практическое занятие 1. Подготовка данных для статистического анализа пакете SPSS 18

Практическое занятие 4. Регрессионный анализ 19

Практическое занятие 7. Дискриминационный анализ 20



Литература основная
  1. Ахим Бююль, Петер Цефель. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. Торгово издательский дом Dia Soft Москва, Санкт-Петербург, Киев 2002, с. 26 43, с. 51 –53, с. 74 – 78, с. 116-117, с. 131-138.

Литература дополнительная
  1. Наследов А. SPSS. Компьютерный анализ данныхв психологиии социальных науках. –М:. ПИТЕР, 2007, гл. 1 и 2.

Тема 3. Методы описательной статистики

1.

Основные требования, примерный объем и критерии оценки письменной работы 6

Практическое занятие 1. Подготовка данных для статистического анализа пакете SPSS 18

Практическое занятие 4. Регрессионный анализ 19

Практическое занятие 7. Дискриминационный анализ 20


Литература основная
  1. Ахим Бююль, Петер Цефель. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. Торгово издательский дом Dia Soft Москва, Санкт-Петербург, Киев 2002, с. 82-104, с. 117-129, с. 143, с. 164-169.
  2. Макаров А.А., Тюрин Ю.Н. Статистический анализ на компьютере. М., Наука, 1998.

Литература дополнительная
  1. Дубнов П.Ю. Обработка статистической информации с помощью SPSS. М.: NT Press, 2004.


Тема 4. Оценки связи между переменными


1. Понятие корреляции. Корреляция порядковых переменных. Корреляция Пирсона. Вызов процедуры корреляции. Установка параметров процедуры. Анализ результатов корреляции Пирсона

2. Ранговая корреляция Спирмэна. Назначение корреляции Спирмена. Вызов процедуры корреляции. Установка параметров процедуры. Анализ результатов корреляции Спирмена.

3. Ранговая корреляция Кэндалла. Назначение корреляции Кэндалла. Вызов процедуры корреляции. Установка параметров процедуры. Анализ результатов корреляции Кэндалла.

4. Частная корреляция. Назначение частной корреляции. Вызов процедуры корреляции. Установка параметров процедуры. Результаты частной корреляции.

4. Корреляция категоризованных переменных. Таблицы сопряженности. Назначение таблиц сопряженности. Структура и содержание элементов таблицы, ее итоговых показателей. Особенности измерения связи для номинальных, порядковых и интервальных шкал переменных. Последовательность построения таблиц и получения статистических критериев. Анализ результатов.

5. Использование отношения шансов. Назначение отношения шансов. Область применения относительного риска. Область применения отношения шансов. Вызов процедуры. Установка параметров процедуры. Анализ результатов вычислений.

6. Кросс-корреляция. Создание переменных с лагами.

7. Другие меры корреляции для таблиц. Мера согласия каппа для таблицы RxR. Назначение меры согласия каппа. Меры связи для таблиц RxC с ранжированными переменными. Меры, основанные на корреляции. Меры, основанные на согласующихся парах наблюдений. Двумерная таблица с зависимой и независимой переменными. Назначение двумерной таблицы с зависимой и независимой переменными.


Литература основная
  1. Ахим Бююль, Петер Цефель. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. Торгово издательский дом Dia Soft Москва, Санкт-Петербург, Киев 2002, с. 170 206, с. 220-255.
  2. Макаров А.А., Тюрин Ю.Н. Статистический анализ на компьютере. М., Наука, 1998.

Литература дополнительная
  1. SPSS для Windows. Руководство пользователя. Кн.1-6. М.: Статистические Системы и Сервис. 1996.


Тема 5. Регрессионный анализ

  1. Простая линейная регрессия. Назначение простой линейной регрессии. Вызов процедуры. Установка параметров процедуры. Вид результатов.
  2. Простая множественная регрессия. Назначение. Отбор переменных во множественной регрессии. Метод пошагового исключения (backward elimination). Метод пошагового включения (forward selection). Метод пошагового отбора (stepwise selection). "Оптимальное" число независимых переменных. Вид результатов расчета множественной линейной регрессии.
  3. Нелинейная регрессия. Метод подгонки кривых. Использование фиктивных переменных. Модели нелинейные по переменным. Модели нелинейные по параметрам.

4. Анализ остатков. Назначение анализа остатков. Понятие остатков. Проверка линейности. График остатков по экспериментальным значениям У. График остатков по независимой переменной. Однородность дисперсий. Независимость ошибок. Нормальность остатков. Построение гистограммы остатков. Построения графика остатков на нормальной вероятностной бумаге. Выявление выбросов. Проверка на выбросы зависимой переменной. Проверка на выбросы независимой переменной. Выявление существенных наблюдений. Включение и исключение подозрительного наблюдения. Вычисление расстояния Кука. Некоррелированность независимых переменных. Вычисление фактора "вздутия" вариации. Вычисление собственных чисел


Литература основная
  1. Ахим Бююль, Петер Цефель. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. Торгово издательский дом Dia Soft Москва, Санкт-Петербург, Киев 2002, с. 256 279.
  2. Макаров А.А., Тюрин Ю.Н. Статистический анализ на компьютере. М., Наука, 1998.

Литература дополнительная
  1. SPSS для Windows. Руководство пользователя. Кн.1-6. М.: Статистические Системы и Сервис. 1996.


Тема 6. Факторный анализ

  1. Факторный анализ. Принципы и разновидности факторного анализа.
  2. Метод главных компонент. Теоретические сведения. Вызов процедуры. Установка параметров процедуры. Окно Factor Analysis: Descriptives. Окно Factor Analysis: Extraction. Окно Scree Plot. Окно Factor Analysis: Rotation. Окно Loading Plot. Диалоговое окне Factor Analysis: Scores.
  3. Вид результатов расчета главных компонент. Корреляционная матрица. Таблица Total Variance Explained. График Scree Plot. Таблица Score Coefficient Matri. Таблица Component Score Covariance Matrix. Анализ результатов.
  4. Факторный анализ. Метод максимального правдоподобия с косоугольным вращением. Вызов процедуры факторного анализа. Установка параметров. Результаты расчета. Таблица общности. Таблица «Объяснённая дисперсия». Критерий качества модели.
  5. Регрессия на главных факторах. Постановка задачи

Основные требования, примерный объем и критерии оценки письменной работы 6

Практическое занятие 1. Подготовка данных для статистического анализа пакете SPSS 18

Практическое занятие 4. Регрессионный анализ 19

Практическое занятие 7. Дискриминационный анализ 20

Литература основная
  1. Сошникова Л.А., Тамашевич В.Н., Уебе Г., Шеффер М., Многомерный статистический анализ в экономике. Под ред. Тамашевича В.Н. -М.: ЮНИТИ_ДАНА, 1999.
  2. Дубнов П.Ю. Обработка статистической информации с помощью SPSS. М.: NT Press, 2004.

Литература дополнительная
  1. SPSS для Windows. Руководство пользователя. Кн.1-6. М.: Статистические Системы и Сервис. 1996.


Тема 7. Кластерный анализ

1.Назначение кластерного анализа. Теоретические сведения о кластерном анализе. Особенности метода. Особенности исходных данных. Шаги кластерного анализа. Расстояния между объектами. Расстояние между классами. Качество разбиения на классы. Меры расстояния между объектами (Евклидово расстояние, Нормализованное Евклидово, Сумма квадратов, Взвешенная сумма квадратов, Манхеттеновская метрика, Расстояние Брея-Картиса, Расстояния Канберра, Расстояние Махаланобиса).

2. Методы кластерного анализа. Разновидности агломеративных (объединяющих) методов. Дивизивные (разделяющие) методы.

3. Реализация методов в SPSS. Различия в результатах методов.

4. Итеративный метод кластеризации наблюдений - К средних. Цель метода. Требования к исходным данным. Запуск процедуры. Установка параметров. Результаты процедуры.

5. Кластеризация наблюдений. Иерархический метод. Цель метода. Требования к исходным данным. Запуск процедуры. Установка параметров. Результаты кластеризации.

6. Кластеризация переменных. Иерархический метод. Назначение метода. Установка параметров. Обзор результатов кластеризации.

7. Сравнение факторного и кластерного анализа переменных


Литература основная
  1. Ахим Бююль, Петер Цефель. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. Торгово издательский дом Dia Soft Москва, Санкт-Петербург, Киев 2002, с. 384 397.
  2. Сошникова Л.А., Тамашевич В.Н., Уебе Г., Шеффер М., Многомерный статистический анализ в экономике. Под ред. Тамашевича В.Н. -М.: ЮНИТИ_ДАНА, 1999.

Литература дополнительная
  1. SPSS для Windows. Руководство пользователя. Кн.1-6. М.: Статистические Системы и Сервис. 1996.
  2. Дубнов П.Ю. Обработка статистической информации с помощью SPSS. М.: NT Press, 2004.


Тема 8. Дискриминантный анализ
  1. Дискриминантный анализ. Назначение анализа. Формулировка задачи. Отличия от других методов анализа.
  2. Классификация при наличии обучающих выборок. Основные положения дискриминантного анализа. Дискриминантные функции и их геометрическая интерпретация. Расчет коэффициентов дискриминантных функций. Основная модель. Предположения, лежащие в основе дискриминантного анализа.
  3. Количество дискриминантных функций. Последовательность шагов
  4. Классификация при наличии двух обучающих выборок. Классификация при наличии k обучающих выборок. Взаитмосвязь между дискриминантными переменными и дискриминантными функциями.
  5. Классификация без интерпретации.

6. Терминология, используемая при выводе. Рекомендации по применению.


Литература основная
  1. Ахим Бююль, Петер Цефель. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. Торгово издательский дом Dia Soft Москва, Санкт-Петербург, Киев 2002, с. 346 382.
  2. Макаров А.А., Тюрин Ю.Н. Статистический анализ на компьютере. М., Наука, 1997.

Литература дополнительная
  1. Сошникова Л.А., Тамашевич В.Н., Уебе Г., Шеффер М., Многомерный статистический анализ в экономике. Под ред. Тамашевича В.Н. -М.: ЮНИТИ_ДАНА, 1999.


Тема 9. Анализ временных рядов

  1. Понятие динамического ряда. Понятие временного ряда. Особенности выборкивременного ряда. Виды рядов.
  2. Типы временных рядов. Создание переменной типа «время». Аппроксимация временного ряда различными кривыми с получением модели и ее характеристик. Предположения лежащие в основе анализа временных рядов (Нестационарность, Центрирование и нормирование).
  3. Область применения процедур (ориентировочно). Простая регрессия. Спектральная плотность или спектр ряда. Анализ интервенции. Интервальная корреляция. Сглаживание и фильтрация. Модели авторегрессии и проинтегрированного скользящего среднегоэ
  4. Модели экспоненциального сглаживания. Принцип экспоненциального сглаживания Брауна. Алгоритм экспоненциального сглаживания Брауна. Выбор оптимального параметра сглаживания. Вызов процедуры экспоненциального сглаживания. Описания диалоговых окон установки параметров (Окно Variables. Диалоговое окно Exponential Smoothing: Statistics. Диалоговое окно Exponential Smoothing: Plots. Диалоговое окно Exponential Smoothing: Output Filter. Диалоговое окно Exponential Smoothing: Save. Диалоговое окно Exponential Smoothing: Options). Вид результатов прогнозирования.
  5. Прогноз по аддитивной модели Винтерса. Вызов модели.Установка параметров модели. Вид результатов прогнозирования.
  6. Модели спектрального анализа. Назначение спектрального анализа. Основные понятия спектрального анализа. Преобразование Фурье. Спектральная плотность. Периодограмма. Кросс-спектральная плотность. Когерентность.
  7. Особенности спектрального анализа в пакете SPSS. Запуск процедуры. Установка параметров. Вид результатов спектрального анализа.
  8. Автокорреляция и кросскорреляция временных рядов. Назначение автокорреляции и кросскорреляции. Вызов процедур автокорреляции и кросскорреляции. Установка параметров процедур. Вид результатов расчета. Основные понятия отчета. Автокорреляционные функции (ACF). Частная автокорреляционная функция (PACF). Таблица оценок коэффициентов. Функция взаимных корреляций (CCF) (кросскорреляция).
  9. Авторегрессионные модели. Назначение. Вызов процедуры. Установка параметров процедуры (Диалоговое окно Variables. Диалоговое окно Statistics. Диалоговое окно Plots. Диалоговое окно Save. Диалоговое окно Options). Подбор авторегрессионной модели. Свойства модели AR(1). Свойства модели AR(2). Вид результатов расчета Авторегрессионная модель первого порядка. Авторегрессионная модель второго порядка.
  10. Дополнительные сведения о порядке авторегрессионной модели. Авторегрессия первого порядка AR(1). Частная автокорреляционная функция (PACF или ЧАКФ). Авторегрессия порядка р — AR(p).
  11. Модели скользящего среднего (МА). Назначение модели скользящего среднего. Вызов процедуры скользящего среднего. Установка параметров процедуры.Вид отчета по расчету модели МА Подбор модели скользящего среднего (MA).
  12. Комбинированные модели ARIMA(p,d,q). Назначение комбинированных моделей ARIMA(p,d,q). Комбинированная стационарная модель ARMA (p, q). Комбинированная нестационарная модель ARIMA (p,d,q). Подбор модели ARMA (p, q). Подбор модели ARIMA (p, d, q). Пример подбора нестационарной комбинированной модели ARIMA (p,d,q). (Проверка и обеспечение стационарности исследуемого ряда. Нахождение параметров модели IMA (0,1,1). Нахождение параметров модели ARMA (1,0,1). Сравнение вида моделей. Оценивание моделей. Диагностическая проверка модели. Ошибка прогноза). Вызов процедуры ARIMA. Установка параметров процедуры. Нахождение параметра дифференцирования. Установка параметров в выбранной модели. Вид отчета по расчетам модели IMA(0, 1, 1).
  13. Модели сезонной декомпозиции. Назначение метода сезонных разностей. Вызов процедуры метод сезонных разностей. Установка параметров процедуры. Вид результатов расчета модели сезонной декомпозиции. Расчет мультипликативной модели. Дополнительные сведения о сезонной декомпозиции (Особенности метода. Недостатки метода. Смешанные разностные операторы. Особенности исходных данных).
  14. Методы интервенции. Назначение методов интервенции. Особенности обработки исходных данных. Типы интервенции. Вид результатов расчета модели интервенции. Проверка качества модели


Литература основная

1. Дубнов П.Ю. Обработка статистической информации с помощью SPSS. М.: NT Press, 2004.

2. Айвазян С.А., Мхитарян В.С., Прикладная статистика и основы эконометрики. –М.: ЮНИТИ, 1998, гл.16.

Литература дополнительная
  1. Макаров А.А., Тюрин Ю.Н. Статистический анализ на компьютере. М., Наука, 1998.

Тема 10. Логистическая регрессия


1. Назначение метода логистической регрессии. Основные понятия логистической регрессии. Вызов процедуры Логистическая регрессия. Установка параметров процедуры (Исследуемые переменные. Выбор метода анализа. Разбивка на блоки. Определение категориальных предикторов. Окно Параметры. Окно Save).

2. Порядок действий. Вид и печать результатов. Кодирование категориальных переменных. Последовательные оценки коэффициентов модели. Классификационная таблица. Переменные в уравнении. Корреляционная матрица. Параметры модели при исключении переменных. Переменные, не включенные в уравнение. Фактическая группировка и прогнозируемые вероятности.


Литература основная

1. Наследов А. SPSS. Компьютерный анализ данныхв психологиии социальных науках. –М:. ПИТЕР, 2007, гл. 24.
    1. Тематика практических занятий:

Практическое занятие 1. Подготовка данных для статистического анализа пакете SPSS




  1. Определение переменных (тип переменной;. метки переменной; метки значений; формат колонок; выравнивание в колонке). Установка пользовательских пропущенных значений
  2. Вставка и удаление наблюдений и переменных
  3. Считывание данных из Excel. Особенности считывания данных в SPSS из Excel.
  4. Объединение двух файлов по наблюдениям.
  5. Отбор части переменных.
  6. Уменьшение исходной таблицы. Отбор части наблюдений.
  7. Агрегирование территориальных данных по регионам.
  8. Разбиение файла по регионам



Практическое занятие 2. Описательные статистики




    1. Описательные статистики.
    2. Проверка на выбросы.
    3. Проверка однородности выборки по среднему.
    4. Критерий однородности дисперсий Ливиня.
    5. Построение гистограммы.
    6. Проверка нормальности с помощью критериев.
    7. Многоуровневые дескриптивные статистики. Пример расчета среднего размера внутреннего долга по регионам. Пример расчета среднего долга по уровню ВНП и по регионам


Практическое занятие 3. Оценки связи между переменными


1. Практика по вычислению корреляции Пирсона

2. Практика по вычислению корреляции Спирмена

3. Практика по вычислению корреляции Кенделла

4. Практика по определению частной корреляции

5. Расчет таблиц сопряженности (crosstabs).

6. Расчет меры риска. Практика расчета мер связи

Практическое занятие 4. Регрессионный анализ



1. Простая линейная регрессия

2. Практика расчета множественной линейной регрессии

3. Практика применения различных методов подбора регрессоров. Таблицы переменных, включенных в модель. Таблица Variables Entered/Removed при методе Forward. Таблица Variables Entered/Removed при методе Stepwise.

4. Таблицы суммарных характеристик модели множественной регрессии. Таблица Model Summary для модели Enter. Таблица Model Summary для модели Forward. Таблица Model Summary для модели Stepwise.

5. Таблицы дисперсионного анализа ANOVA. Таблица ANOVA для модели Enter. Таблица ANOVA для модели Forward. Таблица ANOVA для модели Stepwise.

6. Таблицы коэффициентов модели. Таблица Coefficients при методе Enter. Таблица Coefficients при методе Forward. Таблица Coefficients при методе Stepwise.

7. Таблицы исключенных переменных из модели. Таблица Excluded Variables при выборе метода Enter. Таблица Excluded Variables при выборе метода Forward.

8. Анализ результатов моделей

9. Анализ остатков. Проверка линейности. Проверка сериальности остатков. Проверка остатков на непротиворечие нормальному закону распределения. Проверка на выбросы зависимой и независимых переменных. Проверка остатков на существенность наблюдений. Проверка некоррелированности независимых переменных


Практическое занятие 5. Факторный анализ

  1. Метод главных компонент.
  2. Регрессия на главных факторах. Концепция регрессии на главных факторах.
  3. Построение обобщенного прогноза по частным прогнозам. Подготовка исходных данных. Порядок действий. Вид результатов регрессии на главных факторах (Correlation Matrix. Component Matrix. Component Score Coefficient Matrix)


Практическое занятие 6. Кластерный анализ


1. Кластеризация наблюдений методом К-средних. Порядок действий. Обсуждение результатов (метод К-средних). Устойчивость кластерной структуры. Выводы по устойчивости кластерной структуры

2. Кластеризация наблюдений иерархическим методом. Вызов процедуры иерархической кластеризации. Заполнение параметров процедуры Hierarchical Cluster Analysis. Обсуждение результатов иерархического анализа.

3. Применение иерархического метода кластеризации для классификации регионов России. Исходные данные. Установка параметров иерахической кластеризации. Обсуждение результатоа кластеризации регионов.

4. Кластеризация переменных иерархическим методом. Постановка задачи. Вызов процедуры Установка параметров. Обсуждение результатов.

Практическое занятие 7. Дискриминационный анализ



1. Исходные данные. Постановка задачи нахождения различий между 2-мя группами. Предварительные действия

2. Вызов процедуры Discriminant Analysis. Установка параметров процедуры.

3. Обсуждение результатов. Групповые статистики. Критерии равенства групповых средних. Коэффициенты дискриминантной функции. Линейная дискриминантная функция Фишера. Лямбда Уилкса. Коэффициенты канонической дискриминантной функции. Структурная матрица. Результаты классификации.

4. Практическое разбиение регионов России на 4 группы. Исходные данные. Постановка задачи. Предварительные действия. Вызов процедуры Discriminant Analysis. Установка параметров процедуры. Обсуждение результатов. Валидность наблюдений. Групповые статистики. Объединенные корреляционные матрицы Собственные значения (Eigenvalues). Каноническая корреляция. Лямбда Уилкса. Коэффициенты канонической дискриминантной функции. Структурная матрица. Результаты классификации


Практическое занятие 8-1. Экспоненциальное сглаживание


1. Особенности экспоненциального сглаживания по модели Брауна. Вызов процедуры экспоненциального сглаживания по модели Брауна. Установка параметров процедуры.

2. Обсуждение результатов применения модели Брауна. Суммарные характеристики модели. Прогнозные значения. Автокорреляция и частная автокорреляция остатков. Совмещенный график исходных данных и расчетных с прогнозным участком.

3. Вызов процедуры экспоненциального сглаживания по модели Хольта. Установка параметров в модели Хольта.

4. Обсуждение результатов применения модели Хольта

5. Вычисления прогноза по модели Винтерса. Вызов модели Винтерса.

6. Обсуждение результатов применения модели Винтерса.

7. Затухающая модель (Damped Trend)


Практическое занятие 8-2. Модели спектрального анализа


1. Особенности спектрального анализа в пакете SPSS. Вызов процедуры спектрального анализа. Установка параметров процедуры спектрального анализа.

2. Обсуждение результатов работы процедуры спектрального анализа. Периодограмма и Спектральная плотность. Создание новых переменных, соответствующих периоду, частоте, периодограмме, спектральной плотности и мощности синусоидальных и косинусоидальных составляющих. Сравнение расчетных и исходных значений


Практическое занятие 8-3. Автокорреляционные и авторегрессионные модели временных рядов


1. Автокорреляция. Вызов процедуры автокорреляции. Установка параметров процедуры автокорреляции.

2. Обсуждение результатов работы процедуры Автокорреляция без дифференциализации. Обсуждение результатов работы процедуры Автокорреляция с дифференциализацией. Обсуждение результатов работы процедуры Автокорреляция с трансформацией «Сезонные разности».

3. Кросс-корреляция. Постановка задачи. Вызов процедуры кросс-корреляции. Установка параметров процедуры кросс-корреляции.

4. Обсуждение результатов работы процедуры кросс-корреляции. Обсуждение результатов работы процедуры кросс-корреляции без трансформации данных. Обсуждение результатов работы процедуры кросс-корреляции с трансформацией данных взятием натуральных логарифмов. Обсуждение результатов работы процедуры кросс-корреляции с трансформацией данных дифференцированием. Обсуждение результатов работы процедуры кросс-корреляции с трансформацией данных взятием сезонных разностей.

5. Практика построения модели многомерной авторегрессии. Предварительные действия. Вызов процедуры авторегрессии. Установка параметров процедуры авторегрессии. Обсуждение результатов работы процедуры авторегрессии

6. Авторегрессия одномерного временного ряда. Особенности Авторегрессии одномерного временного ряда. Обсуждение результатов Авторегрессии одномерного временного ряда. Авторегрессия одномерного временного ряда без сезонной компоненты


Практическое занятие 8-4. Модели скользящего среднего


1. Вызов процедуры скользящего среднего. Установка параметров процедуры скользящего среднего.

2. Обсуждение результатов работы процедуры скользящего среднего первого порядка с сезонной компонентой. Обсуждение результатов работы процедуры скользящего среднего второго порядка без сезонной компоненты. Обсуждение результатов работы процедуры скользящего среднего первого порядка без сезонной компоненты.

3. Сравнение результатов расчета по моделям AR и МА


Практическое занятие 8-5. Комбинированные модели ARIMA


1. Модели ARIMA одномерного временного ряда. Вызов процедуры исследования с помощью комбинированных моделей ARIMA.

2. Нахождение порядка модели. Построение авторреляционных функций исходного ряда. Построение авторреляционных функций продифференцированного ряда. Построение авторреляционных функций дважды продифференцированного ряда.

3. Идентификация модели ARIMA.

4. Установка параметров модели ARMA(1,0,1). Обсуждение результатов работы модели ARMA(1,0,1)

5. Построение и анализ модели ARIMA с учетом влияющих признаков (многомерной ARIMA). Вызов процедуры. Установка параметров модели. Обсуждение результатов модели ARIMA (1,1,2)(1,1,1) с учетом влияющих признаков.


Практическое занятие 8-6. Сезонная декомпозиция (метод сезонных разностей)


1. Метод сезонной декомпозиции (сезонных разностей). Вызов процедуры «Метод сезонной декомпозиции». Установка параметров процедуры аддитивной сезонной декомпозиции.

2. Обсуждение результатов процедуры аддитивная сезонная декомпозиция.

3. Обсуждение результатов процедуры мультипликативная сезонная декомпозиция


Практическое занятие 8-7. Методы интервенции


1. Методы интервенции. Предварительные действия. Установки модели ARIMA(0,1,1

2. Обсуждение результатов расчета модели интервенции

3. Проверка качества модели


Практическое занятие 9. Логистическая регрессия


1. Предварительные действия с исходными данными.

2. Вызов процедуры «Логистическая регрессия». Установка параметров процедуры логистической регрессии. Исследуемые переменные

3. Обсуждение результатов. Критерии адекватности модели. Классификационная таблица. Переменные в уравнении. Корреляционная матрица. Переменные, не включенные в уравнение. Фактическая группировка и прогнозируемые вероятности.


IV. Цель написания письменных работ (эссе)


В эссе в рамках выбранной предметной области студенты должны последовательно описать фрагменты выполненных этапов построения модели статистическими методами:

1. Идентификация проблемной области

Характеристика проблемной области проводится в следующих аспектах:
  • сфера применения: < уточненная тема работы, пользователи >;
  • класс решаемых проблем: < (анализ), диагностика, прогнозирование, проектирование, планирование и т.д.>
  • цель: < имя целевой переменной >;
  • ожидаемые результаты: < гипотезы - список возможных значений цели >;
  • исходные данные (факторы): < список имен переменных >;
  • особенности решения задач: < особенности исходных данных, длина временного ряда, наличие пропущенных значений и т.д.>.

2. Предварительная обработка исходных данных

В эссе приводятся способы доступа к исходным данным, определяются типы переменных в исходных данных, их необходимые преобразования для применения статистических методов.

3. Применение статистических методов

Обосновывается перечень применяемых пакетов прикладных программ и методов для реализации поставленных задач. Приводятся распечатки найденных закономерностей и правил при применении статистических методов. Сравниваются результаты, полученные различными методами, и делаются выводы. При необходимости проводится углубленный анализ моделей.

4. Выводы по достижению поставленных целей

В эссе делаются содержательные выводы по полученным статистическим моделям и другим способам углубленного анализа.


Основной темой эссе является «Статистический анализ данных (допускаются: анализ Web – информации) для конкретных предметных областей». Эссе данной группы могут быть выполнены для любой предметной области. Например:

Области деятельности:
  • медицина,
  • табачные изделия,
  • ювелирные изделия,
  • торговля,
  • и т.д.

В реферате нужно с помощью пакета SPSS:
    1. провести проверку предпосылок для применения математических методов прогнозирования:
        • анализ выбросов.
        • проверка однородности дисперсии в группах.
        • проверка однородности средних.
        • проверить о непротиворечии нормальности распределения данных.
        • построить корреляционную матрицу с целью обнаружения мультиколлинеарности,
        • провести кросс-корреляцию между несколькими переменными с целью нахождения лагов,
        • построить новые переменные с лагами,
  1. построить модель, позволяющую предсказывать значение зависимой переменной по известным значениям независимых,
  2. построить прогнозы по одномерным временным рядам методами:
  • Брауна,
  • Хольта,
  • Винтерса,
  • авторегрессии,
  • скользящего среднего,
  • сезонной декомпозиции,
  • комбинированной моделью ARIMA.
  1. построить обобщенный прогноз с помощью регрессии на главных факторах (факторный анализ),
  2. оценить адекватность модели.


V. Примерный перечень вопросов для оценки качества освоения учебного курса

  1. Частотное распределение. Гистограмма.
  2. Различные варианты графического представления результатов статистической выборки.
  3. Числовые характеристики "типичного" значения для совокупности данных: среднее значение, медиана, мода, взвешенное среднее.
  4. Меры разброса данных: дисперсия, стандартное отклонение, коэффициент вариации.
  5. Различие числовых характеристик для статистической выборки и генеральной совокупности. Понятие о статистических оценках параметров генеральной совокупности по статистической выборке
  6. Математическое ожидание и дисперсия непрерывной случайной величины.
  7. Нормальное распределение и его параметры. Интеграл вероятностей.
  8. Доверительные интервалы. Оценки вероятности, математического ожидания и дисперсии случайной величины, t-распределение
  9. Понятие о статистической гипотезе и процедуре ее проверки. Нуль-гипотеза и альтернативная гипотеза.
  10. Критерий согласия при проверке статистической гипотезы.
  11. Уровень значимости при проверке статистической гипотезы.
  12. Проверка гипотез о вероятности и среднем для одной генеральной совокупности.
  13. Сравнение параметров двух генеральных совокупностей: независимые выборки и парные наблюдения
  14. Исследование взаимосвязи качественных признаков
  15. Детерминированные, статистические и корреляционные связи.
  16. Проверка гипотезы о корреляционной связи на основе 2- критерия Пирсона.
  17. Регрессии и их основные свойства.
  18. Простая линейная регрессия.
  19. Проверка статистических гипотез об адекватности регрессии.
  20. Проверка статистических гипотез о значимости коэффициентов регрессии
  21. Многомерные регрессии. Оценки параметров
  22. Проверка статистических гипотез для многомерных регрессий
  23. Анализ временных зависимостей показателей. Дрейф. Периодические, сезонные и случайные составляющие
  24. Понятие об автокорреляции. Проблема автокорреляции в регрессионном анализе временных рядов данных. Обнаружение автокорреляции. Тест Дарбина-Ватсона. Пути преодоления проблемы автокорреляции.
  25. Предпосылки для применения метода МНК в регрессионном анализе.
  26. Непараметрическая линейная регрессия. Коэффициент ранговой корреляции Спирмена.
  27. Непараметрическая линейная регрессия. Коэффициент ранговой корреляции Кенделла.
  28. . Критерий F-Фишера проверки адекватности регрессионной модели.
  29. Применение коэффициента ассоциации для измерения тесноты связи.
  30. Индексный метод анализа социальной информации.
  31. Критерий выявления выбросов в наблюдениях
  32. Расчет критерия согласия Лямда Смирнова- Колмогорова.
  33. Явление мультиколлинеарности во множественной регрессии.
  34. Лаги во временных рядах.
  35. Задачи и область применения факторного анализа.
  36. Характеристика метода главных компонент в факторном анализе.
  37. Методы кластерного анализа.
  38. Дендрограмма и ее анализ.
  39. Область применения метода анализа временных рядов «Интервенция».
  40. Пояснение результатов, полученных дискриминационным анализом.
  41. Каким образом работает алгоритм метода «Интервенция».
  42. Чем различаются методы экспоненциального сглаживания между собой?
  43. Какие правила Вы знаете подбора порядка и типа комбинированной модели ARIMA?
  44. Поясните суть метода спектрального анализа.
  45. Расскажите об авторегрессионных моделях.
  46. Поясните методы скользящего среднего.
  47. В чем отличие множественной регрессии от логистической?
  48. Расскажите о регрессии на главных факторах.
  49. В чем различия агломеративных и дивизивных методов кластерного анализа?
  50. Сходства и различия методов факторного и кластерного анализов.




1 "SOFTWARE DIGEST (Ratings Report)", vol.8, number 5, 2005. The Independent Comparative Ratings Report for Selecting IBM PC Business Software. 13