Программа дисциплины сдм. В. 01. Методы анализа данных направления
Вид материала | Программа дисциплины |
- Программа дисциплины Методы анализа зависимостей в анализе данных (эконометрический, 343.12kb.
- Программа дисциплины Статистические и демографические методы анализа для направления, 238.41kb.
- Программа дисциплины «Компьютерные методы анализа социологических данных (введение, 411.94kb.
- Программа дисциплины "Базовые методы анализа данных и работа со статистическими пакетами", 391.27kb.
- Программа дисциплины «Методы анализа и обработки данных» для направления 081100., 181.62kb.
- Программа дисциплины «Методы анализа латентных признаков» для направления 040200., 268.76kb.
- Программа дисциплины «Современные методы анализа данных» для направления 040100., 284.82kb.
- Программа дисциплины «Современные методы анализа данных» для направления 040100., 358.86kb.
- Программа дисциплины сдм. Ф современные методы надежности, безопасности и живучести, 103.36kb.
- Программа дисциплины сдм. Ф современные теоретические представления и математические, 102.78kb.
Министерство образования и науки Российской Федерации
Федеральное агентство по образованию
ОБНИНСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ АТОМНОЙ ЭНЕРГЕТИКИ (ИАТЭ)
| УТВЕРЖДАЮ |
| Проректор по учебной работе ___________________ С.Б. Бурухин |
| «______»____________ 200__ г. |
^ ПРОГРАММА ДИСЦИПЛИНЫ
СДМ.В.01. МЕТОДЫ АНАЛИЗА ДАННЫХ
направления 230100 – Информатика и вычислительная техника
Форма обучения: очная
Объем дисциплины и виды учебной работы в соответствии с учебным планом
Вид учебной работы | Всего часов | Семестры | |
9 | А | ||
Общая трудоемкость дисциплины | 200 | 140 | 140 |
Аудиторные занятия | 68 | 34 | 34 |
Лекции | 34 | 17 | 17 |
Практические занятия и семинары | 34 | 17 | 17 |
Лабораторные работы | – | – | – |
Курсовой проект (работа) | – | – | – |
Самостоятельная работа | 132 | 66 | 66 |
Расчетно-графические работы | – | – | – |
Вид итогового контроля (зачет, экзамен) | Зач., Экз. | Зач. | Экз. |
Обнинск 2008
Программа составлена с соответствии с Государственным образовательным стандартом высшего профессионального образования по направлению подготовки 552800 Информатика и вычислительная техника (№ 36 тех/маг от 13.03.2000)
Программу составили:
___________________ А.М. Стерин, д.т.н., профессор
Программа рассмотрена на заседании кафедры АСУ (протокол № 6-у от 25.01.2008 г.)
Заведующий кафедрой АСУ
___________________ А.Н. Анохин
«____»_____________ 200__ г.
СОГЛАСОВАНО
Начальник учебно-методического управления ___________________ Ю.Д. Соколова | Декан факультета кибернетики ___________________ А.В. Антонов «____»_____________ 200__ г. |
^ 1. Цели и задачи дисциплины
Ознакомление специалистов с методами статистической обработки и анализа данных, в том числе с помощью методов, ранее изученных в курсе математической статистики, обучение представлению аналитической информации, практическим приемам анализа данных на ПЭВМ
^ 2. Требования к уровню освоения содержания дисциплины
В результате изучения дисциплины студент должен
знать:
основные этапы применения ИТ в анализе данных;
методы доступа к данным в различных форматах и стандартах;
основные операции по управлению данными;
методы анализа данных и их реализацию на ПЭВМ;
в том числе:
элементарные статистические расчеты и оценки;
проверка статистических гипотез;
понятия об устойчивых статистических методах оценивания;
виды распределений случайной величины;
оценки связи между несколькими случайными величинами;
регрессионные методы, в том числе пошаговая регрессия;
графическое представление свойств случайных величин и его реализация на ПЭВМ;
методы многомерной статистики;
кластерный и дискриминантный анализ;
понятия анализа временных рядов;
модели временных рядов;
анализ таблиц, анализ соответствий;
анализ выживаемости;
регрессионные модели выживаемости, модель пропорциональных рисков (модель Кокса).
основные программные средства статистического анализа данных на ПЭВМ;
типы информационных продуктов для представления информации, полученной на основе анализа данных (графики, отчеты, табличные материалы).
уметь:
работать в среде программных средств статистики и анализа данных, в том числе англоязычных;
обеспечить доступ к данным, представленным во внешних форматах, импортировать данные из стандартных форматов;
применять методы анализа данных на ПЭВМ на практике;
давать качественную интерпретацию результатов, полученных в ходе анализа данных;
ориентироваться и осваивать новые программные средства анализа данных и представления информации.
иметь навыки:
работы на ПЭВМ;
манипуляций со стандартными графическими форматами файлов;
пользования системами помощи и подсказки в эксплуатируемых программных продуктах, в том числе англоязычных.
Входные дисциплины: Теория вероятностей и математическая статистика
Выходные дисциплины: Современные проблемы информатики и вычислительной техники.
^ 3. Содержание дисциплины
3.1. Лекции
Номер темы | Тема | Число часов |
1 | Вводный раздел | 2 |
2 | Этапы информационных технологий для получения аналитико-статистической информации | 2 |
3 | Доступ к данным | 2 |
4 | Управление данными | 2 |
5 | Элементарные статистики | 2 |
6 | Статистические график | 2 |
7 | Корреляционный анализ | 3 |
8 | Регрессионный анализ | 4 |
9 | Задачи оптимальной группировки параметров и объектов, их двойственность | 3 |
10 | Задача оптимальной группировки параметров | 3 |
11 | Временные ряды | 4 |
12 | Анализ таблиц | 1,5 |
13 | Анализ выживаемости | 3 |
14 | Заключительные замечания | 0,5 |
1. ^ Вводный раздел. Задачи курса. Содержимое курса. Рекомендации по литературе и программному обеспечению. Перечень известных средств ПО анализа данных.
2. Этапы информационных технологий для получения аналитико-статистической информации. Представление данных в виде прямоугольных таблиц. Терминология. Отличие от таблиц EXCEL.
3. Доступ к данным. Импорт данных. Стандарты входных данных.
4. Управление данными. Основные операции по управлению, манипуляции данными. Обработка пропусков данных.
5. Элементарные статистики. Элементарные статистики способы их вычисления на ПЭВМ. Интерпретация элементарных статистик. Распределения случайных величин. Характеристики распределений.
6. Статистические графики. Типы графиков. Двумерные и трехмерные графики. Матричные графики. Специальные виды графического представления данных. Работа с графиками в статистических пакетах.
7. ^ Корреляционный анализ. Корреляционный анализ, особенности его реализации на ПЭВМ. Проблема пропусков данных. Частные корреляции. Непараметрические меры связи между переменными. Ранговые корреляции. Проверка гипотез. Критерий Стьюдента. Критерий хи-квадрат. Реализация проверки гипотез в статистических пакетах.
8. ^ Регрессионный анализ. Регрессионный анализ его реализация на ПЭВМ. Терминология регрессионного анализа. Критерии качества регрессии. Примеры регрессионного анализа данных об окружающей среде. Нелинейный регрессионный анализ. Пошаговая регрессия. Нахождение оптимума между длиной выборки и сложностью статистической модели.
9. ^ Задачи оптимальной группировки параметров и объектов, их двойственность. Задача оптимальной группировки объектов. Дискриминантный анализ. Кластерный анализ, отличие задач дискриминантного и кластерного анализа. Задача о классификации Ириса Фишера, особенности ее решения в разных постановках.
10. ^ Задача оптимальной группировки параметров. Метод главных компонент. Методы факторного анализа. Реализация факторного анализа на ПЭВМ. Особенности выходных результатов. Интерпретация выходных результатов факторного анализа.
11. ^ Временные ряды. Основные понятия, примеры. Тренд, цикличность, сезонность. Понятия стационарности временного ряда. Автокорреляции. Коррелограммы. Понятия статистических моделей временных рядов. Модели авторегрессии. Модели скользящего среднего. Спектральный анализ и его реализация на ПЭВМ.
12. ^ Анализ таблиц. Таблицы сопряженности. Структура таблиц сопряженности. Анализ соответствий, его терминология, аналогия с факторным анализом.
13. Анализ выживаемости. Особенности структуры данных о выживаемости. Цензурированные наблюдения за выживаемостью. Метод Каплана-Мейера. Регрессионные модели выживаемости. Модель пропорциональных рисков (модель Кокса).
14. Заключительные замечания.
^ 3.2. Практические и семинарские занятия
Раздел(ы) | Тема практического или семинарского занятия | Число часов |
3-4 | Основные понятия представления данных в виде прямоугольных таблиц. Терминология. Доступ к данным. Управление данными. Импорт-экспорт данных. | 5 |
5-6 | Элементарные статистики. Статистические графики. Двумерные и трехмерные графики. Управление отображением графиков в статистических пакетах. Практические навыки построения и редактирования графиков. | 4 |
7 | Корреляционный анализ, особенности его реализации на ПЭВМ. Проблема пропусков данных | 2 |
7 | Реализация проверки гипотез в статистических пакетах | 2 |
8 | Регрессионный анализ его реализация на ПЭВМ. Терминология регрессионного анализа | 3,5 |
9 | Задачи оптимальной группировки параметров и объектов, их двойственность | 0,5 |
9 | Дискриминантный анализ. Кластерный анализ, отличие задач дискриминантного и кластерного анализа. Задача о классификации Ириса Фишера, особенности ее решения в разных постановках. Интерпретация результатов дискриминантного и кластерного анализа. | 5 |
10 | Реализация факторного анализа на ПЭВМ. Терминология факторного анализа | 3 |
11 | Анализ временных рядов. Спектральный анализ и его реализация на ПЭВМ. Задача о числах Вольфа (11-летний цикл солнечной активности) | 2 |
12 | Таблицы сопряженности. Структура таблиц сопряженности. Анализ соответствий, его терминология, аналогия с факторным анализом. Примеры анализа таблиц сопряженности для качественных переменных. | 2 |
13 | Анализ выживаемости. Особенности структуры данных о выживаемости. Цензурированные наблюдения за выживаемостью. Метод Каплана-Мейера. Регрессионные модели выживаемости. Модель пропорциональных рисков (модель Кокса) | 5 |
^ 3.3. Лабораторный практикум – не предусмотрен
3.4. Курсовые проекты (работы) – не предусмотрены.
3.5. Формы текущего контроля
Раздел(ы) | Форма контроля | Семестр | Неделя |
1-7 | расчетно-графическая работа | 9 | 12 |
8-14 | расчетно-графическая работа | А | 12 |
^ 3.6. Самостоятельная работа
Студентами самостоятельно дополнительно изучается пройденный на лекциях и практических занятиях материал.
Содержание самостоятельной работы | Литература | Объем, час. | Форма контроля |
Разделы 1-7 | 1-4 | 66 | Используется при выполнении расчетно-графической работы и контролируется при ее сдаче |
Разделы 8-14 | 1-4 | 66 |
^ 4.1. Рекомендуемая литература
4.1.1. Основная литература
1. Боровиков В.П. STATISTICA: искусство анализа данных на компьютере. Для профессионалов. – СПб.: Питер, 2001. – 656 с.
2. Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере. Под ред. В.Э. Фигурнова. – М.: Инфра М, 1998 – 528 с.
3. Реброва О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA. – М.: Медиа Сфера Москва, 2006. – 305 с.
4. Боровиков В.П. Программа STATISTICA для студентов и инженеров. - М.: Компьютер Пресс, 2001.
^ 4.1.2. Дополнительная литература
1. Брандт Э. Статистические методы анализа наблюдений. – М.: Мир, 1975.
2. Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. –М.: Мир, 1982.
3. Вапник В.Н. Восстановление зависимостей по эмпирическим данным. – М.: Наука, Главная редакция физико-математической литературы, 1979. – 447 с.
4. Бендат Дж., Пирсол А. Прикладной анализ случайных данных. – М.: Мир, 1989. – 540 с.
5. Пугачев В.С. Теория вероятностей и математическая статистика. – М.: Физматлит, 1979. – 496 с.
4.2. Средства обеспечения освоения дисциплины
Компьютерные презентации
5. Материально-техническое обеспечение дисциплины
ПЭВМ (желательно ноутбук), мультимедиа проектор и экран.