Рабочая программа По дисциплине «Интеллектуальные информационные системы» По специальности 230201. 65 Информационные системы и технологии

Вид материалаРабочая программа

Содержание


Индекс по учебному плану
Форма Обучения
16 мая 2011г., протокол № 9
Интеллектуальные информационные системы
Форма Обучения
Цели и задачи дисциплины, требования к знаниям и умениям
Частные цели
Построения математических моделей для решения задач кластеризации и классификации, задач построения регрессионных моделей в вопр
2. Содержание дисциплины
Раздел 2. Архитектурные особенности ИИС.
Раздел 3. Статистические модели данных.
Раздел 4. Классификация данных.
Раздел . 5. Кластеризация данных.
Раздел 6. Множественная регрессия и временные ряды.
Раздел 7. Генетические алгоритмы и искусственные нейронные сети
Раздел 8. Решения с использованием баз данных.
Раздел 9. Стандарты в области разработки систем дэйта-майнинга.
Знакомство с GUI интерфейсом библиотеки data mining алгоритмов
Наименование тем, разделов
3. Учебно-методические материалы по дисциплине
...
Полное содержание
Подобный материал:



МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ

РОССИЙСКОЙ ФЕДЕРАЦИИ





Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

«МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПЕЧАТИ

имени Ивана Федорова»


УТВЕРЖДАЮ

Т.В. Маркелова

« 23 » июня 2011 г.


рабочая программа




По дисциплине «Интеллектуальные информационные системы»

По специальности 230201.65 - Информационные системы и технологии

Факультет Информационных технологий и медиасистем

Кафедра Информационных систем


^ Индекс по учебному плану

Цикл

Компонент

Федеральный

Национально-региональный (вузовский)

Элективный

СД.04

Общие гуманитарные и социально-экономические дисциплины










Общие математические и естественнонаучные дисциплины










Общепрофессиональные дисциплины










Специальные дисциплины

х







Дисциплины специализации













^ Форма

Обучения

курс

семестр

Трудоемкость дисциплины в часах

Форма

итогового

контроля

Всего часов

Аудиторных часов

Лекции

Семинарские (практически) занятия

Лабораторные занятия

Курсовая

Работа

Курсовой проект

Самостоятельная работа

Очная

4

7

102

54

36




18







48

экзамен


Москва — 2011 г.


Составитель: д.т.н., профессор А.А. Марков

Рецензент: ____________


Рабочая программа обсуждена на заседании кафедры «Информационные системы»

^ 16 мая 2011г., протокол № 9


Зав. кафедрой ____________________/А.А. Марков/


Одобрена УС факультета «Информационных технологий и медиасистем»

17 мая 2011г., протокол № 9


Председатель______________________/А.Е. Иванова/


^ ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ


составитель: д.т.н., профессор А.А. Марков



^ Форма

Обучения

курс

семестр

Трудоемкость дисциплины в часах

Форма

итогового

контроля

Всего часов

Аудиторных часов

Лекции

Семинарские (практически) занятия

Лабораторные занятия

Курсовая

Работа

Курсовой проект

Самостоятельная работа

Очная

4

7

102

54

36




18







48

экзамен



  1. ^ ЦЕЛИ И ЗАДАЧИ ДИСЦИПЛИНЫ, ТРЕБОВАНИЯ К ЗНАНИЯМ И УМЕНИЯМ



    1. Цель и задачи изучения дисциплины


Целью преподавания дисциплины “Интеллектуальные информационные системы” является обучение студентов методам использования современных математических методов и моделей анализа данных в современных информационных системах.


^ Частные цели обучение практическим методам использования современного программного обеспечения для целей анализа данных.


Основной задачей изучения дисциплины является овладение методами:
  • ^ Построения математических моделей для решения задач кластеризации и классификации, задач построения регрессионных моделей в вопросах анализа процессов.
  • Применения математических моделей для анализа бизнес-процессов
  • Применения математических моделей для решения задач OLAP и Data Mining
  • Построения информационных систем, использующих хранилища и витрины даны
  • Создания систем аналитической обработки информации.


1.2. Требования к знаниям и умениям


В результате изучения дисциплины студенты должны

знать:
  • общую характеристику процесса проектирования интеллектуальных информационных систем
  • структуру и архитектуру современных ИИС
  • основные отличия между базами и хранилищами данных
  • требования к системам аналитической обработки информации
  • методы построения систем, использующих технологии Data Mining
  • структуру ИИС, структуру программных модулей; алгоритмы и стандарты Data Mining;
  • управление проектом создания ИИС; проектную документацию;
  • методы, используемые в современном ПО для решения задач  Business Intelligence, Data Warehousing, Data Mart, OLAP и Data Mining



уметь:
  • использовать современные библиотеки программ (gsl, R);
  • пользоваться технической документацией современного ПО (MS SQL, Oracle, MySQL)
  • использовать стандартные   библиотеки (Xelopes).


1.3. Перечень дисциплин с указанием разделов (тем), усвоение которых студентам необходимо для изучения данной дисциплины.

  1. Математика: математическая логика, дифференциальное и интегральное исчисление, дифференциальные уравнения, векторный анализ, функции комплексного переменного, случайные процессы.
  2. Основы программирования.
  3. Информатика: Основы построения алгоритмов.
  4. Дискретная математика.



^ 2. СОДЕРЖАНИЕ ДИСЦИПЛИНЫ


2.1. Наименование тем, их содержание, объем в часах.


п/п

Наименование тем, разделов

Общая трудоемкость

(часов)

Аудиторные занятия

(всего часов)

Лекции

Практические занятия

(семинары)

Лабораторные занятия

1

Предмет и задачи курса

4

4







2

Архитектурные особенности ИИС

4

4







3

Статистические модели данных

4

4







4

Классификация данных

8

4




4

5

Кластеризация данных

8

4




4

6

Множественная линейная регрессия и временные ряды.

Предсказательные модели

8

4




4

7

Генетические алгоритмы и искусственные нейронные сети для

решения задач анализа данных

8

4




4

8

Решения с использованием баз данных

4

4







9

Стандарты в области разработки систем дэйта-майнинга

6

4




2




итого

54

36




18



2.2. Содержание тем и разделов дисциплины.


Раздел 1. Предмет и задачи курса

Введение. Определения процесса проектирования. Основные этапы и стадии проектирования ИИС. Основные компоненты ИИС. ИИС и базы данных. Структура и архитектура систем. Основные этапы развития ИИС.


^ Раздел 2. Архитектурные особенности ИИС.

Системы, ориентированные на обработку транзакций. OLAP системы. Архитектура систем, использующих хранилища данных. Использование дэйта-майнинга.


^ Раздел 3. Статистические модели данных.

Визуализация и анализ данных. Статистические оценки данных. Использование табличных процессоров для решения задач визуализации. Корреляция и регрессия. Определение коэффициента корреляции. Интерпретация зависимости данных по значению коэффициента корреляции. Алгоритм построения корреляционной матрицы Метод наименьших квадратов. Статистические оценки точности математических моделей данных. Использование табличных процессоров для решения задач анализа.


^ Раздел 4. Классификация данных.

Классификация данных. Использование регрессионных моделей. Построение моделей. Использование R для построения и анализа моделей данных. Основы R. Векторы и векторизация функций. Факторы и кросс-факторизация. Массивы и матрицы. Решение СЛАУ в R. Визуализация данных и построение моделей.  Примеры задач.


^ Раздел . 5. Кластеризация данных.

Кластеризация данных. Построение моделей. Деревья решений. Метод покрытия. Самоорганизующиеся карты Кохонена. Идея метода. Обобщенный алгоритм построения. Использование R для решения задач кластеризации. Задача о физиках и лириках.


^ Раздел 6. Множественная регрессия и временные ряды.

Предсказательные модели.

Многомерные линейные модели. Многовариантный анализ. Метод наименьших квадратов для построения полиномиальных моделей данных. Факторный анализ. Метод скользящего среднего. Алгоритм анализа временных рядов. Использование метода скользящего среднего для построения предсказательных моделей. Задачи. Многомерные линейные и полиномиальные регрессионные модели для решения задач прогноза и предсказания


^ Раздел 7. Генетические алгоритмы и искусственные нейронные сети

для решения задач анализа данных.

Основные понятия теории сложности и трудоемкость решения дискретных задач оптимизации. Эволюционные вычисления – биологические аналогии генетических алгоритмов. Основные шаги генетических алгоритмов: селекция, рекомбинация, мутация. Искусственные нейронные сети. Архитектура нейронных сетей. Вычислительные возможности ИНС. Алгоритмы обучения ИНС. Модели back propagation. Гибридные системы.


^ Раздел 8. Решения с использованием баз данных.

Построение хранилищ данных и информационных витрин. Очистка данных. Оперативные источники информации. Интеграция информационных источников. Возможности современных СУБД по созданию систем DATA Warehousing, Data Mart, Business Intelligence. Решения ORACLE.


^ Раздел 9. Стандарты в области разработки систем дэйта-майнинга.


CWM — спецификация стандарта организации хранилищ данных CWM. PMML — спецификация стандарта записи моделей Data Mining в виде xml. CRISP — спецификация методологии разработки систем Data Mining. Свободно распространяемые библиотеки построения систем.


2.3. Лабораторные занятия, их наименование и объем в часах.


№ п/п

Наименование лабораторных работ

№ раздела

дисциплины

Кол-во

час

1
^

Знакомство с GUI интерфейсом библиотеки data mining алгоритмов


9

2

2

Выполнение анализа данных методами data mining

4

4

3

Создание программ анализа данных с использованием алгоритмов data mining

5

4

4

Реализация алгоритмов построения unsupervised моделей

6

4

5

Реализация алгоритмов построения supervised моделей

7

4


2.4. Курсовой проект (работа), его характеристика


Не предусматривается.


2.5. Организация самостоятельной работы





^ Наименование тем, разделов

Виды и формы самостоятельной работы *

(распределение часов по формам обучения)

Подготовка к практическому (семинару, лаб. Работе)

Подготовка рефератов (докладов, сообщений и информационных материалов т.п.)

Выполнение домашних контрольных и иных заданий)

Подготовка к промежуточной аттестационной работе (в т.ч. коллоквиум, тестированием и пр.)

Подготовка к зачету

(экзамену)

Очная

Очно-заочная

заочная

очная

Очно-заочная

заочная

очная

Очно-заочная

заочная

очная

Очно-заочная

заочная

очная

Очно-заочная

заочная




Введение Тема 1.




























2







1










Тема 2.




























2







2










Тема 3.




























2







2










Тема 4.

3

























2







2










Тема 5.

3

























2







2










Тема 6.

3

























2







2










Тема 7.

3

























2







2










Тема 8.




























2







2










Тема 9.

1

























2







2










ИТОГО

13

























18







17







* могут быть предложены иные формы СРС


^ 3. УЧЕБНО-МЕТОДИЧЕСКИЕ МАТЕРИАЛЫ ПО ДИСЦИПЛИНЕ


3.1. Литература.

основная

  1. Барсегян и др. Методы и модели анализа данных: OLAP и DATA Mining. СПБ-Бхв 2004, -336с+CD
  2. Рассел, Норвиг. Искусственный интеллект. Современный подход. Пер. с англ.- Издательский дом Вильямс, 2006-1407 с.


дополнительная


  1. Дюк, Самойленко. DATA MINING. СПб.: Питер, 2001-368 с.
  2. Винстон Л. Microsoft Excel. Анализ данных и построение бизнес-моделей. Пер. с англ.- Издательско-торговый дом «Русская редакция». 2005. -576с.
  3. Сигел Э.Ф. Практическая бизнес статистика. 4-е изд. Пер. с англ.- М.: Издательский дом Вильямс. М. 2002. -1056с.
  4. Luis Torgo. Data Mining with R: learning by case studies. LIACC-FEP. University of Porto. R. Campo Alegre. 2003.—119p.
  5. Mueller, J.A., Lemke, F.: Self-Organizing Data Mining. Libri, Hamburg, 2000, ISBN: 3-89811-861-4



3.2. Перечень наглядных и других пособий, методических указаний по проведению конкретных видов учебных занятий, а также методических материалов к используемым в учебном процессе техническим средствам.


Презентационный комплекс (электронный вид формат pps, печатный раздаточный материал).

Комплекс технических средств, позволяющих проецировать изображение из программ подготовки презентаций (экран, проектор, Notebook).

Возможности доступа в Internet.

Программная система Excel, MySQL, Oracle 10gXE.

Программа R.


Материально-техническое обеспечение дисциплины.


Компьютерный класс, включающий 20 компьютеров IBM PC

или 20 компьютеров Apple Macintosh.