Программа дисциплины "Математический анализ данных в менеджменте: информационные структуры и рациональные решения" для направления 521500 Менеджмент

Вид материалаПрограмма дисциплины
Подобный материал:

Программа дисциплины


"Математический анализ данных в менеджменте:

информационные структуры и рациональные решения"

для направления 521500 – Менеджмент

(второй уровень высшего профессионального образования – бакалавриат)


Пояснительная записка


Автор программы: д.ф.-м.н., профессор Самыловский А.И.

Требования к студентам: Учебная дисциплина "Математический анализ данных в менеджменте … " (5-й семестр) использует материал предшествующих ей дисциплин "Алгебра и анализ" (1-й – 2-й семестры), "Теория вероятностей и математическая статистика" (3-й семестр), "Исследование операций" (4-й семестр) учебного плана факультета Менеджмента. Дисциплина является логическим продолжением и, в значительной степени, модельным прикладным завершением изучения студентами бакалавриата факультета Менеджмента математической компоненты своего профессионального образования.

Аннотация: Учебная дисциплина "Математический анализ данных в менеджменте … " является, прежде всего, менеджериальным профессионально-прикладным продолжением дисциплины "Теория вероятностей и математическая статистика", включая в себя разделы информационно-алгоритмического содержания, конкретизирующие многие общематематические методологические разделы предыдущей дисциплины. В определенном смысле указанные две дисциплины образуют последовательность: "Анализ данных – 1 (математическая теория и методы)" и "Анализ данных – 2 (математические методы и алгоритмы)". Отметим, что в учебном плане факультета Менеджмента на старших курсах присутствует и то, что следует трактовать как "Анализ данных – 3 (методы сбора и обработки)". Таким образом, студенты бакалавриата факультета Менеджмента имеют вполне законченный университетский учебный цикл по анализу данных – основному своему рабочему математическому инструментарию, во многом инвариантному по отношению к различным предметным профессиональным областям факультета Менеджмента. При рассмотрении в курсе конкретных математических моделей и методов главное внимание уделяется их применению в социально-экономическом анализе, оперированию с данными именно социально-экономической природы. Обширная часть списка литературы, приведенная для углубленного изучения научной области "Анализ данных", поможет студентам, осваивающим и создающим свой профессиональный исследовательский инструментарий.

Учебная задача курса: Курс является ключевым в цикле ЕН.00 математических дисциплин для формирования у студентов навыков системной аналитики. Материал курса предназначен, прежде всего, для дальнейшего использования и развития в специальных областях менеджмента – таких как стратегическое управление, маркетинг, инвестиционный и финансовый менеджмент, логистика, управление человеческими ресурсами, управленческое консультирование и др. Актуальной практической задачей дисциплины является подведение студентов к творческому профессиональному восприятию последующих специальных дисциплин, явно или неявно связанных с подготовкой, анализом, принятием, реализацией, оцениванием последствий, корректировкой решений, обеспечивающих целенаправленное развитие (в том числе (но не только!) – оптимальное). У студентов должно сформироваться ощущение и понимание того, что собственно принятие решения (а тем более – претендующего на оптимальность) есть лишь один элемент конструктивной парадигмы анализа данных. Последняя же существует в гораздо более широком контексте того, что составляет существо парадигмы: математическое моделирование, эксплуатация систем информационной, ситуационной, модельной, алгоритмической поддержки процессов выработки социально-экономических решений.

Формы контроля: По курсу предусмотрены две контрольных работы и одно эссе как формы промежуточного контроля (возможно также проведение тестирования во внеаудиторное время). Форма итогового контроля – экзамен.


Тематический расчет часов


№ раздела

Название раздела

Кол-во часов:

Лек. + сем.

1

Введение: природа социально-экономической информации, математические информационные структуры и рациональные решения

2 + 2

2

Методы проверки статистических гипотез: критерии значимости в анализе данных

4 + 4

3

Методы принятия решений в условиях неопределенности: элементы теории статистических решений

6 + 6

4

Методы исследования взаимосвязей и зависимостей в анализе данных

6 + 6

5

Методы структурного анализа данных

8 + 8

6

Модели вероятностных процессов в задачах анализа данных и прогнозирования

8 + 8


Всего часов: 34 + 34


Содержание программы


Раздел 1. Введение: природа социально-экономической информации, математические информационные структуры и рациональные решения.


Системный обзор проблематики, рассматриваемой в учебной дисциплине. Место учебной дисциплины в содержании математической компоненты профессиональной подготовки студентов факультета Менеджмента. Общематематические, проблемно-ориентированные и профессиональнол-прикладные аспекты проблематики математического анализа данных. Графики, диаграммы, таблицы в математическом анализе социально-экономических данных. Содержательные примеры социально-экономического моделирования и проблемы адекватности модели, планирования исследования, репрезентативности выборки, обработки данных, подготовки решений и др.


Раздел 2. Методы проверки статистических гипотез: критерии значимости в анализе данных.


Обзор основных понятий, структур и задач математической статистики, используемых в анализе социально-экономических явлений.

Проверка гипотез в критериях значимости. Свойства точечных оценок; информационное неравенство Крамера – Рао и свойство эффективности; свойство достаточности относительно оцениваемого параметра. Асимптотическая ситуация ("большая" выборка) и ситуация недостаточного числа наблюдений ("малая" выборка). Уровень значимости как вероятность ошибки первого рода.

Непараметрическое оценивание законов распределения и квантилей при малых выборках. Элементы аппарата порядковых статистик, долей и блоков выборки.

Критерий согласия "омега-квадрат". Порядковые критерии однородности: критерий Н.В.Смирнова, критерий знаков (биномиальный), критерий Уилкоксона (Манна – Уитни), критерий "Х". Критерии Бартлета и Кочрена равенства нескольких дисперсий. Критерии Пирсона и Фишера равенства нескольких математических ожиданий. Ранговые критерии случайности: критерий экстремальных точек, критерий фаз, критерий знаков разностей, критерий ранговой корреляции.

Возможности статистических пакетов.


Раздел 3. Методы принятия решений в условиях неопределенности: элементы теории статистических решений.


Проверка гипотез как теория статистических решений. Учет ошибок первого и второго рода. Характеристики решающего правила (РП): оперативная характеристика, мощность. Наиболее мощное РП, равномерно наиболее мощное РП. Лемма Неймана – Пирсона о построении РП. Функция штрафа, функция риска, средний риск, рандомизированные РП, минимаксные процедуры. Принятие решения в условиях неопределенности: критерии Байеса – Лапласа, Вальда, Гурвица, Сэвиджа, минимакса, выбор критерия. Последовательный анализ Вальда.

Элементы теории статистических игр. Теоретико-игровой подход к задачам анализа данных. Полезность и "игра с природой". Дерево решений. Байесовские стратегии. Минимаксные стратегии. Элементы теории полезности, элементы теории риска.

Возможности статистических пакетов.


Раздел 4. Методы исследования взаимосвязей и зависимостей в анализе данных.


Прикладные задачи и математические модели дисперсионного анализа (ДА), корреляционного анализа (КА), регрессионного анализа (РА) в исследовании социально-экономических явлений.

Однофакторный и двухфакторный ДА, взаимозависимость факторов. Факторы и отклик. Проверка статистических гипотез в задачах ДА. Лемма Фишера о законе распределения квадратичной формы. ДА и планирование эксперимента. Блочный план и рандомизированный эксперимент. Активный эксперимент. Многофакторный ДА. Полный и дробный факторный эксперимент, полный и дробный план, дробные реплики. Планы экспериментов в виде латинских квадратов различных порядков. Стандартизованные вычислительные схемы ДА.

Характеризация взаимозависимостей на основе показателей корреляции различных типов: полный, частный, множественный коэффициенты корреляции, коэффициент детерминации. Коэффициенты ранговой корреляции Спирмена и Кендалла. Проверка статистических гипотез в задачах КА. Стандартизованные вычислительные схемы КА.

Линейный РА: однофакторный случай – парная регрессия, многофакторный случай – множественная регрессия. Теорема Гаусса – Маркова. Построение уравнения регрессии. Проверка статистических гипотез о коэффициентах регрессии, о необходимости и о целесообразности уточнения построенного уравнения регрессии. Последовательное уточнение вида регрессионной зависимости. Стандартизованные вычислительные схемы РА. Ортогональные системы базисных функций. Линейная регрессия. Критерий Бартлета и критерий Дики – Фуллера. Связь с фундаментальной "САРМ" – моделью оценки рисковых активов.

Некоторые специальные эконометрические аспекты: гомоскедастичность и гетероскедастичность, мультиколлинеарность, фиктивные переменные, системы одновременных уравнений. Некоторые специальные методологические принципы построения эконометрических зависимостей.

Возможности статистических пакетов.


Раздел 5. Методы структурного анализа данных.


Предмет и математические основы многомерного статистического анализа (МСА). МСА как математический анализ социально-экономических систем. Многоаспектность и многомерность в структурном анализе данных социально-экономической природы.

Элементы математической теории информации и энтропии, их приложения в социально-экономических исследованиях.

Случайный вектор как векторный признак, его математическое описание.Аналоги стандартных распределений в МСА. Статистические гипотезы о векторах средних значений и о корреляционных матрицах.

Проблема снижения размерности модели, канонические величины. Главные компоненты. Факторный анализ. Классификация, дискриминантный анализ. Пространство признаков и расстояние в нем. Распределение собственных значений в дискриминантном анализе. Кластерный анализ, многомерные группировки.

Распознавание образов как задача прикладного социально-экономического анализа. Решающие функции, функции расстояния, эталоны, классы, кластеры. Классификаторы. Выбор признаков. Логические, статистические, структурные методы распознавания.

Математические задачи и методы в проблематике экспертного оценивания, шкалирования, латентного анализа, контент-анализа. Методы многомерного шкалирования. Метод семантического дифференциала и метод пат-анализа как методы прикладной комбинаторики. Исследование структуры совокупности и ее изменений, диаграмма Лоренца, показатели концентрации, специализации, монополизации. Полезность, риски и рациональное поведение. Модель ожидаемой полезности. Модель когнитивной психологии как модель "не вполне рационального" поведения. Проектные риски и элементы сценарного подхода к их анализу и прогнозированию.

Возможности статистических пакетов.


Раздел 6. Модели вероятностных процессов в задачах анализа данных и прогнозирования.


Последовательности зависимых испытаний, зависимых скалярных и векторных случайных величин как математические модели социально-экономической динамики. Различные виды вероятностной зависимости, зависимости от времени.

Дискретная марковская цепь (ДМЦ) с конечным числом состояний, с бесконечным счетным числом состояний. Переходные вероятности, матрица переходных вероятностей. Уравнение Колмогорова – Чепмена. Однородность ДМЦ. Элементы аппарата производящих функций в исследовании ДМЦ. Классификация состояний ДМЦ. Блочная структура матрицы переходных вероятностей в случае разложимой ДМЦ, в случае неразложимой периодической ДМЦ. Асимптотическое поведение, эргодичность, предельное распределение.

Марковская цепь с непрерывным аргументом. Инфинитезимальная матрица. Прямое и обратное уравнения Колмогорова – Феллера.

Диффузионный марковский процесс, локальные характеристики. Обобщенное уравнение Маркова. Обратное уравнение Колмогорова, прямое уравнение Колмогорова – Фоккера – Планка.

Марковские процессы как математические модели социально-экономической динамики и прогнозирования.

Элементы общей теории случайных процессов. Семейство конечномерных распределений, содержание теоремы Колмогорова. Моментные функции, непрерывность, дифференцируемость, интегрируемость. Стационарность. Эргодичность, теорема Биркгофа – Хинчина. Спектр. Проблемы, связанные с "пересечениями уровней".

Модель временного ряда в исследовании социально-экономической динамики. Структура временного ряда, его "фундаментальный" и "технический" анализ. Выравнивание рядов динамики. Исследование и модели тренда, циклов (регулярных колебаний относительно тренда), эффекта сезонности, случайности. Модели стационарных временных рядов: авторегрессия и скользящее среднее, ряды Маркова и Юла. Проблема "единичгных корней". Уравнения Юла – Уокера. Элементы аппарата производящих функций в исследовании рядов динамики. Модели нестационарных временных рядов, случайное блуждание, мартингалы. Проблема адекватности математических моделей реальным данным. Интеграция и коинтеграция, регрессия коинтеграцииЮ гетероскедастичность. Корреляция рядов динамики. Анализ и проверка гипотезы об эффективности рынка. Прогнозирование социально-экономической динамики на основе моделей временных рядов.

Модели процессов и систем массового обслуживания (СМО). Описание СМО, "теория очередей". Пуассоновский процесс, модель Эрланга, формула Поллачека – Хинчина. Оценка параметров СМО. Марковские модели: одноканальная и многоканальная СМО, зависимость параметров от времени, многофазное обслуживание. Немарковские модели СМО: входящий поток, время обслуживания, групповое поступление требований, интервал занятости, число требований в системе, время ожидания. Виды дисциплины очереди. Последовательные и параллельные каналы. Уход из очереди. Многокритериальные задачи. Применение в анализе, планировании и управлении социально-экономическими процессами.

Метод Монте-Карло и математическая технология вероятностного моделирования.

Возможности статистических пакетов.


Список литературы


Основная литература по учебной дисциплине