Внимание! У нас в гостях профессор Борис Григорьевич Миркин (Birkbeck College University of London, uk) с циклом лекций

Вид материалаДокументы

Содержание


Необходимые знания
Подобный материал:

Внимание!



У нас в гостях профессор Борис Григорьевич Миркин (Birkbeck College University of London, UK) с циклом лекций

Искусственный Интеллект и Визуализация Данных



(after a module taught by Prof. Boris Mirkin for a MsCS programme at School of Computer Science and Information Systems, Birkbeck College University of London, UK)


Цель курса: Изучение современных методов анализа и визуализации данных, включая кластерный анализ, нейронные сети, генетические и эволюционные алгоритмы, их проверку и применение с использованием продвинутой вычислительной среды МатЛаб.


Оценка полученных знаний: Часовой письменный экзамен и курсовой проект, вклады 50% и 50% соответственно. Курсовой проект: нелинейная регрессия с помощью эволюционного алгоритма и ее тестирование с помощью кросс-валидации (скользящего контроля).


Необходимые знания: начала теории множеств, графов, математического анализа, линейной алгебры и методов оптимизации.


Содержание:

  1. Структура знаний. Задачи агрегирования и ассоциирования. Количественный или качественный целевой признак. Изучение двумерного случая: регрессия и корреляция, табличная регрессия и корреляционное отношение, таблица сопряженности и коэффициенты Кетле и Хи-квадрат. Эволюционные алгоритмы для нелинейной регрессии. Методы вычислительного тестирования: бутстрэп и кросс-валидация (скользящий контроль).



  1. Многомерные данные: векторы, расстояние и скалярное произведение. Преобразование шкалы. Стандартизация данных. Визуализация данных путем аппроксимации. Модель метода главных компонент и кластерного анализа. Сингулярные числа, компоненты и кластерные аналоги. Спектральный кластер анализ. Метод К-средних.



  1. Метод аномального кластера. "Интеллектуальная" версия метода К-средних. Использование разложения разброса данных на объясненную и необъясненную части для интерпретации и описания кластеров. Генетические алгоритмы (хромосомы, мутации и кроссинговер) для метода К-средних. Эволюционные алгоритмы для метода К-средних.



  1. Линейные разделяющие функции и ядерные преобразования. Линейная регрессия и линейная дискриминация. Нейронные сети для машинного обучения: модели нейрона, перцептроны и их ограничения. Многоуровневые перцептроны как классифицирующие устройства. Градиентный метод оптимизации и обратный алгоритм адаптивного обучения и его ограничения.


Расписание занятий: Кирпичная 33/5, 16.40 -19.30 в следующие дни 3.04 (ауд. 401), 6.04 (ауд. 506), 10.04 (ауд. 401), 13.04 (ауд. 506), 17.04 (ауд. 401), 20.04 (ауд. 506).


Литература

  1. B. Mirkin (2005), Clustering for Data Mining, Chapman & Hall/CRC, ISBN 1-58488-534-3.
  2. A.P. Engelbrecht (2002) Computational Intelligence, John Wiley & Sons, ISBN 0-470-84870-7.
  3. B. Mirkin (2007) Computational Intelligence and Visualization: Association, Aggregation, Visualization, manuscript.