Программа: Введение в web-программирование. Наивный байесовский подход, применение к задачам выделения «спама» имашинного перевода

Вид материалаПрограмма
Подобный материал:
СТУДЕНТЫ IV КУРСА ПРИГЛАШАЮТСЯ НА КУРС ПО ВЫБОРУ

МАТЕМАТИЧЕСКИЕ МЕТОДЫ ИНФОРМАЦИОННОГО ПОИСКА

ПОНЕДЕЛЬНИК, 16:05, АУД. 509

ПРЕПОДАВАТЕЛЬ – НОВИКОВ ПЕТР АНДРЕЕВИЧ


Аннотация: Курс знакомит слушателей с некоторыми математическими методами, применяемыми в современных интернет-поисковых системах: «Bing», «Google», «Яндекс» и пр. Курс призван продемонстрировать связь фундаментальных дисциплин, традиционно изучаемых на мехмате (теория вероятностей, линейная алгебра, методы оптимизации), с актуальными технологиями IT-индустрии.

Наряду с теорией немалое внимание уделяется техническим аспектам реализации изучаемых методов в интернет-среде. «Рабочим языком» курса является Java (впрочем, использование слушателями иного языка программирования не возбраняется).


Программа:
  1. Введение в web-программирование.
  2. Наивный байесовский подход, применение к задачам выделения «спама» и машинного перевода.
  3. Векторная модель документа, вес по TF-IDF, классификация web-страниц.
  4. Латентный семантический анализ, сингулярное разложение матрицы.
  5. Метод PageRank – основа поисковой системы Google.
  6. Методы ближайших соседей (kNN), Apriori и AdaBoost.
  7. Метод опорных векторов.
  8. Подходы к решению задач накопления и хранения больших объемов данных в online-системах.

Лекции частично доступны по адресу: kov.narod.ru/iretrieval.

Рейтинговый балл выводится по результатам текущей аудиторной работы студента.


ПЕРВОЕ ЗАНЯТИЕ – ПОНЕДЕЛЬНИК, 6 СЕНТЯБРЯ, 16:05, АУД. 509