Программа: Введение в web-программирование. Наивный байесовский подход, применение к задачам выделения «спама» имашинного перевода
Вид материала | Программа |
- План лабораторных работ Введение в Web-программирование; создание html-страниц, работа, 6.6kb.
- И. А. Терейковский Применение семантического анализа содержимого электронных писем, 279.31kb.
- «Явление спама и борьба с ним», 264.65kb.
- Тема Семинарские (Лабораторные) занятия, час, 74.45kb.
- План занятий Web взгляд изнутри. Вводная часть в курс. Web-страницы, web-сайты, web, 11.42kb.
- Введение в линейное программирование линейное программирование (ЛП), 139.72kb.
- Программа дисциплины «Введение в программирование» для направления 080700 «Бизнес-информатика», 101.22kb.
- Лекции по дисциплине «Социальное моделирование и программирование», 44.69kb.
- Учебно-методический комплекс по дисциплине «Теория и практика перевода» для специальности, 487.56kb.
- Задачи теоретического изучения перевода. История перевода и переводческой мысли. Виды, 15.19kb.
СТУДЕНТЫ IV КУРСА ПРИГЛАШАЮТСЯ НА КУРС ПО ВЫБОРУ
МАТЕМАТИЧЕСКИЕ МЕТОДЫ ИНФОРМАЦИОННОГО ПОИСКА
ПОНЕДЕЛЬНИК, 16:05, АУД. 509
ПРЕПОДАВАТЕЛЬ – НОВИКОВ ПЕТР АНДРЕЕВИЧ
Аннотация: Курс знакомит слушателей с некоторыми математическими методами, применяемыми в современных интернет-поисковых системах: «Bing», «Google», «Яндекс» и пр. Курс призван продемонстрировать связь фундаментальных дисциплин, традиционно изучаемых на мехмате (теория вероятностей, линейная алгебра, методы оптимизации), с актуальными технологиями IT-индустрии.
Наряду с теорией немалое внимание уделяется техническим аспектам реализации изучаемых методов в интернет-среде. «Рабочим языком» курса является Java (впрочем, использование слушателями иного языка программирования не возбраняется).
Программа:
- Введение в web-программирование.
- Наивный байесовский подход, применение к задачам выделения «спама» и машинного перевода.
- Векторная модель документа, вес по TF-IDF, классификация web-страниц.
- Латентный семантический анализ, сингулярное разложение матрицы.
- Метод PageRank – основа поисковой системы Google.
- Методы ближайших соседей (kNN), Apriori и AdaBoost.
- Метод опорных векторов.
- Подходы к решению задач накопления и хранения больших объемов данных в online-системах.
Лекции частично доступны по адресу: kov.narod.ru/iretrieval.
Рейтинговый балл выводится по результатам текущей аудиторной работы студента.
ПЕРВОЕ ЗАНЯТИЕ – ПОНЕДЕЛЬНИК, 6 СЕНТЯБРЯ, 16:05, АУД. 509