Программы и учебный план отделения теоретической и прикладной лингвистики Издательство Московского университета 2009
Вид материала | Документы |
- Вопросы прикладной лингвистики сборник научных трудов москва Издательство Российского, 1099.28kb.
- Вопросы прикладной лингвистики сборник научных трудов москва Издательство Российского, 2232.6kb.
- Фёдоровна ритмизация и интонационное членение текста в "процессе речи-мысли" ( опыт, 987.79kb.
- Научные направления конференции: Актуальные вопросы классической и современной филологии, 27.78kb.
- National association of applied linguistics (russia) национальное общество прикладной, 31.38kb.
- Тюркские лексические элементы в русской лингвографии XVIII xx веков 10. 02. 01 русский, 971.75kb.
- Научные направления конференции: Актуальные вопросы классической и современной филологии, 62.75kb.
- Учебно-методическое пособие Санкт-Петербург 2005 ббк 81. 1 З-38, 589.09kb.
- Кафедра теоретической и прикладной лингвистики, 2010/2011, 171.69kb.
- И программа издательство Московского государственного университета леса Москва 2010, 830.69kb.
Автоматическая обработка естественного языка
I. Автоматическая обработка звучащей речи
0. Основные задачи курса.
0.1. Знакомство с современными компьютерными методами анализа речи и речевыми технологиями; краткая история их развития, области применения.
0.2. Роль и место лингвистического обеспечения в создании и разработке речевых технологий на современном этапе.
1. Языковые уровни представления звучащей речи и речевой сигнал.
1.1. Двойственная природа звучащей речи: ее ментальная и физическая стороны.
1.2. Фонетическая характеристика речевого высказывания, возможные уровни абстракции и обобщения.
1.3. Речевой сигнал как физическая форма существования речевого высказывания. Характер связи между фонетическим и физическим представлениями речевого сигнала. Исторические «заблуждения» о природе этой связи.
1.4. Важнейшие задачи автоматической обработки звучащей речи. Необходимость многофакторного синтеза. Задачи сегрегации и интеграции акустической информации при автоматическом распознавании речи.
2. Комплексная компьютерная обработка речевого сигнала.
2.1. Запись речевого сигнала (РС). Основные требования к записывающей технике (микрофон, магнитофон, компьютерная запись) и условиям записи.
2.2. Цифровое кодирование РС: дискретизация и амплитудное квантование, контролируемые параметры и установки. Оптимальные режимы оцифровки РС.
2.3. Основные акустические параметры речи, их физические и перцептивные характеристики, единицы измерения (антропоморфная ориентация ).
2.4. Компьютерные методы обработки речевого сигнала во временной области.
2.4.1 Редактирование, монтаж сигнала и другие операции.
2.4.2 Комплексная акустическая параметризация РС – ключевые понятия. Методы получения амплитудной информации, тональной (частота основного тона), автосегментация и длительность звуковых единиц речи. Контролируемые установки и режимы компьютерного анализа указанных акустических параметров
2.5. Компьютерные методы получения спектральной информации (Фурье-преобразование, кепстральный анализ, линейное предсказание, цифровая фильтрация). Цифровые спектральные срезы и динамические спектрограммы. Контролируемые параметры и установки спектрального анализа речи.
2.6. Комплексная акустическая параметризация речевого сигнала с помощью компьютера. Примеры конкретных акустических процессоров: основные принципы работы, устройство и функциональные возможности.
3. Современные речевые технологии.
3.1. Речевые корпуса (базы данных).
Речевые корпуса как основа развития речевых технологий на современном этапе, краткая история разработок в этой области. Основные типы речевых корпусов и их применение. Технологические этапы создания баз данных, компьютерный и интеллектуальный инструментарий. Краткая характеристика акустико-фонетической базы TIMIT (американский английский) и RUSPEECH (русский). Горячие точки в сфере создания речевых корпусов на современном этапе развития.
3.2. Автоматический синтез речи.
3.2.1. Краткая история «говорящих» машин.
Основные направления разработок в области автоматического синтеза речи: генерация звучащего текста, «Текст-Речь» системы, ресинтез
3.2.2. Блок-схема прототипического синтезатора речи по произвольному тексту («Текст-Речь» система). Основные структурные элементы и задачи разработки.
3.2.3. Лингвистическое обеспечение в «Текст-Речь» системах. Фонетически ориентированные алгоритмы обработки текста в целях его фонетизации, автоматические транскрипторы и кодировщики, алгоритмы акустической параметризации. Принципы формирования акустических инвентарей.
3.2.4. Основные методы автоматической генерации речевого сигнала: артикуляторный синтез, параметрический синтез (формантный; на основе акустико-статистических моделей звуковых единиц), конкатенативный (компилятивный) синтез. Современные гибридные модификации.
3.2.5. Проблема оценки качества синтезированной речи: разборчивость и естественность.
3.2.6. Пример работающего синтезатора на материале русского языка.
3.3. Автоматическое распознавание речи (АРР).
3.3.1. Краткая история разработок. Принципиальные трудности автоматического распознавания речи, источники вариативности ее физических характеристик; возможность чисто фонетического распознавания (без использования лингвистической информации более высоких уровней).
3.3.2. Лингвистический (экспертный) подход к распознаванию речи. Метод чтения динамических спектрограмм как основа построения базы знаний для лингвистического декодирования речевых сообщений. Проблемы сегментации и фонемного (признакового) распознавания, словарный поиск.
3.3.3. Математическая база современных технологий распознавания речи: распознавание по спектральным эталонам с использованием алгоритмов динамического программирования (ДП=DTW); вероятностно-статистические методы распознавания на основе скрытых марковских моделей (СММ=HMM), нейроподобные сети (МСП=MLP). Речевые и текстовые корпуса как основа построения акустической и грамматической моделей языка.
3.3.4. Основные этапы создания и схема функционирования прототипической системы распознавания речи.
3.3.5. Важнейшие параметры звучащей речи для тестирования, оценки мощности и надежности работающих систем.
4. Дополнительные возможности использования речевых технологий.
Идентификация и верификация языка и личности говорящего; диагностика эмоционального и психологического состояния говорящего; лингвокриминалистическая экспертиза; обучающие тренажеры.