Программы и учебный план отделения теоретической и прикладной лингвистики Издательство Московского университета 2009

Вид материалаДокументы

Содержание


Автоматическая обработка естественного языка I. Автоматическая обработка звучащей речи 0. Основные задачи курса.
1. Языковые уровни представления звучащей речи и речевой сигнал.
2. Комплексная компьютерная обработка речевого сигнала.
3. Современные речевые технологии.
4. Дополнительные возможности использования речевых технологий.
Подобный материал:
1   ...   28   29   30   31   32   33   34   35   ...   55

Автоматическая обработка естественного языка

I. Автоматическая обработка звучащей речи

0. Основные задачи курса.


0.1. Знакомство с современными компьютерными методами анализа речи и речевыми технологиями; краткая история их развития, области применения.

0.2. Роль и место лингвистического обеспечения в создании и разработке речевых технологий на современном этапе.

1. Языковые уровни представления звучащей речи и речевой сигнал.


1.1. Двойственная природа звучащей речи: ее ментальная и физическая стороны.

1.2. Фонетическая характеристика речевого высказывания, возможные уровни абстракции и обобщения.

1.3. Речевой сигнал как физическая форма существования речевого высказывания. Характер связи между фонетическим и физическим представлениями речевого сигнала. Исторические «заблуждения» о природе этой связи.

1.4. Важнейшие задачи автоматической обработки звучащей речи. Необходимость многофакторного синтеза. Задачи сегрегации и интеграции акустической информации при автоматическом распознавании речи.

2. Комплексная компьютерная обработка речевого сигнала.


2.1. Запись речевого сигнала (РС). Основные требования к записывающей технике (микрофон, магнитофон, компьютерная запись) и условиям записи.

2.2. Цифровое кодирование РС: дискретизация и амплитудное квантование, контролируемые параметры и установки. Оптимальные режимы оцифровки РС.

2.3. Основные акустические параметры речи, их физические и перцептивные характеристики, единицы измерения (антропоморфная ориентация ).

2.4. Компьютерные методы обработки речевого сигнала во временной области.

2.4.1 Редактирование, монтаж сигнала и другие операции.

2.4.2 Комплексная акустическая параметризация РС – ключевые понятия. Методы получения амплитудной информации, тональной (частота основного тона), автосегментация и длительность звуковых единиц речи. Контролируемые установки и режимы компьютерного анализа указанных акустических параметров

2.5. Компьютерные методы получения спектральной информации (Фурье-преобразование, кепстральный анализ, линейное предсказание, цифровая фильтрация). Цифровые спектральные срезы и динамические спектрограммы. Контролируемые параметры и установки спектрального анализа речи.

2.6. Комплексная акустическая параметризация речевого сигнала с помощью компьютера. Примеры конкретных акустических процессоров: основные принципы работы, устройство и функциональные возможности.

3. Современные речевые технологии.


3.1. Речевые корпуса (базы данных).

Речевые корпуса как основа развития речевых технологий на современном этапе, краткая история разработок в этой области. Основные типы речевых корпусов и их применение. Технологические этапы создания баз данных, компьютерный и интеллектуальный инструментарий. Краткая характеристика акустико-фонетической базы TIMIT (американский английский) и RUSPEECH (русский). Горячие точки в сфере создания речевых корпусов на современном этапе развития.

3.2. Автоматический синтез речи.

3.2.1. Краткая история «говорящих» машин.

Основные направления разработок в области автоматического синтеза речи: генерация звучащего текста, «Текст-Речь» системы, ресинтез

3.2.2. Блок-схема прототипического синтезатора речи по произвольному тексту («Текст-Речь» система). Основные структурные элементы и задачи разработки.

3.2.3. Лингвистическое обеспечение в «Текст-Речь» системах. Фонетически ориентированные алгоритмы обработки текста в целях его фонетизации, автоматические транскрипторы и кодировщики, алгоритмы акустической параметризации. Принципы формирования акустических инвентарей.

3.2.4. Основные методы автоматической генерации речевого сигнала: артикуляторный синтез, параметрический синтез (формантный; на основе акустико-статистических моделей звуковых единиц), конкатенативный (компилятивный) синтез. Современные гибридные модификации.

3.2.5. Проблема оценки качества синтезированной речи: разборчивость и естественность.

3.2.6. Пример работающего синтезатора на материале русского языка.

3.3. Автоматическое распознавание речи (АРР).

3.3.1. Краткая история разработок. Принципиальные трудности автоматического распознавания речи, источники вариативности ее физических характеристик; возможность чисто фонетического распознавания (без использования лингвистической информации более высоких уровней).

3.3.2. Лингвистический (экспертный) подход к распознаванию речи. Метод чтения динамических спектрограмм как основа построения базы знаний для лингвистического декодирования речевых сообщений. Проблемы сегментации и фонемного (признакового) распознавания, словарный поиск.

3.3.3. Математическая база современных технологий распознавания речи: распознавание по спектральным эталонам с использованием алгоритмов динамического программирования (ДП=DTW); вероятностно-статистические методы распознавания на основе скрытых марковских моделей (СММ=HMM), нейроподобные сети (МСП=MLP). Речевые и текстовые корпуса как основа построения акустической и грамматической моделей языка.

3.3.4. Основные этапы создания и схема функционирования прототипической системы распознавания речи.

3.3.5. Важнейшие параметры звучащей речи для тестирования, оценки мощности и надежности работающих систем.

4. Дополнительные возможности использования речевых технологий.


Идентификация и верификация языка и личности говорящего; диагностика эмоционального и психологического состояния говорящего; лингвокриминалистическая экспертиза; обучающие тренажеры.