Введение в специальность

Вид материалаДокументы

Содержание


Речевой интерфейс
Кафедра фонетики английского языка
Разработана на основании Образовательного стандарта РД РБ 02100.5.114-98
Пояснительная записка
Содержание дисциплины
Тема 1.2. ЛИНГВИСТИЧЕСКИЕ ОСНОВЫ РЕЧЕВОГО ИНТЕРФЕЙСА
Практические системы распознавания и синтеза речи
Примерный перечень тем лабораторных работ
Примерный перечень компьютерных программ
Подобный материал:
1   ...   7   8   9   10   11   12   13   14   15

Утверждена


УМО вузов Республики Беларусь

по образованию в области информатики

и радиоэлектроники

« 03 » июня 2003 г.

Регистрационный № ТД-40-62/тип


РЕЧЕВОЙ ИНТЕРФЕЙС



Учебная программа для высших учебных заведений

по специальности 1-40 03 01 Искусственный интеллект


Согласована с Учебно-методическим управлением БГУИР

« 28 » мая 2003 г.


Составители:

Б.М. Лобанов, профессор кафедры интеллектуальных информационных технологий Учреждения образования «Белорусский государственный университет информатики и радиоэлектроники», доктор технических наук, старший научный сотрудник;

О.Е. Елисеева, доцент кафедры интеллектуальных информационных технологий Учреждения образования «Белорусский государственный университет информатики и радиоэлектроники», кандидат технических наук


Рецензенты:

А.С. Рылов, ведущий научный сотрудник лаборатории судебной фонетики НИИ проблем криминологии, криминалистики и судебных экспертиз, кандидат технических наук;

Кафедра фонетики английского языка Учреждения образования «Минский государственный лингвистический университет» (протокол № 2 от 18.09.2000 г.)


Рекомендована к утверждению в качестве типовой:

Кафедрой интеллектуальных информационных технологий Учреждения образования «Белорусский государственный университет информатики и радиоэлектроники» (протокол № 10 от 14.01.2002 г.);


Научно-методическим советом по направлению 1-40 Вычислительная техника УМО вузов Республики Беларусь по образованию в области информатики и радиоэлектроники (протокол № 1 от 18.02.2002 г.)


Разработана на основании Образовательного стандарта РД РБ 02100.5.114-98



Ответственный за редакцию: Т.А. Лейко

Ответственный за выпуск: Ц.С.Шикова


ПОЯСНИТЕЛЬНАЯ ЗАПИСКА



Типовая программа «Речевой интерфейс» разработана в соответствии с Образовательным стандартом РД РБ 02100.5.114-98 по специальности 1-40 03 01 Искусственный интеллект высших учебных заведений. Целью дисциплины является изучение лингвистических основ речевого интерфейса, фонетики речи, информационной и модуляционной структуры речи, методов анализа речевого сигнала, методов синтеза речи по тексту, методов автоматического распознавания речи, знакомство с практическими компьютерными системами распознавания и синтеза речи.

В результате освоения курса «Речевой интерфейс» студент должен:

знать:
  • преимущества и основные характеристики речевого интерфейса;
  • лингвистические основы речевого интерфейса;
  • структуру речевого сигнала, методы анализа и синтеза речевого сигнала;
  • методы синтеза речи по тексту, общую структуру и принципы работы синтезатора речи;
  • основные задачи и методы автоматического распознавания речи, принципы работы современных компьютерных систем распознавания речи;

уметь характеризовать:
  • промышленные и экспериментальные системы распознавания и синтеза речи;
  • методы анализа и синтеза речевых сигналов;
  • принципы работы синтезатора речи по тексту;

уметь анализировать:
  • современный уровень и перспективы развития речевого интерфейса электронных вычислительных систем;

приобрести навыки:
  • определения фонетических закономерностей речевых сигналов;
  • определения спектрально-временных характеристик речевых сигналов;
  • применения методов автоматического распознавания речи;
  • использования систем распознавания и синтеза речи.

Программа рассчитана на объем 50 учебных часов. Примерное распределение учебных часов по видам занятий: лекций – 30 часов, лабораторных работ – 20 часов.


СОДЕРЖАНИЕ ДИСЦИПЛИНЫ


Раздел 1. ВВЕДЕНИЕ


Тема 1.1. ОСНОВНЫЕ ЗАДАЧИ И КЛЮЧЕВЫЕ ПОНЯТИЯ РЕЧЕВОГО ИНТЕРФЕЙСА

Основные задачи курса. Исторический обзор. Речевой интерфейс (РИ): компьютерные системы распознавания и синтеза речи. Преимущества и основные характеристики РИ. Прикладные системы: примеры применения.

Тема 1.2. ЛИНГВИСТИЧЕСКИЕ ОСНОВЫ РЕЧЕВОГО ИНТЕРФЕЙСА

Речевой сигнал и фонетика речи. Звуки речи: фонемы и аллофоны. Гласные звуки. Согласные звуки. Слог и слоговая структура. Просодика речи: ударение и интонация. Морфология, лексика, синтаксис, семантика и прагматика.


Раздел 2. СТРУКТУРА РЕЧЕВОГО СИГНАЛА. АНАЛИЗ И СИНТЕЗ


Тема 2.1. ОСНОВЫ ТЕОРИИ РЕЧЕОБРАЗОВАНИЯ

Спектрально-временные характеристики речевого сигнала (РС). Информационная и модуляционная структура речи.


Тема 2.2. МЕТОДЫ АНАЛИЗА РЕЧЕВОГО СИГНАЛА

Определение спектра, кепстра, формант и основного тона.


Тема 2.3. МЕТОДЫ СИНТЕЗА РЕЧЕВОГО СИГНАЛА

Формантный, ЛПК и волновой синтез РС.


Раздел 3. СИНТЕЗ РЕЧИ ПО ТЕКСТУ


Тема 3.1. СИНТЕЗАТОР РЕЧИ

3.1.1. Методы синтеза речи по тексту. Исторический обзор. Общая структура синтезатора речи по тексту.

3.1.2. Фонетический процессор. Дифонное и аллофонное представления фонемного текста. Алгоритм фонемно-аллофонного преобразования.

3.1.3. Просодический процессор. Мелодика, ритмика и энергетика речи. Синтагматическая и акцентная структура фраз. Просодические контуры акцентных единиц.

3.1.4. Текстовый процессор.

3.1.5. Преобразование "Буква-Фонема". Автоматическая разметка ударений. Синтагматическое членение фраз.


Раздел 4. РАСПОЗНАВАНИЕ РЕЧИ


Тема 4.1. МЕТОДЫ РАСПОЗНАВАНИЯ РЕЧИ

4.1.1. Методы автоматического распознавания речи.

4.1.2. Методы принятия словесных решений. Метод динамического программирования (ДП-метод) для распознавания изолированных слов. ДП-метод для слитной речи.

4.1.3. Методы создания эталонов слов. ДП-сравнение эталонных реализаций. Кластеризация эталонов при многодикторном распознавании.

4.1.4. Метод скрытых марковских моделей (СММ-метод). СММ алгоритмы распознавания и обучения.

4.1.5. Методы фонемного распознавания речи неограниченного словаря. Экспертно-фонетический и СММ методы принятия фонемных решений.


Раздел 5. ПРАКТИЧЕСКИЕ СИСТЕМЫ РАСПОЗНАВАНИЯ И СИНТЕЗА РЕЧИ


Тема 4.1. ПРОМЫШЛЕННЫЕ И ЭКСПЕРИМЕНТАЛЬНЫЕ СИСТЕМЫ РАСПОЗНАВАНИЯ И СИНТЕЗА РЕЧИ

Промышленные и экспериментальные системы синтеза речи по тексту. Промышленные и экспериментальные системы распознавания речи.


Тема 4.2. ДИАЛОГОВЫЕ СИСТЕМЫ

Промышленные и экспериментальные диалоговые системы с использованием распознавания и синтеза речи.


ПРИМЕРНЫЙ ПЕРЕЧЕНЬ ТЕМ ЛАБОРАТОРНЫХ РАБОТ

  1. Спектральные закономерности речевого сигнала.
  2. Спектральные методы анализа речевого сигнала.
  3. Синтезатор речи по тексту.
  4. Система распознавания речевых команд и компьютерная модель речевой диалоговой системы.


ПРИМЕРНЫЙ ПЕРЕЧЕНЬ КОМПЬЮТЕРНЫХ ПРОГРАММ

И НЕОБХОДИМОГО ОБОРУДОВАНИЯ

  1. Персональный компьютер IBM PC Pentium, имеющий аудио карту, динамики и микрофон.
  2. Операционная среда Windows 9x и выше.
  3. Система программирования MS Visual С++ (или аналогичная).


ЛИТЕРАТУРА


ОСНОВНАЯ
  1. Автоматическое распознавание и синтез речи: Сб. науч. тр. – Мн.: Ин-т техн. кибернетики НАН Беларуси, 2000.
  2. Косарев Ю.А. Естественная форма диалога с ЭВМ: -Лен.: Машиностроение, 1989.
  3. Жданович В.М. и др. Технические средства ЭВМ. Устройства ввода-вывода: - Мн.: Вышэйшая школа, 1991.
  4. Михайлов В.Г., Златоустова Л.В. Измерение параметров речи: - М.: Связь, 1987.
  5. Кучеров В.Я., Лобанов Б.М. Синтезированная речь в системах массового обслуживания: - М.: Радио и связь, 1983.
  6. Ли У. Методы автоматического распознавания речи: Пер. с англ. Александрова О.В. - М.: Мир, 1983.



ДОПОЛНИТЕЛЬНАЯ
  1. Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов. - Киев, 1987.
  2. Кейтер Дж. Компьютеры – синтезаторы речи: - М., 1980.
  3. Маркел Д.П., Грей А.Х. Линейное предсказание речи: - М., 1980.



Утверждена

УМО вузов Республики Беларусь

по образованию в области информатики

и радиоэлектроники

« 30 » марта 2004 г.

Регистрационный № ТД-40-066/тип.