Машины, которые говорят и слушают
Реферат - Компьютеры, программирование
Другие рефераты по предмету Компьютеры, программирование
ь (т.е. морфология, синтаксис, семантика, фонология) делает свой вклад в общую систему, но взаимоотношения этих областей с лингвистической структурой высказывания не всегда однозначны из-за индивидуальных акустических особенностей синтезируемой волны. Различные структурные области должны 1ыть представлены так, чтобы можно было обеспечить их оптимальное взаимодействие. Лишь таким образом можно установить сложные отношения между поверхностной речевой волной и лежащей в ее основе абстрактной лингвистической структурой, которая должна быть смоделирована глубоко и всесторонне .
При создании модульной системы предусматривалось:
а) получить такую полную модель в алгоритмической форме, чтобы процесс был представлен с исчерпывающей полнотой;
б) обеспечить работу системы для моделей переменной сложности, например, чтобы система работала с фиксированным словарем иди без учета просодических параметров;
в) обеспечить развитие и достаточную гибкость системы,чтобы изменения, которые должны быть внесены в один структурный Уровень, не требовали изменения других уровней;
г) реализовать эффективную работу отдельных частей алгоритма ориентируясь на специфику применения систем речевого ' ответа;
^и этом доляно учитываться использование специального оборудования, обеспечивающего минимальные габариты системы,время формирования фразы, мощность и стоимость системы. 67
Модульное матобеспечение, реализующее эти требования, произ-водит анализ текста и синтез речи. На стадии анализа создается некая абстрактная лингвистическая структура, общая как для вход-ного текста, так и для речевого вывода. Основными программными модулями при создании такой структуры являются:
1. Модуль "Формат", обеспечивающий предварительную обработку входного текста в форм;', удобную для морфологического анализа и порождения соответствующей фонемной цепочки.
2. Модуль "Декомпозиция1', осуществляющий морфологический ана-диз и находящий каждое слово в лексиконе морфем, представляет последовательность морфем, составляющих входной текст, кодами, учитывающими их особенности произнесения (в сочетании с другими морфемами) и грамматические функции.
3. Модуль "Парсер" (грамматический разбор) работает с цепочкой морфем и определяет, к какой части речи принадлежит каждое слово; этот модуль строит грамматические сети и формирует фразы, объединяя слова в словосочетания, на которые далее будет накладываться соответствующий интонационный контур; основная роль этого модуля - разрешать фонемные неопределенности (что-то убрать, что-то добавить) и производить лингвистические описания, необходимые для временных процедур, и процедуры наложения контура основного тона.
4. Модуль "Звук-1", в котором морфофонетические правила (множественного числа, прошедшего времени, палаталлэации) применяются к словам, анализировавшимся модулем "Декомпозиция"; эти правила очищают фонетическую цепочку и позволяют объединять два иди более смежных корня в составное слово , а также построить для слова соответствующий контур ударения.
5. Модуль "Звук-2" использует правила перевода букв (графем) в звуки для порождения фонетической последовательности, если модуль "Декомпозиция" не смог полностью превратить слова в последовательность лексических морфем. После превращения последовательности букв в последовательность фонетических символов этот модуль использует полный набор правил лексического ударения, определяющих контур ударности для этого слова (эти правила, например, определяют Правильность произношения аффикса ate в словах eyatematio и eyetemeUze).
При синтезе речи используется набор модулей, обеспечивающих порождение входной речевой водны:
- модуль "Просодика" определяющий для каждой фонемы формируемого предложения частоту основного тона, длительность и интенсивность (ударность);
68
- модуль "Синтез", используя фонетические метки и проводи-ивокую шформацию, каждые б мо порождает параметры, достаточные ля управления цифровой модель речевого тракта, формирующей от-очеты речевой волны. Модуль "Синтез" - ато большая программа, мализуккцая алгоритм фонетического синтеза речи по правилам с дополнительным наложением просодического контура;
- модуль "Речь" превращает полученную последовательность десантных отсчетов в речевую волну, используя цифроаналоговый Преобразователь.
В [133] рассмотрена интерактивная система исследования речи tiK; , чозвояяищая в диалоговом режиме изучать и модернн-ащювать правила преобразования "текст - фонема", что дает возможность получать более качественную синтетическую речь. Система spy использует три вида правил преобразования (рис.1.4):
1) правила модификации текста, модифицирующие начальную тек-стоьуь строку и связанные с ней признаки;
2) правила конверсии, формирующие цепочку фонем и связанную в ней матрицу признаков на основе информации, имеющейся в модифицированной текстовой строке;
3) правила модификации признаков, которые изменяют матрицу признаков, формируемую правилами конверсии.
Рассмотрим алгоритм преобразования "текст-фонема",реализованный в [I33J , на примере преобразования слова.
На вход программы преобразования поступает слово, каждой букве которого соответствует присоединенный признак, определяющий глаонке или