Обработка речевых сигналов
Дипломная работа - Компьютеры, программирование
Другие дипломы по предмету Компьютеры, программирование
это результат обучения.
Преимуществом полученной модели является возможность автоматического обучения синтезу. Механизм этого обучения описывается далее.
Ещё одной очень важной особенностью является возможность перевода запоминаемых образов в новое параметрическое пространство с гораздо меньшей размерностью. Эта особенность на данный момент в разрабатываемой системе реализована и на практике проверена. Я постараюсь кратко изложить её суть.
Входной сигнал задается вектором первичных признаков в N-мерном пространстве. Для хранения такого сигнала необходимо N элементов. При этом на этапе разработки мы не знаем специфики сигнала или она настолько сложна, что учесть её затруднительно. Это приводит к тому, что представление сигнала, которое мы используем, избыточно. Далее предположим, что у нас есть возможность синтезировать такие же сигналы (т.е. синтезировать речь), но при этом синтезируемый сигнал является функцией вектора параметров в M-мерном пространстве, и M<<N (действительно, число параметров модели синтеза речи намного меньше числа первичных признаков модели распознавания речи). Но тогда мы можем запоминать входной сигнал не по его первичным признакам в N-мерном пространстве, а по параметрам модели синтеза в M-мерном пространстве. Есть все основания предполагать, что это преобразование можно осуществить при помощи довольно простой нейросети. Более того, по моему мнению, такой механизм запоминания работает в реальных биологических системах, в частности, у человека.
голосовой управление компьютер речь
4 Проектирование голосовой системы управления
4.1 Общее описание системы
Разрабатываемая подсистема распознавания речи является обслуживающим инструментом для системы голосового управления жилым объектом.
Качество и современность проектируемой подсистемы должно обеспечиваться развитием математической модели анализатора голоса.
Любая система состоит из подсистем, которые являются её неотъемлемой частью. Подсистема распознавания речи представляет собой законченный функциональный блок, имеющий свой неповторимый комплекс средств (программное, лингвистическое, методическое, техническое обеспечения или другие виды обеспечения) и выполняющий определённые функции, возложенные на него разработчиком системы. По назначению подсистемы подразделяют на проектирующие и обслуживающие. Примером обслуживающих систем могут служить подсистемы распознавания речи, автоматизированного ввода информации, графическую подсистему и т.д. В отличие от проектирующих подсистем, предназначенных в основном для расчёта, обслуживающие подсистемы предназначены для поддержания их работоспособности.
Реально, система представляет собой комплекс технических средств (КТС), размещённый на нескольких автоматизированных рабочих местах (АРМ), соединённых в локальную вычислительную сеть (ВС). На одном АРМ возможно совмещение нескольких подсистем, что уменьшает количество используемой вычислительной техники.
В результате анализа, для данной системной области было выбрано устройство КТС, основанное на двух АРМ, как самый оптимальный вариант. Использование одной единицы вычислительной техники не рационально в силу того, что данная машина будет слишком загружена как расчётами, так и поддержанием работоспособности самой системы, т.е. её обслуживанием. Выделение трёх рабочих мест повлечёт за собой простой вычислительной техники и увеличение средств на создание системы, что также недопустимо.
Разделение функциональных обязанностей по АРМ будет следующим. Одна из станций будет являться информационно-обслуживающей, т.е. будет заниматься вопросами хранения исходных данных, вывода документации и информационным обслуживанием.
Вторая станция будет являться рабочим местом оператора и на ней будет установлена программа защиты от несанкционированного доступа.
.2 Описание структурной схемы разрабатываемой системы
Как уже отмечалось выше, любая система состоит из нескольких подсистем, различающихся по своему функциональному назначению. Исходя из анализа области проектирования, в разрабатываемой системе были выделены следующие подсистемы:
подсистема регистрации пользователя в системе;
подсистема выбора инженерной системы;
информационная подсистема;
подсистема авторизации пользователя.
Рассмотрим подробнее задачи, решаемые каждой подсистемой, и средства их реализации.
Подсистема регистрации пользователей, как следует из названия, предназначена для регистрации пользователей в системе. Добавление нового пользователя реализуется при помощи диалоговых языков проектирования, а в частности, диалог типа заполнение бланков с элементами диалога типа меню, а так же, как альтернатива. Подсистема добавления пользователей сохраняет настройки и образцы голоса в БД системы.
Информационная подсистема необходима для хранения данных на всех этапах работы подсистемы, обеспечения взаимосвязи между остальными подсистемами, а также для сбора и хранения необходимых вспомогательных данных, таких как параметры пользователей, настройки программы, статистическая документация, образцы голоса пользователя. Данная подсистема организована в виде базы данных и имеет необходимый набор программных средств для доступа, поиска, изменения и коррекции хранимых данных. Информационная подсистема включает в себя следующие таблицы:
образцы голоса;
за