Обработка речевых сигналов

Дипломная работа - Компьютеры, программирование

Другие дипломы по предмету Компьютеры, программирование

?араметрического спектрального анализа.

Главная цель процесса оцифровки заключается в получении данных речевого сигнала с высоким отношением Сигнал/Шум. В настоящее время телекоммуникационные системы обеспечивают значение этого коэффициента порядка 30 dB для приложений распознавания голоса, что более чем достаточно для получения высокой производительности таких приложений. Изменения в преобразователях, каналах и фоновом шуме, тем не менее, вызывают определенные проблемы.

 

4.4.4 Фильтрация спектра

Получив спектральное представление сигнала его требуется отчистить от шумов. Человеческий голос обладает известными характеристиками, и поэтому те области которые не могут являются характеристиками голоса нужно погасить.

Для этого применим функцию, которая получила название окно Кайзера

 

После фильтрации спектра нужно наложить окно Ханнинга

 

 

.4.5 Сравнение с эталонными образцами

Основным параметром, используемым для идентификации, является мера сходства двух звуковых фрагментов. Для ее вычисления необходимо сравнить спектрограммы этих фрагментов. При этом сначала сравниваются спектры, полученные в отдельном окне, а затем вычисленные значения усредняются.

Для сравнения двух фрагментов использовался следующий подход:

Предположим что X[1..N] и Y[1..N] - массивы чисел, одинакового размера N, содержащие значения спектральной мощности первого и второго фрагментов соответственно.

Тогда мера сходства между ними вычисляется по следующей формуле

 

 

где Mx и My - математические ожидания для массивов X[] и Y[] соответственно, вычисляющиеся по следующей формуле

 

 

Данный способ вычисления меры сходства двух фрагментов представленных в виде спектра является самым оптимальным для задачи идентификации человека по его голосу.

 

.5 Описание информационного обеспечения

 

Функционирование любой подсистемы распознание речи невозможно без соответствующей информационной поддержки.

Информационные потоки, используемые прикладными программами при работе, составляют основу информационного обеспечения. Для достижения оптимальности использования данного вида обеспечения наиболее приемлемой формой его реализации является набор интерактивных баз данных на основе реляционной модели данных, обеспечивающих контроль, хранение и управление информационными потоками.

При разработке информационного обеспечения необходимо учитывать следующие принципы:

) независимость данных;

) совместимость - при развитии программного и модернизации технического обеспечения компоненты информационного обеспечения должны сохранять работоспособность;

) не избыточность данных - информационное обеспечение должно представлять собой совокупность интегрированных данных, являющихся основной частью информационного потока;

) защита данных - учитывая реалии рыночной экономики, необходимо предусмотреть защиту данных от несанкционированного доступа;

) целостность данных - информационное обеспечение должно предотвращать нарушение структуры данных пользователем.

В данной системе используются следующие компоненты информационного обеспечения:

образцы голоса;

зарегистрированные в системе пользователи;

статистическая информация;

словарь;

инженерные системы.

Компонента образцов голоса содержит образцы голоса пользователя. База Данных зарегистрированных в системе пользователей содержит информацию о зарегистрированных в системе пользователях, их именах, логинах, настройках.

Компонента словарь содержит словари по разным инженерным системам.

Фрагмент Схемы, описывающую таблицы, в которых хранятся данные предметной области и связи между ними представлен в Приложении Б, соответствующие логике предметной области, называют инфологической моделью базы данных.

В реляционных базах данных схема содержит как структурную, так и семантическую информацию. Структурная информация связана с объявлением отношений, а семантическая выражается множеством известных функциональных зависимостей между атрибутами отношений, указанных в схеме. Однако некоторые функциональные зависимости могут быть нежелательными из-за побочных эффектов или аномалий, которые они вызывают при модификации данных. В этом случае необходимо прибегнуть к процедуре, называемой декомпозицией, при которой данное множество отношений заменяется другим множеством отношений (число их возрастает), являющихся проекцией первых. Цель этой процедуры - устранить нежелательные функциональные зависимости (а, следовательно, и аномалии), что составляет суть процесса нормализации. Таким образом, нормализация - это пошаговый обратимый процесс замены данной схемы (совокупности отношений) другой схемой, в которой отношения имеют более простую и регулярную структуру. При этом возникает проблема обратимости, т.е. возможность восстановления исходной схемы. Это значит, что декомпозиция должна сохранять эквивалентность схем при замене одной схемы на другую. Для обеспечения эквивалентности схем необходима декомпозиция, гарантирующая отсутствие потерь, и сохраняющая зависимости. Декомпозиция без потерь гарантирует обратимость, т.е. получение исходного множества отношений путем применения последовательности естественных соединений над их проекциями. При этом в результирующем отношении не должны появляться ранее отсутствующие ?/p>