Системы регистрации речевой информации, используемые в настоящее время в ГА
Дипломная работа - Компьютеры, программирование
Другие дипломы по предмету Компьютеры, программирование
плитуды). В этом случае существуют два способа хранения информации.
Первый (Рисунок 2.2.1) - PCM (Pulse Code Modulation - импульсно-кодовая модуляция) - способ цифрового кодирования сигнала при помощи записи абсолютных значений амплитуд (бывают знаковое или беззнаковое представления). Именно в таком виде записаны данные на всех аудио CD.
Рисунок 2.2.1 - PCM - импульсно-кодовая модуляция
Второй способ (Рисунок 2.2.2) - ADPCM (Adaptive Delta PCM - адаптивная относительная импульсно-кодовая модуляция) - запись значений сигнала не в абсолютных, а в относительных изменениях амплитуд (приращениях)
Рисунок 2.2.2 - ADPCM - адаптивная относительная кодовая модуляция
цифровой регистратор речевой микроконтроллер
Во-вторых, можно сжать или упростить данные так, чтобы они занимали меньший объем памяти, нежели будучи записанными как есть. Тут тоже имеются два пути.
Кодирование данных без потерь (lossless coding) - это способ кодирования аудио, который позволяет осуществлять стопроцентное восстановление данных из сжатого потока. К такому способу уплотнения данных прибегают в тех случаях, когда сохранение оригинального качества данных критично. Например, после сведения звука в студии звукозаписи, данные необходимо сохранить в архиве в оригинальном качестве для возможного последующего использования. Существующие сегодня алгоритмы кодирования без потерь позволяют сократить занимаемый данными объем на 20-50%, но при этом обеспечить стопроцентное восстановление оригинальных данных из полученных после сжатия. Подобные кодеры - это своего рода архиваторы данных (как ZIP, RAR и другие), только предназначенные для сжатия именно аудио. Этот способ требует значительных аппаратных затрат, что повысит стоимость и сложность разрабатываемой системы.
Имеется и второй путь кодирования - кодирование данных с потерями (lossy coding). Цель такого кодирования - любыми способами добиться схожести звучания восстановленного сигнала с оригиналом при как можно меньшем объеме упакованных данных. Это достигается путем использования различных алгоритмов упрощающих оригинальный сигнал (выкидывая из него ненужные слабослышимые детали), что приводит к тому, что декодированный сигнал фактически перестает быть идентичным оригиналу, а лишь похоже звучит. Методов сжатия, а также программ, реализующих эти методы, существует много. Наиболее известными являются MPEG-1 Layer I,II,III (последним является всем известный MP3), MPEG-2 AAC (advanced audio coding), Ogg Vorbis, Windows Media Audio (WMA), TwinVQ (VQF), MPEGPlus, TAC, и прочие. В среднем, коэффициент сжатия, обеспечиваемый такими кодерами, находится в пределах 10-14 (раз). Надо особо подчеркнуть, что в основе всех lossy-кодеров лежит использование так называемой психоакустической модели, которая как раз и занимается упрощением оригинального сигнала. Говоря точнее, механизм подобных кодеров выполняет анализ кодируемого сигнала, в процессе которого определяются участки сигнала, в определенных частотных областях которых имеются неслышные человеческому уху нюансы (замаскированные или неслышимые частоты), после чего происходит их удаление из оригинального сигнала. Таким образом, степень сжатия оригинального сигнала зависит от степени его упрощения; сильное сжатие достигается путем агрессивного упрощения (когда кодер считает ненужными множественные нюансы), такое сжатие, естественно, приводит к сильной деградации качества, поскольку удалению могут подлежать не только незаметные, но и значимые детали звучания. Нам этот способ так же не подходит из-за не соответствия декодированного сигнала и оригинального.
Для разрабатываемого устройства выберем кодирование ADPCM кодеком (адаптивная относительная импульсно-кодовая модуляция). Этот способе не требует высоких вычислительных ресурсов и легко реализуем.
Адаптивная дифференциальная импульсно-кодовая модуляция (ADPCM) является частным случаем дифференциального кодирования. Данный метод предложен в качестве стандарта комитетом CCITT.
Рассмотрим процесс кодирования методом ADPCM.
Рисунок 2.2.3 - структурная схема процесса кодирования методом ADPCM
На приведенном выше рисунке (Рисунок 2.2.3) изображена структурная схема процесса кодирования PCM-сигнала методом ADPCM. Во время работы метода адаптивный предсказатель осуществляет предсказание уровня поступающего равномерно квантованного сигнала. Входной сигнал имеет 256 уровней квантования и частоту дискретизации 8 кгц. В сумматоре происходит алгебраическое сложение входного и предсказанного сигнала. Разностный сигнал поступает в адаптивный квантователь, где производится квантование. Число уровней квантования, согласно стандарту, может быть равно 16, 8, 4 или 2. (Соответственно сигнал может быть передан по каналам с минимальными пропускными способностями 40, 32, 24 или 16 кбит/c.) Другие параметры квантования частично определяются в стандарте, а частично зависят от характеристик обрабатываемого сигнала.
С выхода адаптивного квантователя сигнал одновременно поступает в обратный адаптивный квантователь и в канал передачи. Обратный адаптивный квантователь предназначен для перевода квантованного PCM-сигнала в равномерно квантованный разностный сигнал. Получаемый разностный сигнал может не совпадать с исходным разностным сигналом. Обратное преобразование необходимо для того, чтобы обеспечить одинаковое предсказание на этапах кодирования и декодирования.
С выхода обратного адаптивного квантователя равномерно квантованный разност