Система регистрации речи диспетчерских переговоров
Дипломная работа - Компьютеры, программирование
Другие дипломы по предмету Компьютеры, программирование
ечается так же версия, названная "Fraunhofer MP3 Codec v1.063 (Radium Optimized)", в виде файла SetupI3c.exe размером 870 Кбайт. Обе версии функционально практически одинаковы.
На входе кодек воспринимает поток PCM, имеющий частоты дискретизации, перечисленные ниже в таблице1. Разрядность потока всегда должна быть 16 бит (это правило справедливо и для большинства других кодеков, 8-ми битная разрядность практически не применяется). Кодек работает как в стерео режиме, так и в моно. В таблице1 указана скорость потока сжатого звука и место, которое займет такая звукозапись в моно режиме (для стерео надо умножить значения на два).
Таблица1
_____________________________________________________________________
частота скорость сколько займет 1 час
дискретизации, потока, (приблизительно),
Hz kbit/s Mb
_____________________________________________________________________
48 000 64 28,125
56 24,6
48 21
_____________________________________________________________________
41 100 64 28,128
56 24,6
48 21
_____________________________________________________________________
32 000 64 28,128
56 24,6
48 21
_____________________________________________________________________
24 000 32 14
24 10
_____________________________________________________________________
22 050 32 14
24 10
_____________________________________________________________________
16 000 32 14
24 10
20 8,5
18 8
16 7
_____________________________________________________________________
12 000 20 8,5
18 8
16 7
8 3,5
_____________________________________________________________________
11 025 20 8,5
18 8
16 7
8 3,5
_____________________________________________________________________
8 000 16 7
8 3,5
_____________________________________________________________________
Заметим, что сжатие сигнала в реальном времени с качеством AUDIO CD - то есть 44100 Hz, 128 kbit/s, stereo, требует процессора не слабее Celeron 300A. При этом процессор будет полностью загружен и работать с другими приложениями станет практически невозможно. При уменьшении частоты дискретизации требования к процессору пропорционально снижаются. MP3 - один из самых "тяжелых" форматов по требованиям к процессору.
Особенность всей продукции Fraunhofer IIS - упорное игнорирование режима переменного битрета - VBR. Качество звука, получаемое при использовании этого кодека принято считать эталонным. Оно очень высокое, особенно если воспроизводить файлы через него же. Особо не рекомендуется смешивать продукцию разных фирм - сжимать, например, Xing Encoderом или Lame, а слушать через Fraunhofer IIS. Стандарты стандартами, но частотная коррекция в этих кодеках делается по-разному.
В комплект Windows Media Tools от Microsoftа входит кодек, который называется MPEG Layer-3 Audio Codec (advanced). Его отличие от рассмотренной выше версии professional в том, что advanced - это урезанная, бесплатная демо-версия кодека, она поддерживает только частоты 24 000,
12000, 16 000 и 8 000 Hz.
LAME ACM MP3 CODEC
Lame - продукт бесплатный, распространяется в виде исходных текстов. Разрабатывается он группой энтузиастов, что не могло не отразиться на качестве, и особенно на стабильности его работы. Как следствие, Lame можно рекомендовать для сжатия голосовой информации. Особо ценен в этом контексте режим VBR, при котором кодек уменьшает скорость передачи в некритичных местах - например, в паузах между словами.
В Lame появился режим заказного (среднего) битрейта (average bitrate - ABR), реализованный ранее в кодере OGG. По утверждению разработчиков, при одинаковом битрейте кодирование в ABR режиме должно быть не хуже, чем в обычном.
Q-Design realtime MPEG 1 Layer 1,2
Это тот же MPEG, однако, степень сжатия существенно меньше. Он сжимает примерно в 4-5 раз. Такой же коэффициент сжатия дает MS или IMA ADPCM, но, пожалуй, системные требования ADPCM поменьше будут. Зато Q-Design codec имеет утилиту Speed Control, которая позволяет изменять скорость воспроизведения прямо в процессе воспроизведения.
2) DivX WMA Audio Compressor
Исправленная версия кодеков Windows Media Audio (WMA), распространяется она в интернете под названием DivX.
Сетка частот, поддерживаемая кодеком - 48, 44, 32, 22, 16, 11, 8 kHz, для каждой частоты предлагается несколько (до семи) скоростей потока. Частоты 24 и 12 kHz не поддерживаются. Качество звука достаточно лишь для синтетической музыки (попса, танцевальная, техно...). Акустика звучит неадекватно. Очень хорошо этот кодек подходит для записи лекций, совещаний, разговорных передач на FM. Разборчивость речи стабильно 100-процентная.
3) WMА
WMA - это детище широко известной в мире компании Microsoft. Но все ли знают, как он к этой самой Microsoft попал? История происхождения формата WMA объясняет некоторые интересные особенности его звучания.
В 1998 году компания Voxware присоединилась к проекту TwinVQ и в его составе участвовала в разработке формата VQF. Компания отделилась от проекта и на основе разработок VQF создала новый формат, получивш