Кодирование речи в системах сотовой связи
Информация - Компьютеры, программирование
Другие материалы по предмету Компьютеры, программирование
»ьсов последовательности - для каждого из четырех подсегментов.
Всего для одного 20-мс сегмента речи передается 260 бит информации, т.е. кодер речи осуществляет сжатие информации почти в 5 раз (1280:260=4,92). Перед выдачей в канал связи выходная информация кодера речи также подвергается дополнительно канальному кодированию.
Декодер выполняет следующие операции. Блок формирования сигнала возбуждения, используя принятые параметры сигнала возбуждения, восстанавливает 13-импульсную последовательность сигнала возбуждения для каждого из подсегментов сигнала речи, включая амплитуды импульсов и их расположение во времени. Сформированный таким образом сигнал возбуждения фильтруется фильтром-синтезатором длительного предсказания. На его выходе получается восстановленный остаток предсказания фильтра-анализатора кратковременного ЛП, который фильтруется решетчатым фильтром-синтезатором кратковременного ЛП. Причем параметры фильтра предварительно преобразуются из логарифмических отношений площадей ri , в коэффициенты частичной корреляции ki. Выходной сигнал фильтра-синтезатора кратковременного ЛП фильтруется (в блоке пост-фильтрации) цифровым фильтром, восстанавливающим амплитудные соотношения частотных составляющих сигнала речи, т.е. компенсирующим предискажение, внесеннон входным фильтром блока предварительной обработки кодера. Сигнал на выходе пост-фильтра является восстановленным цифровым сигналом речи.
Оценка качества кодирования речи. При оценке качества кодирования и сопоставлении различных кодеков оцениваются разборчивость речи и качество синтеза (качество звучания) речи. Для оценки разборчивости речи используется метод DRT (диагностический рифмованный текст). В этом методе подбираются пары близких по звучанию слов, отличающихся отдельными согласными, которые многократно произносятся рядом дикторов, и по результатам испытаний оценивается доля искажений. Метод позволяет получить как оценку разборчивости отдельных согласных, так и общую оценку разборчивости речи.
Для оценки качества звучания используется критерий DAM (диагностическая мера приемлемости). Испытания заключаются в чтении несколькими дикторами (мужщинами и женщинами) ряда фраз, которые прослушиваются на выходе тракта связи рядом экспертов-слушателей, выставляющих щценки по 5-балльной шкале. Результатом является средняя субъективная оценка, или средняя оценка мнений (MOS). Хотя этот метод является субъективным, его результаты по сопоставлению различных типов кодеков при проведении испытаний одними и теми же группами дикторов и экспертов-слушателей являются достаточно объективными, и на них основываются выводы и решения.
В табл. 1 приведены результаты оценки четырех типов кодеков. Близкие к шкале MOS результаты дает объективный метод оценки качества с использованием понятия кепстрального расстояния (Cepstrum Distance - CD).
Существует множество вариантов кодеков речи, из которых приходится выбирать кодек для ССС. Например, при разработке стандарта GSM были исследованы шесть типов кодеков, после чего выбор был остановлен на кодеке RPE-LTP. Работа по выбору типа кодека для стандарта GSMбыла завершена в 1988 г., а в 1089 г. был предложен метод VSEPL, принятый затем в стандарте D-AMPS. Работы по совершенствованию кодеков речи продолжаются и в настоящее время. Обоими стандартами (D-AMPS и GSM) предусмотрено введение полускоростного кодирования, которое сможет увеличить пропускную способность канала связи в два раза. В числе исследуемых вариантов для стандарта D-AMPS рассматривается возможность введения векторного квантователя параметров линейных спектральных пар с расщеплением и межкадровым предсказанием, а для стандарта GSM - использование метода кодирования CELP.
Таблица 1. Оценка кодеков речи по шкале MOS
Тип кодекаТемп передачи информации, кбит/сОценка MOSPCM 64 4,12ADPCM 32 3,78RPE-LTP (стандарт GSM 13 3,58VSELP(стандарт D-AMPS) 8 3,44CELP (стандарт CDMA) 4,8 9,6 3 3,7QCELP (стандарт CDMA) 13 4,02
Канальное кодирование
Задачи и методы канального кодирования. Основная задача кодера канала - помехоустойчивое кодирование (ПУК) сигнала речи, т.е. такое кодирование, которое позволяет обнаруживать и исправлять ошибки, возникающие при распространении сигнала по радиоканалу. ПУК осуществляется за счет введения в состав передаваемого сигнала избыточной (контрольной) иеформации. В сотовой связи ПУК реализуется в виде трех процедур - блочного кодирования (block coding), сверточного кодирования (convolutional coding) и перемежения (interleaving). Кроме того, кодер канала выполняет еще ряд функций: добавляет управляющую информацию, (которая также подвергается ПУК); упаковывает подготовленную к передаче информацию и сжимает ее во времени; осуществляет шифрование передаваемой информации, если это предусмотрено режимом работы аппаратуры.
Последовательность выполнения этих задач показана на блок-схеме.
При блочном кодировании входная информация разделяется на блоки, содержащие по к символов каждый, которые по определенному закону преобразуются кодером в n-символьные блоки, причем n>k. Отношение R = k/n называется скоростью кодирования и является мерой избыточности, вносимой кодером. При рационально построенном кодере меньшая скорость кодирования (т,е. большая избыточность) соответствует более высокой помехоустойчивости.
Повышению помехоустойчивости способствует также увеличине длины блока. Блочный кодер с параметрами n, k обозначается (n,k). Если символы входной и выходной последовательностей являются двоичными ( т.е.