Разработка структуры сети с пакетной коммутацией на примере ОАО "Московская государственная телефонная сеть"
Дипломная работа - Компьютеры, программирование
Другие дипломы по предмету Компьютеры, программирование
ла говорящих - и более. Технология подавления молчания имеет три важных составляющих: детектор речевой активности VAD (Voice Activity Detector) определяет моменты времени, когда пользователь говорит, оценивает энергию входного сигнала и активизирует передачу, если она выше некоторого порога; прерывистая передача DTX (Discontinuous Transmission) вынуждает кодек прекратить передачу пакетов в то время, когда VAD обнаружил период молчания (а возобновляет ее снова VAD), генератор комфортного шума CNG (Comfort Noise Generator), создающий у говорящего ощущение присутствия собеседника на другом конце при отключенной передаче. Совершенные кодеки, например, G.723.1 Annex А или G.729 AnnexВ имеют возможность предоставлять удаленному декодеру информацию для восстановления шума с близкими к исходному параметрами.
Большинство кодеков обрабатывает речевую информацию блоками, называемыми кадрами. Выбор размера кадра (frame) важен, так как минимальная теоретически достижимая задержка передачи информации (т.н. алгоритмическая задержка) определяется суммой этого параметра и длины буфера предварительного анализа.
Как было показано в предыдущем параграфе, к кадру, сгенерированному кодеком, добавляется необходимая дополнительная информация: заголовки IP (20 байтов), UDP (8 байтов) и RTP (12 байтов), поэтому большинство реализаций VoIP использует пересылку нескольких кадров в пакете. Число таких кадров ограничено максимально допустимой задержкой. В большинстве случаев в одном пакете передается до 120 мс речевой информации.
Еще одним фактором работы шлюзов VoIP является чувствительность к потерям кадров, являющимся неотъемлемым атрибутом IP-сетей. Применяются коды с исправлением ошибок, позволяющие снизить количество потерь кадров при данном числе потерянных пакетов. Некоторая избыточная информация распределяется между несколькими пакетами так, что при потерях некоторого числа пакетов кадры могут быть восстановлены. Но положительный эффект при введении избыточности для борьбы с потерями кадров не столь легко достижим, так как потери в IP-сетях происходят пачками, т.е. значительно более вероятно, что будут наблюдаться потери сразу нескольких пакетов подряд, чем потери всего одного из нескольких последовательно передаваемых пакетов. Так что, если применить простые схемы введения избыточности, например, повторяя посылку каждого кадра два раза в соседних пакетах, то это, скорее всего, окажется в реальных условиях бесполезным, приводя лишь к передаче значительного объема избыточной информации. Кроме того, введение избыточности отрицательно сказывается на задержке воспроизведения сигнала. Например, если мы повторяем один и тот же кадр в четырех следующих один за другим пакетах, для того чтобы обеспечить возможность восстановления информации при потере трех подряд идущих пакетов, декодер вынужден поддерживать буфер из четырех пакетов, а это вносит значительную дополнительную задержку. "ияние потерь кадров на качество воспроизводимой речи зависит от используемого кодека. Если потерян кадр, состоящий из N отсчетов кодека G.711, то на приемном конце будет отмечен пропуск звукового фрагмента длительностью N*125 мкс. Если используется более совершенный узкополосный кодек, то потеря кадра может сказываться на воспроизведении нескольких последующих, так как декодеру потребуется время для того, чтобы достичь синхронизации с кодером - потеря кадра длительностью 20 мс может привести к слышимому эффекту длительностью 150 мс и более. Кодеры типа G.723.1 разрабатывались так, что они функционируют без существенного ухудшения качества в условиях некоррелированных потерь до 3% кадров, однако при превышении этого порога качество ухудшается катастрофически.
Отметим, что G.711 - наиболее известный, часто называемый просто ИКМ, цифровой кодек речевых сигналов, поддерживаемый всеми шлюзами VoIP, был стандартизован ITU-T в 1965 году, его типичная оценка MOS составляет 4.3. Рекомендация G.723.1 утверждена ITU-T в ноябре 1995 года. Кодек G.723.1 имеет длительность кадра 30 мс с длительностью предварительного анализа 7.5 мс и два режима работы: 6.3 Кбит/ с (кадр имеет размер 189 битов, выровненных до 24 байтов) и 5.3 Кбит/с (кадр имеет размер 158 битов, выровненных до 20 байтов). G.723.1 обеспечивает оценку MOS 3.7 в режиме 6.3 Кбит/с и 3.9 в режиме 5.3 Кбит/с, имеет детектор речевой активности и обеспечивает генерацию комфортного шума на удаленном конце в период молчания.
ADPCM кодек G.726 (рекомендация принята в 1990 г.) обеспечивает кодирование цифрового потока G.711 со скоростью 40, 32, 24 или 16 Кбит/с, поддерживая оценки MOS на уровне 4.3 (32 Кбит/с), что часто принимается за эталон уровня качества телефонной связи (toll quality). В приложениях VoIP этот кодек практически не используется, так как он не обеспечивает достаточной устойчивости к потере информации.
Кодек G.728 использует оригинальную технологию линейного предсказания с малой задержкой LD-CELP (low delay code excited linear prediction) и обеспечивают оценки MOS, аналогичные G.726 при скорости передачи только 16 Кбит/с.
Кодек G.729 очень популярен в сетях Frame Relay, использует технологию CS-ASELP (Conjugate Structure, Algebraic Code Excited Linear Prediction) и обеспечивает скорость передачи 8 Кбит/с. В рамках спецификаций G.729 определены алгоритмы VAD, CNG и DTX.
Еще одной задачей шлюзов VoIP является передача сигналов многочастотного набора номера DTMF. Узкополосные кодеки, чтобы достичь низких скоростей передачи информации, опираются на тот факт, что сигнал, который они кодируют, представляет собой именно речь, а сигналы DTMF при прохождении через такие кодеки искажаются и не могут быть успешно опознаны соответствующим прие