2. концепция защищенной речевой связи

Вид материалаДокументы
2.2 Классификация методов защищенной передачи речи
2.2.1.2 двухполосные инверторы с переменной частотой раздела
2.2.1.3 Частотные скремблеры
2.2.1.4 временные СКРЕМБЛЕРЫ
2.2.1.5 ЧАСТОТНо-временные и комбинированные СКРЕМБЛЕРЫ
2.2.1.6 СКРЕМБЛЕРЫ на основе ортогональных преобразований
2.2.1.7 системы синхронизации СКРЕМБЛЕРов
2.2.2.1 Кодеки с компандированием динамического диапазона
2.2.2.3 адаптивные дельта-Кодеки
E, редецимация остатка дополнением каждого отсчета r(n/D)
I из кодовой книги, умножение на усиление E
2.2.3.4. другие структуры вокодеров
2.2.4 Модемы в системах защиты речи
2.2.5 Модулярные системы
2.2.6 Алгоритмы шифрования
Подобный материал:
1   2   3

2.2 Классификация методов защищенной передачи речи


В данном разделе приведена общая классификация систем защищенной связи для речевых и речеподобных сигналов. В основном используются известные источники, но делается акцент на наиболее глубоко проработанные авторами классы. Модулярные системы являются оригинальным классом.

2.2.1 Скремблеры


Ниже рассматриваются основные типы устройств защиты речи, использующие некоторые преобразования речевого сигнала (частотные, временные и др.) искажающие сигнал в линии так, что его нельзя перехватить прямым прослушиванием, но в принципе, можно вскрыть при помощи комплексов специальной аппаратуры. Сигналы таких систем имеют выраженную статистику, как правило, не требуют для вскрытия привлечения средств криптоанализа и предназначены для “тактического” закрытия переговоров.

2.2.1.1 инверторы


Простейшими устройствами, предотвращающими прямое прослушивание речевого сигнала подключением к телефонной линии или при радиоперехвате, являются инверторы спектра, которые выполняют над речевым сигналом следующее преобразование.

Пусть речевой сигнал s(t) дискретизован по времени с частотой дискретизации fs=1/Ts и представлен отсчетами s(n) в моменты времени nTs. В наиболее общем случае поворот (перенос) в частотной области такой, чтобы нижняя частота сигнала fa заняла позицию верхней частоты fb (и наоборот, fb стала на место fa), требуется выполнить комплексное перемножение отсчетов сигнала и комплексной синусоиды с частотой fi = fa + fb. Такая операция сложно реализуема как аналоговыми, так и цифровыми средствами, но есть прием, позволяющий резко упростить реализацию поворота спектра. Фокус заключается в том, что fs выбирается как fs = 2fi. Тогда отсчеты комплексной синусоиды с нулевой фазой и частотой, равной половине частоты дискретизации, вырождаются в значение 0 для косинуса и чередующиеся значения +1 и -1 для синуса. В общем виде операция получения отсчетов сигнала с инверсным спектром q(n) из отсчетов входного сигнала s(n) может быть записана как

q(n) = (-1)n s(n) (2.1.1)

Непрерывный сигнал q(t), представленный отсчетами q(n), формируется аналоговым фильтром нижних частот с частотой среза fb . В линию (в эфир) передается сигнал q(t).

На приемной стороне повторным преобразованием, аналогичным (2.1.1), восстанавливается сигнал s(n):

s(n) = (-1)n q (n) (2.1.2)

Если инвертор реализуется аналоговыми средствами, то операции (2.1.1.) и (2.1.2) выполняются либо при помощи аналогового умножителя, либо аналоговым ключом, изменяющим полярность входного сигнала с частотой fs/2.

Существуют микроэлектронные изделия, специально предназначенные для инверсии спектра речевого сигнала, например, MX014 (MX COM, INC). Эта микросхема в 24-х выводном корпусе содержит генератор, два предыскажающих фильтра (подъем верхних частот на 6 дБ на октаву), два полосовых фильтра и ряд умножителей, ключей и аттеньюаторов для возможно полной реализации инвертора спектра при минимальном числе дополнительных компонент в дуплексном режиме (т.е. содержит два независимых канала инверсии спектра). Предыскажающие фильтры обеспечивают необходимую энергетику инвертированного сигнала, поскольку в исходном речевом сигнале низкочастотная составляющая превалирует и без коррекции инвертированный сигнал имеет преобладание энергии на высоких частотах, что ухудшило бы эффективную передачу сигнала в телефонном канале. Малое энергопотребление (максимальный потребляемый ток составляет 9 мА при напряжении питания 5 В) позволяет использовать микросхему в телефонном аппарате (или в приставке) с питанием от телефонной линии.

Операция инверсии спектра необязательно должна являться единственным преобразованием речевого сигнала, возможно применение инверсии, как составной части более сложных преобразований (например, в приставках “Орех-2”, “Орех-2М”, “Орех-2Е”).

На слух преобразование сигнала путем инверсии спектра превращает речь в высокочастотный скрипящий звук, мало напоминающий естественную речь. Несмотря на то, что темповые и энергетические характеристики речи сохраняются, инверсную речь правильно интерпретировать при прослушивании практически никому не удается.

2.2.1.2 двухполосные инверторы с переменной частотой раздела


Существенным недостатком инверторов является простота вскрытия. Для восстановления исходного сигнала при перехвате речевого сигнала с применением закрытия инверсией спектра нападающей стороне достаточно выполнить инверсию спектра. Даже если частота fi точно не известна, выбор ее с ошибкой до 300 Гц позволяет восстановить речь с достаточной разборчивостью.

В мировой практике выработался метод закрытия речи, заключающийся в разделении спектра речевого сигнала на две несимметричные полосы частот и инверсией спектра отдельно для каждой полосы. Примерами таких устройств являются микросхемы MX214/224 (MX COM, INC) в 24-х выводном корпусе (32 значения частоты раздела) и PCD4440 (PHILIPS COMPONENTS) в 8-ми выводном корпусе (9 значений частоты раздела).

Структура инвертора с разделением полос (один канал) приведена на рис. 2.1. Такой инвертор содержит синтезатор частот, фильтр верхних частот с частотой среза 300 Гц, два модулятора для двух отдельных полос и четыре фильтра нижних частот с управляемыми частотами среза. Управление частотой разделения полос и полосами фильтров (фильтры реализуются на коммутируемых конденсаторах, поэтому частоты среза определяются тактовой частотой от синтезатора) осуществляется программным путем через параллельный или последовательный интерфейс. Обычно последовательный интерфейс реализуется в стандарте I2C, позволяющем подключать к одному микроконтроллеру несколько устройств (I2C содержит всего 2 магистральные линии: синхронизация и данные).





Рис. 2.1. Структура двухполосного инвертора спектра


Характеристики и отношение эффективность/стоимость двухполосных инверторов приемлемы для создания систем закрытия телефонных и радиоканалов с существенно улучшенной стойкостью к вскрытию по сравнению с обычными инверторами спектра.

Существуют три основных варианта использования двухполосных инверторов:

1) с фиксированной частотой раздела ;

2) с частотой раздела, изменяющейся по определенному закону через небольшие интервалы времени;

3) с частотой раздела, изменяющейся для каждого включения передачи (для полудуплексной связи).

Вариант 1 является наиболее дешевым и, естественно, менее защищенным. Ключ при этом имеет мощность, определяемую только небольшим числом значений частот раздела, т. е. для подбора ключа при вскрытии требуется только перебрать 9 или 32 управляющих кода и, кроме того, речь уже становится разборчивой при ошибке установки частоты раздела до 300 Гц. Поэтому реально требуется перебрать еще меньшее число кодов (5 - 10). Данный вариант не требует каких-либо сигналов синхронизации и наиболее дешев при реализации.

Вариант 2 обладает наибольшей стойкостью для скремблеров данного класса. Частоты раздела переключаются синхронно на передающей и приемной сторонах, последовательность кодов частот определяется генератором псевдослучайной последовательности (генератором гаммы), оба генератора инициируются одинаковым начальным кодом (сеансовый ключ) в известный момент времени, определяемый сигналами синхронизации. Длительность временного интервала с неизменной частотой раздела обычно находится в пределах от 0,02 с до 2 с. При уменьшении длительности стойкость возрастает, так как при вскрытии требуется перебирать большее число кодов частоты раздела на единицу времени, но ухудшается качество восстановленной речи из-за переходных процессов при переключении частоты раздела. Длительность временных интервалов с постоянной частотой раздела может быть либо фиксированной, либо переменной. Переключение частот должно осуществляться синхронно на передающей и на приемной стороне, более того, при полном дуплексе существуют одновременно два процесса синхронизации: от передатчика абонента А к приемнику абонента Б и от передатчика абонента Б к приемнику абонента А. Допустима рассинхронизация переключения частот раздела между передающей и приемной стороной до единиц мс (5-7 мс), в противном случае возникают характерные искажения типа “стук”, затрудняющие речевой обмен (частота раздела на передающей стороне уже изменилась, а на приемной стороне еще нет, поэтому в восстановленном речевом сигнале появляется врезка сигнала с искаженным спектром).

Уровень помех при переключении частот фильтров существенно зависит от значения разности предыдущей и последующей частоты раздела: чем больше разность частот, тем выше уровень помех. Поэтому часто применяют не чисто случайные последовательности кодов частот, а такие, у которых изменение частоты при переключении минимально. В частности, в простейших системах изменение частоты может быть пилообразным.

Помимо требований к точности начальной синхронизации при установлении связи существуют требования по поддержанию синхронизации на протяжении сеанса связи для компенсации возможного расхождения частот опорных генераторов устройств абонентов. Вскрытие данного варианта скремблирования существенно затруднено, так как для подбора кодов частот раздела требуется выполнять перебор для каждого временного сегмента, а подбор сеансового ключа (при наличии у нападающей стороны такого же скремблера) может оказаться практически невозможным при длине ключа 20 и более бит. Увеличение длины ключа несущественно изменяет стоимость устройства, поэтому обычно ее задают при проектировании с большим запасом.

Вариант 3 занимает промежуточную позицию между вариантами 1 и 2 как по стойкости так и по затратам. Здесь устраняется необходимость борьбы с рассинхронизацией в процессе речевого обмена, так как при каждом переключении прием/передача точность начальной синхронизации достаточна для обеспечения нескольких минут устойчивой связи с рассинхронизацией в единицы миллисекунд даже при применении недорогих кварцевых резонаторов с точностью установки частоты при изготовлении не хуже 10-4. Обычно в таком варианте скремблера вместе с сигналом начальной синхронизации передают номер начальной позиции генератора гаммы (некоторая операция над номером и сеансовым ключем дает новую последовательность гаммы). Это делается для того, чтобы гаммы различались при каждом переходе в режим передачи.

2.2.1.3 ЧАСТОТНЫЕ СКРЕМБЛЕРЫ


Частотные скремблеры осуществляют разбиение полосы сигнала на ряд фиксированных полос равной ширины, перестановку (перенос частоты) этих полос в соответствие с гаммой и последующее суммирование сигналов отдельных полос для получения закрытого сигнала. Число полос обычно составляет 4 - 8, а временной интервал перестановки может быть либо фиксированным, либо псевдослучайным в диапазоне 20 - 300 мс. На приемной стороне сигнал также расфильтровывается на полосы, производится обратная перестановка полос и суммирование для получения открытого сигнала.

Несмотря на более высокую стойкость по сравнению с вышеописанными скремблерами, частотные скремблеры имеют ряд специфических особенностей, которые необходимо учитывать при проектировании. Существует компромисс между требованием разделения полос без перекрытия и увеличением длины импульсной характеристики фильтра, т. е. если мы хотим передать речевой сигнал без потерь и без взаимных помех между частотными каналами, то необходимо добиваться крутых срезов фильтров, что, в свою очередь, приводит к обязательному удлинению импульсных характеристик, что увеличивает переходные помехи при перестановке полос. Кроме того, поскольку частотная характеристика реального канала неравномерна, то при перестановке полос возникают скачкообразные изменения амплитуды и фазовой структуры сигнала, которые выражаются в характерных искажениях типа “бульканья”.

Структура одного из вариантов частотного скремблера на основе формирования полос фильтрами НЧ на нулевой несущей приведена на рис. 2.2.




Рис. 2.2. Структура частотного скремблера.


Скремблер содержит преобразователь Гильберта для формирования из входного сигнала s комплексного сигнала s, перемножителей, осуществляющих перенос частот середин полос к нулю частоты сигналами гетеродинов g1, g2,.. gN, комплексные фильтры НЧ, коммутатор сигналов полос, выполняющий коммутацию каждого входа на один из выходов в соответствии с законом перестановок, определяемым генератором гаммы G; выходные сигналы коммутатора переносятся в области средних частот полос комплексно- сопряженными сигналами гетеродинов g1*, g2*,.. gN*, и суммируются для получения действительного закрытого сигнала q. Восстановление сигнала на приемной стороне осуществляется по такой же структуре, но с зеркальной по отношению к передатчику перестановкой сигналов фильтров при коммутации. Во многих реализациях частотных скремблеров применяют инверсию спектра внутри каждой из полос.

Используются не все возможные перестановки N!, а только те, которые существенно отличаются от исходного порядка расположения полос. Обычно число используемых перестановок составляет от 10 до 50 % возможных перестановок.

Система синхронизации частотного скремблера должна поддерживать одновременность переключения коммутаторов передатчика и приемника с погрешностью порядка единиц миллисекунд (типовое требование - 2 мс).

2.2.1.4 временные СКРЕМБЛЕРЫ


Одними из наиболее эффективных по отношению степени защищенности к затратам являются временные скремблеры или скремблеры с временными перестановками, основным принципом работы которых является разбиение исходного сигнала на сегменты с последующей перестановкой этих сегментов во времени и, возможно, инверсией времени в каждом или в некоторых сегментах (ранее применявшиеся скремблеры только с инверсией времени из-за низкого маскирующего эффекта далее не рассматриваются). На приемной стороне выполняется перестановка сегментов в обратном порядке и исходный сигнал восстанавливается. При выполнении только временных перестановок параметры канала для любого сегмента неизменны, поэтому восстановленный сигнал не имеет искажений, характерных для частотных скремблеров, но из-за дисперсных свойств канала сегменты растягиваются, у них появляются перекрывающиеся “хвосты” от сегментов, которые при восстановлении должны располагаться в другом месте во времени; при этом возникают характерные искажения речевого сигнала типа “стук”. Недостатком реализации временных скремблеров является задержка, необходимая для передатчика и приемника при перестановке сегментов; суммарная задержка составляет обычно от 0,5 с до 1 с, что может быть существенным отрицательным фактором при высоких требованиях к комфортности речевой связи. Существуют два основных класса временных скремблеров: с кадром фиксированной длины и с бескадровой структурой.

На рис. 2.3 приведена упрощенная структура скремблера с временными перестановками с кадром фиксированной длины.





Рис. 2.3. Структура скремблера с временными перестановками.


Исходный сигнал s поступает поочередно на входы двух блоков памяти (типовой размер кадра от 8 до 20 сегментов длительностью 16 - 40 мс), причем в один блок памяти последовательно записываются отсчеты исходного сигнала , а из другого блока - считываются, но в последовательности, определяемой генератором гаммы. Считываемый сигнал q является закрытым. На приемной стороне выполняется аналогичная операция с противоположным порядком выборки из буферной памяти. Обычно используются не все возможные перестановки сегментов, а только те, которые существенно отличаются от исходного порядка расположения (существенно “перемешивают” сегменты).

Для уменьшения переходных помех используют ряд различных приемов: в простейшем случае при состыковке сегментов на приемной стороне в зоне стыка отсчеты сигнала обнуляются на интервале плюс минус 1 мс от границы сегмента, более сложное решение заключается в изменении частоты дискретизации при записи и считывании буферной памяти. Запись в память при закрытии осуществляется с номинальной частотой дискретизации, а считывание с повышенной частотой на столько, что в зоне границы сегмента образуется интервал длительностью порядка 2 мс, который заполняется нулевыми отсчетами. При приеме отсчеты в буферную память записываются с повышенной частотой дискретизации, а считываются с номинальной. При считывании из памяти отсчеты в зоне защитного интервала суммируются с отсчетами сегмента.

Система синхронизации временного скремблера, аналогично частотному скремблеру, должна поддерживать одновременность переключения адресов буферной памяти передатчика и приемника с погрешностью порядка единиц миллисекунд (типовое требование - 2 мс).

2.2.1.5 ЧАСТОТНо-временные и комбинированные СКРЕМБЛЕРЫ


Скремблеры, в которых комбинируются преобразования в частотной и временной области имеют повышенную стойкость, по сравнению с только частотными или только временными скремблерами, правда, за счет ухудшения качества восстановленного сигнала.

Наиболее приемлемы следующие из возможных структур таких скремблеров:

а) производится разбиение полосы сигнала на некоторое небольшое число полос, в каждой из которых выполняется процедура временного скремблирования с независимыми гаммами для каждой полосы;

б) выполняется временное скремблирование и частотное скремблирование, как правило, с одновременным переключением полос и сегментов.

в) комбинация временного скремблера с инвертором спектра;

г) комбинация временного скремблера с двухполосным инвертором спектра с изменением или без изменения частоты раздела.

Частотно-временные скремблеры в последнее время не находят широкого применения из-за больших помех и искажений восстановленного сигнала, когда требуется все более высокое качество речевой связи, в том числе и закрытой.

2.2.1.6 СКРЕМБЛЕРЫ на основе ортогональных преобразований


Известны скремблеры, использующие преобразование Фурье или другие обратимые ортогональные преобразования. Общая структура таких скремблеров приведена на рис. 2.4.





Рис. 2.4. Структура ортогонального скремблера


Исходный сигнал s (в действительной или комплексной форме представления) разделяется на кадры по времени (возможно с умножением на временное окно, например Хэмминга, как правило, с перекрытием на половину или на треть длительности окна), подвергается прямому преобразованию U с набором функций {ui}, в результате которого образуется набор коэффициентов {ai}. В последовательности коэффициентов выполняются перестановки при помощи коммутатора, управляемого генератором гаммы, и новый набор коэффициентов подвергается обратному преобразованию U-1, в результате которого образуется закрытый сигнал q. На приемной стороне исходный сигнал восстанавливается аналогичной последовательностью преобразований за исключением того, что при коммутации перестановки выполняются в обратном порядке.

Один из наиболее удачных скремблеров такого типа [29] выполняет 256-ти точечное комплексное прямое преобразование Фурье кадра сигнала, взвешенного окном длительностью 32 мс, из 128-ми коэффициентов исключает 38 коэффициентов, не несущих существенной информации, и осуществляет перестановку оставшихся 90 коэффициентов Фурье в соответствие с гаммой. Кроме того, производится измерение энергии сигнала и добавление в позиции, определяемые гаммой, дополнительных 16 коэффициентов с псевдослучайными модулями и фазами для достижения маскирующего эффекта. Модули дополнительных коэффициентов умножаются на множитель, расчитываемый так, чтобы общая энергия закрытого сигнала оставалась постоянной, что исключает анализ энергетических и темповых характеристик речи при вскрытии. Для формирования действительного закрытого сигнала q выполняется обратное преобразование Фурье. На приемной стороне выполняется БПФ, исключение 16-ти дополнительных коэффициентов, обратная перестановка 90 основных коэффициентов и формирование восстановленного сигнала обратным БПФ.

Ортогональные скремблеры не лишены общих недостатков скремблеров и вносят искажения в востановленный речевой сигнал, определяемые, помимо методической ошибки, дисперсией в канале (неравномерностью значения времени групповой задержки сигнала от частоты) и ошибкой синхронизации.

Скремблеры такого класса реализуются исключительно на сигнальных процессорах (в вышеописанном примере - на четырех), поэтому, располагая достаточно большой вычислительной мощностью, разработчики стараются внести в них дополнительные возможности, связанные прежде всего с повышением качества восстановления речи. Например, компенсация искажений частотной характеристики, вносимых каналом, компрессия динамического диапазона и др.

При включении в состав закрытого сигнала не только результата преобразования, но и псевдослучайных составляющих, которые определяются гаммой и исключаются затем на приемной стороне, стойкость системы существенно возрастает.

2.2.1.7 системы синхронизации СКРЕМБЛЕРов


Для большинства видов преобразований, применяемых в скремблерах, существует требование одновременности (синхронности) переключения генераторов гаммы и запуска цикла преобразования сигнала на передающей и приемной стороне.

Простейшие скремблеры могут быть построены без синхронизации. Это инверторы, двухполосные инверторы и частотные скремблеры с параметрами, не изменяющимися в течение сеанса связи. Стойкость таких систем невысока и ее увеличение может быть достигнуто только за счет изменения параметров преобразования во времени, которое должно быть обязательно синхронным.

Различают начальную и текущую синхронизацию. Начальная синхронизация выполняется при вхождении в закрытую связь до начала секретного разговора, задачей текущей синхронизации является слежение за некоторыми синхронизирующими сигналами, передаваемыми, как правило, обоими абонентами, для поддержания необходимой точности синхронизации на протяжении секретного разговора. То есть, начальная синхронизация - это однократное мероприятие в начале сеанса связи, а текущая - процесс, продолжающийся до окончания сеанса связи.

Возможны упрощенные системы синхронизации, содержащие только фазу начальной синхронизации, и поддерживающие текущую синхронизацию за счет достаточной стабильности частоты опорного генератора. Например, в системе полудуплексной защищенной радиосвязи на основе двухполосного инвертора с изменяемой частотой раздела при переходе в режим передачи выполняется передача синхронизирующего сообщения, а затем, переход в режим скремблирования с выполнением на передающей и на приемной стороне операций переключения частоты раздела по меткам времени, вырабатываемым внутренними таймерами (на вход таймера передатчика и приемника поступает сигнал тактовой частоты, формируемый кварцевым генератором). Если бы кварцевые генераторы передатчика и приемника имели идентичные частоты, то переключение частот раздела оставалось синхронным на протяжении произвольного времени. Для реальных кварцевых генераторов, выполненных в виде законченного электронного прибора типовая точность установки частоты составляет 10-5. Легко определить интервал времени, на протяжении которого моменты времени переключения в передатчике и приемнике разойдутся на величину более 2 мс: 2 мс / 10-5 = 200 с = 3.3 мин. То есть, в течение 3.3 минут непрерывной передачи (типовое время передачи при полудуплексе не превышает 30 с) рассинхронизации не произойдет.

Для дуплексных систем синхронизация должна поддерживаться в течение всего времени разговора (сеанса связи), поэтому только в простых и дешевых устройствах допустима работа без текущей синхронизации с заменой ее повторной начальной синхронизацией, переход к которой выполняется одним из операторов вручную, в полноценных дуплексных системах поддержание текущей синхронизации обязательно.

Сигналы текущей синхронизации передаются одновременно и в том же канале, что и закрытый сигнал, поэтому они должны быть такими, чтобы не создавать помех речевой связи и наоборот, чтобы закрытый речевой сигнал не создавал помех синхронизации.

Сигналы синхронизации могут передаваться с разделением относительно закрытого сигнала по времени или по частоте. Например, в одном из вариантов скремблера было введено сжатие масштаба времени, когда временной сегмент длительностью 30 мс передавался за 28 мс с образованием защитного интервала в 2 мс. В центре защитного интервала передавался сигнал синхронизации, представляющий собой отрезок синусоиды с однократным поворотом фазы. При обратном преобразовании масштаба времени на приемной стороне синхронизирующий сигнал исключался из последовательности отсчетов закрытого сигнала. В другом варианте скремблера сигнал текущей синхронизации передавался в виде непрерывного синусоидального сигнала на частоте 1800 Гц; исключение синхронизирующего сигнала на приемной стороне осуществлялось режекторным узкополосным фильтром.

Возможны симметричные и односторонние системы текущей синхронизации при дуплексной связи. Симметричная система предполагает наличие двух независимых процессов, когда каждый из двух приемников синхронизируется сигналами противоположного передатчика. При односторонней схеме один из передатчиков является ведущим, его сигналом синхронизируется как приемник, так и передатчик противоположного абонента, отдельного процесса синхронизации приемника на стороне ведущего передатчика не требуется, так как передатчики обеих сторон работают синхронно.

Для каналов связи с возможным смещением частоты (аппаратура уплотнения с частотным разделением каналов) может возникать необходимость в компенсации этого смещения (обязательное, например для некоторых типов ортогональных скремблеров). Известны системы текущей синхронизации, основанные на непрерывной передаче двух гармонических сигналов на верхней и нижней границах полосы канала, в которых помимо вычисления множителя изменения масштаба времени передатчика по отношению к приемнику, вычисляется также значение частоты смещения спектра передаваемого сигнала [30]. Практика показала эффективность применения таких сигналов при предварительном измерении масштаба времени и смещения частоты в канале для специальных модемов вокодеров и модулярных преобразователей (предварительное знание масштаба и смещения улучшает условия работы алгоритмов адаптации).

В большинстве систем синхронизации существует определенная последовательность передачи сигналов от одного абонента к другому, называемая протоколом, при этом один из абонентов должен являться ведущим, а другой ведомым. Такой порядок хорошо известен в системах передачи данных при помощи модемов, когда модемы однозначно знают, кто из них вызывающий, а кто - отвечающий. Определение ведущего абонента в системах связи на основе скремблеров может быть выполнено различными способами:
  • вызывающий абонент - ведущий;
  • в топологии системы связи типа “звезда” центральный абонент всегда ведущий;
  • ведущий абонент задается положением переключателя на аппарате или некоторыми действиями операторов по договоренности;
  • если аппараты содержат неповторяющийся номер, присвоенный аппарату и хранящийся в ПЗУ, то определение ведущего может выполняться передачей и последующим сравнением номеров;
  • аппараты генерируют случайные числа, определение ведущего выполняется передачей и последующим сравнением этих чисел.

Системы синхронизации скремблеров требуют усложнения устройств (увеличения объема памяти, быстродействия) и, кроме того, за счет задействования части ресурса канала связи в какой-то степени снижают качество речевой связи.

2.2.2 Кодеки


В данном разделе рассматриваются основные классы устройств защиты речи, использующие оцифрованные отсчеты сигнала (в том числе с различными видами адаптивного кодирования). Защита в кодеках обычно реализуется методами кодирования потока данных, так как в линии передаются цифровые данные. Такие системы имеют высокий уровень защиты, но применимы лишь в системах связи со скоростью передачи данных 16..64 кбит/с и, как правило, не реализуются средствами обычной телефонии. Далее использование кодеков для защиты речи рассматривается только обзорно.

2.2.2.1 Кодеки с компандированием динамического диапазона


Кодеки, широко распространенные в цифровой телефонии, выполняют аналоговую полосовую (0.2 - 3.6 кГц) фильтрацию речевого сигнала аналого-цифровое преобразование с частотой дискретизации 8 кГц и с точностью и динамическим диапазоном, соответствующими 13-разрядному АЦП; кодек выполняет логарифмическое преобразование, сокращающее объем описания до 8-ми разрядов на отсчет при сохранении 13-разрядного динамического диапазона (скорость передачи - 64 кбит/с). При восстановлении сигнала кодек выполняет экспоненциальное преобразование кода, цифро-аналоговое преобразование и аналоговую восстанавливающую НЧ фильтрацию с полосой 3.6 кГц. Ошибка преобразования перераспределяется таким образом, что в диапазоне уровней от 0 дБ до минус 30 дБ средняя ошибка остается постоянной и составляет около минус 30 дБ. Существуют два стандарта: кодеки с A-законом и µ-законом компандирования, отличающиеся коэффициентами логарифмического преобразования.

2.2.2.2 дельта-Кодеки


Дельта-кодеки кодируют величину со знаком (или только знак) приращения, которое при интегрировании дает наименьшую ошибку представления исходного сигнала. Требуемая частота дискретизации составляет порядка 64 кбит/с при одноразрядном кодировании. Дельта-кодеки отличаются предельной простотой.

2.2.2.3 адаптивные дельта-Кодеки


Адаптивные дельта-кодеки отличаются тем, что величина приращения динамически изменяется в зависимости от значения отсчета сигнала и скорости его изменения. Основные алгоритмы адаптивных кодеков основаны на анализе ошибки линейного предсказателя с небольшим числом коэффициентов.

Наиболее мощный алгоритм адаптивного кодирования представлен рекомендацией ISO X.722, в котором сигнал разделяется на две полосы, в каждой из которых выполняется адаптивное кодирование с различной скоростью. Суммарная скорость составляет от 16 до 64 Кбит/с при соответствующей ошибке от минус 30 дБ до минус 56 дБ.

2.2.3 Вокодеры


В данном разделе рассматриваются устройства высокого уровня защиты на основе представления речи моделью речеобразования, параметры которой кодируются как поток данных. В линии передаются данные посредством модема. Системы применимы в телефонной и радио сети, так как требуемая скорость передачи данных лежит в диапазоне 1200..9600 Бод. Рассматриваются три основных и наиболее современных класса систем речепреобразования: линейное предсказывающее кодирование (Linear Prediction Coding, LPC), линейное предсказание с возбуждением остатком (или ошибкой) (Residual Excited Linear Prediction, RELP), линейное предсказание с кодированием возбуждения по кодовой книге (Codebook Excited Linear Prediction, CELP). Остальные классы вокодеров рассматриваются только обзорно.

2.2.3.1. LPC


На рис. 2.5 приведена упрощенная структура вокодера на основе линейного предсказывающего кодирования [1].





Рис. 2.5. Вокодер на основе линейного предсказания


В передатчике LPC вокодера исходный речевой сигнал s разбивается на кадры длительностью 20 - 30 мс с умножением на окно (Ханна, Хэмминга), обычно с перекрытием в 1/2 или 1/3 длительности кадра. Для каждого кадра вычисляются коэффициенты предсказания {ai} или коэффициенты отражения {km}, оценивается период основного тона p (или признак шумового возбуждения p=0) и энергия E, которые затем квантуются адаптивным квантователем, упаковываются в двоичные кадры, шифруются путем гаммирования и передаются модемом в канал связи. Типовое число коэффициентов составляет 10; старшие коэффициенты кодируются большим числом бит (5 - 7), младшие - меньшим (2 - 3); общее число бит для 10 коэффициентов составляет 30 - 45. Период возбуждения кодируется 7-ю битами линейно, энергия или коэффициент усиления кодируются логарифмически 5-ю битами. Обычно при описании фильтра предпочтение отдается коэффициентам отражения, так как при квантовании (и возможной интерполяции на приемной стороне) коэффициентов предсказания возможны нарушения устойчивости фильтра синтезатора. В современных реализациях применяют для передачи описания фильтра квантованные линейные спектральные пары (LSP quantization), что дает снижение ошибки представления АЧХ фильтра по сравнению с квантованием {ai} или {km}.

В приемнике LPC вокодера данные от модема дешифруются гаммированием, значения параметров восстанавливаются по таблицам квантователя и интерполируются для предотвращения скачков параметров между кадрами. Период p и энергия E управляют формированием сигнала возбуждения v, поступающего на вход обратного фильтра 1/A(z) с интерполированными коэффициентами {km}. Выходной сигнал фильтра представляет восстановленный сигнал s, огибающая спектра которого аппроксимирована фильтром, содержащим только полюсы. На рис. 2.6 для примера представлены огибающие спектра синтетической гласной “А”, полученные вычислением модуля ДПФ с последующим сглаживанием окном и вычислением частотной характеристики обратного фильтра.

Р
ис. 2.6. Пример частотной характеристики полюсного фильтра


Модель LPC, аппроксимируя частотную характеристику полюсным фильтром, минимизирует ошибку для энергетически выраженных участков спектра исходного сигнала, т. е. для формантных пиков. Объем описания фильтра, моделирующего речевой тракт в LPC вокодере, является минимальным по сравнению с другими параметрическими моделями, что определяет низкую скорость передачи параметров: 1200 - 2400 бит/с.

2.2.3.2. RELP


Данный алгоритм основан на линейном предсказывающем кодировании, но с тем отличием, что информация о возбуждении фильтра передается более полно (аналогично классической схеме полувокодера, в которой помимо информации о частотной характеристике речевого тракта передается информация о сигнале возбуждения речевого тракта в достаточно большом объеме, достигающем, или даже превосходящем объем описания фильтра). Основу структуры RELP составляет структура LPC с дополнительным трактом обработки сигнала ошибки предсказания РС, которая используется в приемнике для восстановления сигнала возбуждения LPC фильтра. На рис. 2.7 приведена упрощенная структура вокодера на основе линейного предсказания с кодированием возбуждения [1].


Анализатор




Синтезатор




Рис. 2.7. Вокодер на основе линейного предсказания с кодироанием возбуждения


На передающей стороне вычисляются коэффициенты предсказания {ai}, квантуются и используются в кратковременном предсказателе STP (Short-Term Prediction), на вход которого поступает входной сигнал s(n), а на выходе образуется ошибка предсказания e(n), из которой выделяется низкочастотная составляющая путем НЧ фильтрации с децимацией с коэффициентом D. Полученное описание el(n/D) содержит наиболее существенную информацию для восстановления речи с естественным звучанием. Для более эффективного кодирования ошибки, содержащей на тональных участках речи периодическую составляющую с большим пик-фактором, выполняется долговременное предсказание децимированной ошибки ed долговременным предсказателем LTP (Long-Term Prediction) с небольшим числом коэффициентов (обычно с одним), но с индексом (значением задержки), определяемым периодом p сигнала ошибки. Ошибка r(n/D) на выходе долговременного предсказателя или остаток, имеет распределение, близкое к нормальному, и кодируется небольшим числом бит на отсчет (обычно 2 - 3 бита) с учетом энергии E остатка r(n/D) на длительности кадра.

В канал связи передаются квантованные коэффициенты LPC фильтра {km}, квантованные отсчеты остатка r(n/D), энергия E, коэффициент(ы) долговременного предсказателя , и период (длина предсказателя) p.

При восстановлении возбуждения на приемной стороне выполняется восстановление энергии возбуждения E, редецимация остатка дополнением каждого отсчета r(n/D) нулевыми отсчетами (D-1 нулевых отсчетов) и интерполяцией фильтром НЧ, аналогичным применяемому в передатчике. Далее восстанавливается ВЧ составляющая спектра сигнала возбуждения путем нелинейного преобразования F, ВЧ фильтрации результата преобразования и суммирования с восстановленной НЧ составляющей. Далее восстанавливается периодичность сигнала возбуждения инверсным фильтром LTIF с коэффициентами , p.

Полученный сигнал возбуждения v(n) поступает на вход инверсного фильтра STIF с деквантованными и интерполированными коэффициентами {km}, на выходе которого формируется восстановленный сигнал s(n).

2.2.3.3. CELP


Наиболее современными и мощными алгоритмами речепреобразования являются линейные предсказатели с кодированием возбуждения по кодовой книге [23, 24], которые дают высокое качество восстановления речи при скоростях передачи порядка 4800 бит/с. Алгоритмы класса CELP требуют больших вычислительных затрат (при реализации в соответствии с оригинальным описанием [23] - сотни MIPS).

В канал связи CELP передает не только параметры, описывающие частотную характеристику речевого тракта аналогично LPC, но и информацию о сигнале возбуждения речевого тракта в виде ссылки на образцы (элементы кодовой книги), которые хранятся в анализаторе и синтезаторе.

На рис. 2.8 представлена структура алгоритма CELP, основным свойством которого является анализ через синтез, т. е. на стороне анализатора многократно выполняется процедура синтеза с минимизацией некоторой ошибки при сопоставлении с исходным сигналом, найденные значения параметров синтеза и будут представлять результат анализа.


Анализатор




Синтезатор




Рис. 2.8. Вокодер на основе линейного предсказания с кодироанием возбуждения


На передающей стороне выполняется обычный LPC анализ и квантование коэффициентов предсказания {ak} (или коэффициентов отражения или линейных спектральных пар); далее входной сигнал поступает на кратковременный предсказатель STP, по сигналу ошибки которого определяются параметры долговременного предсказателя, используемые также в процедуре поиска по кодовой книге CB; последовательности возбуждения из кодовой книги поступают на вход модели синтезатора, содержащего последовательно включенные инверсные фильтры LTIF и STIF, управляемые соответствующими квантованными коэффициентами, разность синтезированного и исходного сигналов как ошибка используется как ошибка в процедуре поиска по кодовой книге. В канал (подразумевается наличие процедуры закрытия и модемов) выдаются индекс (адрес в кодовой книге) I, усиление возбуждения E, коэффициенты LTP , p и коэффициенты LPC {ak}.

На приемной стороне производится деквантование коэффициентов, выбор возбуждающей последовательности с номером I из кодовой книги, умножение на усиление E и формирование инверсным фильтром LTIF с коэффициентами , p возбуждения фильтра STIF с коэффициентами {ak}, выходной сигнал которого является восстановленным сигналом s.

2.2.3.4. другие структуры вокодеров


Начиная с 1938 г., когда Гомер Дадли создал первый вокодер, развивалось целое дерево аналогичных структур, в которых оптимизировалась как модель, так и способы описания фильтра, моделирующего речевой тракт [25].

Не рассматривая подробности вопроса, отметим лишь, что все эти структуры постепенно утратили свое значение, уступив место вокодерам с линейным предсказанием, оставив после себя только одну конкурентноспособную основную структуру полосного вокодера Дадли. Полосный или спектрально-полосный вокодер обладает некоторым преимуществом по сравнению с LPC - некоторые эксперты отмечают более высокую разборчивость полосных вокодеров при несколько большем объеме описания, хотя субъективно естественность у LPC вокодеров выше. Сохраняется также структура полувокодера, в которой передается информация не только о частотной характеристике речевого тракта, но и описание самого речевого сигнала в узкой НЧ полосе. При синтезе вначале производится восстановление сигнала возбуждения фильтра по переданной узкополосной части РС. Восстановление высокочастотной части сигнала возбуждения чаще всего осуществляется нелинейным преобразованием НЧ сигнала (однополупериодное выпрямление) с последующим выравниванием спектра гребенкой фильтров с ограничителями уровня. Эти структуры обычно не применяются в системах с цифровой обработкой сигналов.

2.2.4 Модемы в системах защиты речи


Как ни странно, применение современных стандартных модемов для передачи речевой информации оказывается неудобным по нескольким причинам. Широко распространенные модемы являются предельно универсальными для совместимости с огромным парком модемов разных производителей. Конечно, они соответствуют рекомендациям, но все-таки, иногда в некоторых режимах бывают несовместимыми. Кроме того, модемы могут иметь нестандартные режимы, использующиеся при связи с “родными братьями”, т. е. модемами одного класса и одного производителя. Главной причиной неудовлетворительной работы в вокодерных системах современных интеллектуальных модемов является то, что в них заложена цель достоверной доставки данных при некритичных требованиях к времени доставки и непрерывности связи (существуют специальные нестандартные протоколы, например протокол ZyCell в модемах ZyXEL 1496E, но они предназначены только для поддержания неразрывного сеанса связи).

Модемы, предназначенные для передачи речевой информации (шифрованных параметров речепреобразования), должны обеспечивать прежде всего устойчивую непрерывную связь без задержки передачи (с минимально возможной задержкой) при некритичных или ограниченных требованиях к достоверности. Это означает, что в “речевых” модемах должны быть приняты меры для поддержания связи при существенных уровнях помех и изменениях характеристик канала, вплоть до полного пропадания сигнала, т. е. связь должна поддерживаться всеми силами до тех пор, пока абонент сам не примет решения об окончании сеанса связи. Еще один фокус заключается в том, что нет особой необходимости в применении мер повышения достоверности передачи речевой информации, оказывается, лучше опираться на исправляющую способность слуха, чем вводить помехозащищенное кодирование с избыточностью, которая при прочих равных условиях приводит к существенному снижению скорости передачи информации и к соответствующему общему ухудшению качества речепреобразования. Единственное, что дает ощутимый эффект - это защита наиболее важных параметров (таких, как период, тон, энергия, старшие коэффициенты предсказания) контрольным кодом (возможно, только битом четности) для замены искаженного параметра значением из предыдущего кадра или интерполированным значением по предыдущему и последующему кадрам.

В связи с этим, модемы в системах защиты речи должны иметь специальные протоколы вхождения в связь и поддержания связи, специальную структуру сигналов и специальные алгоритмы обработки сигналов, которые могут оказаться сложнее, чем в обычных модемах, и требовать существенных ресурсов системы.

Естественно, что снижение скорости передачи улучшает устойчивость и помехозащищенность связи при ухудшении качества канала. Нижним пределом диапазона скоростей передачи речевых модемов можно считать 1200 - 2400 Бод. Применение модемов со скоростью передачи ниже 1200 Бод нецелесообразно в связи с ухудшением качества речепреобразования. Передача со скоростью свыше 9600 Бод по телефонным проводным или радиоканалам также нецелесообразна, так как, с одной стороны, увеличение объема описания для модели речепреобразования уже несущественно улучшает качество речи, а с другой - повышение скорости передачи будет требовать больших ресурсов при ухудшении устойчивости и помехозащищенности связи.

Еще одним свойством речевого модема является необязательность совместимости с существующими модемами передачи данных, так как в защищенной системе связи речевые модемы будут взаимодействовать только с аналогичными модемами. Это позволяет сократить ресурсы и направить их на решение задач улучшения качества речевой связи, а также выбрать узкоспециализированную и, поэтому, более эффективную систему сигналов и протоколов.

Помимо передачи речевой информации модем в составе устройства защиты выполняет ряд служебных функций, таких как: определение конфигурации “ведущий - ведомый”, передача ключевой информации, передача идентификационной и другой служебной информации, начальная и текущая синхронизация, передача ряда сигналов взаимодействия с конкретной системой связи (сигналы вызова абонента, сигналы отключения эхозаградителя и измерения задержки распространения сигналов и др.).

2.2.5 Модулярные системы


Ниже рассматривается оригинальный класс устройств высокого уровня защиты на основе модулярного преобразования сигнала. Такое преобразование совмещает процесс модуляции и закрытия путем выполнения операций по модулю некоторого достаточно большого числа над цифровыми отсчетами сигнала и гаммой.

Идея модулярного преобразования достаточно проста: если отсчеты исходного сигнала представлены числами, то эти числа могут быть подвергнуты шифрованию и преобразованы в отсчеты зашифрованного сигнала; восстановление подразумевает взятие отсчетов, расшифрование и преобразование в исходные отсчеты. Закрытый сигнал представлен статистически не связанными отсчетами, что дает степень закрытия, соответствующую алгоритмам шифрования данных.

Трудность прямого решения данной задачи заключается в том, что необходимо при шифровании отсчетов сохранять полосу исходного сигнала без “просачивания” исходной статистики в результат преобразования и, главное, восстанавливать сигнал при наличии шума и/или необратимых искажений в закрытом сигнале так, чтобы мощность шума существенно не увеличивалась при восстановлении сигнала.

На рис. 2.9. представлена упрощенная структура передающей и приемной части модулярного преобразователя. Исходный сигнал s преобразованием Гильберта H переводится в комплексные отсчеты и переносится к нулю частот (обозначим s0(n)) умножением на отсчеты сигнала условной несущей частоты fc такой, чтобы полоса сигнала была симметричной относительно нуля частоты и, естественно, меньше половины частоты дискретизации fs. Отсчет s0(n) выражается в виде пары целых (неотрицательных) чисел длиной d двоичных разрядов. Числа шифруются сложением по mod 2d с элементами гаммы g0(n) также длиной d двоичных разрядов, выражаются в виде отсчетов, пропущенных через формирующий фильтр Найквиста F, и переносятся на несущую fq (не обязательно fc = fq) для получения действительных отсчетов q(n) и, соответственно, сигнала q(t). На приемной стороне обеспечивается строгая синфазность дискретизации сигнала q(t) по отношению к передатчику, компенсация линейных искажений в канале (корректор) и обратное преобразование с переносом на нулевую несущую по fq. Комплексные отсчеты представляются d-разрядными числами, суммируются по mod 2d с элементами гаммы приемника g0(n) и переносятся в действительную область на частоту fc для получения отсчетов s(n) и восстановления сигнала s(t). Значение d определяется требованиями к динамическому диапазону s(t) и q(t).





Рис. 2.9. Структура модулярного преобразователя


Сигнал модулярного преобразователя в комплексном виде представляет собой квадратное созвездие с большим числом равноотстоящих точек (22d) с равномерной плотностью распределения вероятности, обеспечиваемой генератором гаммы. Сложение координат точек g0 по mod 2d с координатами, представляющими сигнал s0, сохраняет характеристики распределения гаммы [12], что определяет высокую степень защиты сигнала (исключение статистики исходного сигнала).

Особым свойством модулярного преобразования является трансформация искажений любого рода в канале передачи в шум, близкий к нормальному, уровень которого не зависит от амплитуды передаваемого речевого сигнала и пропорционален приведенной ошибке. Ошибка при восстановлении сигнала модулярного преобразования определяется продуктами нелинейных преобразований в тракте передачи, энергетическими потерями в полосе сигнала, ошибкой корректора из-за ограниченной длины импульсной характеристики фильтра, ошибкой подавителя сигнала эхо, вычислительными ошибками и, наконец, уровнем мощности шума в канале.

Модулярный метод применим при относительно высоком качестве канала с приведенной ошибкой порядка минус 30 дБ (испытания показали, что хорошее качество достигается на подавляющем большинстве соединений ГАТС, но неудовлетворительное - на большинстве междугородных соединений). Требования к каналу для передачи модулярного сигнала примерно соответствуют требованиям к модемной передаче данных со скоростью 9600 - 12000 Бод.

Достоинством модулярного преобразования, по сравнению с вокодерными системами, является передача “чистой” речи, т. е. не подвергнутой речепреобразованию. Показатели разборчивости, естественности и узнаваемости у модулярных аппаратов защищенной связи наивысшие среди рассматриваемых классов. Искажения различной природы в вокодерном восстановленном сигнале заменяются при модулярном преобразовании шумовым сигналом, к которому в наилучшей степени адаптируется слух человека.

Сигнал s(t) может иметь произвольную природу, в частности, это может быть факсимильный или модемный сигнал (до скорости передачи 9600 Бод включительно).

2.2.6 Алгоритмы шифрования


В скремблерах алгоритм шифрования не является изолированным, а заложен в сам алгоритм преобразования речевого сигнала. Шифрование здесь заключается в формировании генератором гаммы псевдослучайной последовательности кодов, определяющих значения индексов в алгоритме преобразования речевого сигнала (номера частот раздела, номера позиций временных сегментов и др.).

В кодеках и вокодерах, в отличие от шифрования данных (текста), шифрование параметрической информации, содержащей непредсказуемую компоненту, является специфической задачей. По мнению многих специалистов, операции замены и гаммирования с обратной связью не являются необходимыми для шифрования параметрической информации. Предполагается, что единственной операцией должно быть гаммирование без обратной связи цифрового потока параметрической информации. При гаммировании цифрового потока выполняется операция сложения по модулю 2 поразрядно, т. е. каждый бит последовательности гаммы складывается с соответствующим битом последовательности данных.

Алгоритм генерации гаммы должен удовлетворять ряду условий для “хорошего” генератора случайных чисел (бит) [12]. Длина цикла генератора должна быть такой, чтобы исключить повторение последовательности на некотором достаточно большом интервале времени при условии непрерывной работы генератора, например, в системах высокой стойкости применяются генераторы с циклом в сотни лет. При построении генератора применяются алгоритмы формирования m-последовательностей (в простейших реализациях), линейных конгруэнтных последовательностей или комбинированные алгоритмы с двумя разнородными генераторами, один из которых формирует псевдослучайные коды, а другой выполняет их перестановки [12].

При наличии определенных требований (заказчика) в качестве алгоритма шифрования может быть использован алгоритм ГОСТ 28147-89 в режиме гаммирования или другой алгоритм шифрования данных, но только в режимах без обратной связи и без поблочного шифрования (такие режимы при наличии ошибок разрушают данные, следующие за ошибкой или искажают данные целого блока).

В главе 3 будут подробно рассмотрены реализации алгоритмов шифрования и генераторов гаммы в конкретных проектах.