Методы цифрового анализа текстовых сообщений для идентификации спама

Вид материалаДокументы
Использование систем синхронизации генераторов ПСПв детекторах ошибок устройств контроляцифровых каналов связи.
Нижегородский госуниверситет.
Структурная идентификация объектов на основе определения базовых параметров входных и выходных процессов
Рис.1 Структурная схема объекта
Подобный материал:
1   2   3   4   5   6

Использование систем синхронизации генераторов ПСП
в детекторах ошибок устройств контроля
цифровых каналов связи.


В.В.Акулов1), К.Г.Кирьянов2)

1)ФГУП ННИПИ «Кварц», 2) Нижегородский госуниверситет.

В работе рассмотрены уравнения динамики и примеры практического использования систем синхронизации генераторов ПСП в анализаторах ошибок (устройствах измерения верности передачи информации в цифровых трактах) при контроле каналов связи.

Детектор ошибок решает следующие задачи:
  1. формирование внутренней тест-последовательности;
  2. синхронизация внутренней тест-последовательности с входной внешней тест-последовательностью;
  3. выделение ошибок из входной тест-последовательности путем сравнения входной внешней и внутренней тест-последовательностей;
  4. подсчет количества ошибок счетчиком ошибок.

Тест-последовательность подается на объект контроля, с которого поступает на анализатор ошибок, для проверки качества работы объекта контроля. В качестве тест-последовательности наиболее часто используется псевдослучайная последовательность (ПСП) максимальной длины (М-последовательность).

Известны устройства для детектирования ошибок [1,2], в которых используются систематические свойства М-последовательностей, которые позволяют достаточно точно проводить измерение количества ошибок. Недостатком таких устройств является недостаточная помехоустойчивость – невозможность синхронизации при приеме входной внешней М-последовательности с большим средним по времени коэффициентом ошибок ош. вх. max . На основании анализа уравнений динамики систем синхронизации генераторов ПСП предложены детекторы ошибок с возможностью измерения коэффициентов ошибок от 0 до 1, повышенной надежности и минимальным временем входа в синхронизм.


  1. Авторское свидетельство СССР № 1251335 кл. Н04В3/46, 1985 г. В. С. Балан, М.С Гроссман. Устройство для детектирования ошибок.
  2. Заявка на изобретение СССР № 4832472/09 (059243) от 29.05.90 г., МК.5 Н04В3/46. Устройство для детектирования ошибок.
  3. К.Г.Кирьянов, В. В. Акулов, А. С. Меднов, АС №1709542



Структурная идентификация объектов на основе определения базовых параметров входных и выходных процессов


К.Г.Кирьянов, А.А.Горбунов, Д.Л.Туренко

Нижегородский госуниверситет

Рассмотрена модификация способа [1] поиска оптимальных базовых параметров (БП) векторных нестационарных объектов (рис.1) на неавтономные математические модели Источников данных на основе анализа известных (полученных экспериментально) не только выходных (y(t)), но и входных (u(t)) и последовательностей данных.




Рис.1 Структурная схема объекта
Математическая модель (ММ) Источника данных типа “Чёрный Ящик” в форме синхронного автомата Хаффмана – Глушкова описывается следующей системой уравнений:



Здесь:

u(t) – входной векторный k-мерный сигнал автомата;

y(t) – выходной векторный r-мерный сигнал автомата;

x(t) – внутреннее n-мерное состояние автомата;

xн – начальное n-мерное состояние автомата; t  [0, 1, 2, …, М] – дискретное время. Можно показать, что уравнения (1) и (2) в ряде случаев сводятся к удобной для практики форме (3), не содержащей явно компонент внутреннего состояния x(t)

, (3)

к которым, если требуется, можно перейти от уравнения (3).

Для нас существенно, что данная форма является модификацией прогнозирующего оператора очередного векторного отсчета y(t) не только по ny выходным отсчетам [1], но и по предыдущим nu входным отсчетам. То есть оптимальные Базовые Параметры (БП) =, где n = knu +rny, q = qu = qy , можно определять по критерию, как и в [1], минимальной энтропии, но в изменённой форме:

(4)

путем восстановления фазовой траектории n-мерного фазового по экспериментальным данным входа и выхода.

В таблице 1 представлены результаты компьютерного моделирования предложенного способа структурной идентификации объектов с ММ рис. 1 путём экспериментального поиска БП по q в области в критерии (4) при известных входных последовательностей (генетических текстов u(t) из GenBank длиной с M=347) и соответствующих выходных процессов y(t) с идентифицируемых АРСС- автоматов в кольцах K(q).

Таблица 1




БП входных и выходных процессов идентифицируемого автомата

Размерности векторов входов и выходов k , r автомата

Найденные экспериментально оптимальные БП

эквивалентных объектов

(автоматов)

1

q = 4 ; nu = 1 ; ny = 5

k = 1 , r = 1

q = 4 ; nu = 1 ; ny = 5

2

q = 4 ; nu = 5 ; ny = 3

k = 1 , r = 1

q = 4 ; nu = 5 ; ny = 3

3

q = 4 ; nu = 2 ; ny = 7

k = 1 , r = 1

q = 2 ; nu = 11; ny = 7

q = 4 ; nu = 2 ; ny = 7*)

4

q = 22 ; nu = 3 ; ny = 4

k = 1 , r = 1

q = 2 ; nu = 8 ; ny = 7

q = 22; nu = 0; ny = 4*)

5

q = 4 ; nu = 3 ; ny = 4

k = 2 , r = 2

q = 2 ; nu = 4 ; ny = 5

q = 4 ; nu = 2 ; ny = 4*)

6

q = 22 ; nu = 1 ; ny = 3

k = 2 , r = 2

q = 3 ; nu = 0 ; ny = 5

q = 22; nu = 0; ny = 2*)

Способ даёт возможность отбирать и “имеющие смысл” БП (см. строки, отмеченные знаком *)) близкие к оптимальным по критерию (4) или его вариантам.

Другие применения предложенного способа структурной идентификации объектов рассмотрены в работах [2], [3].

  1. Кирьянов К.Г. Труды III Международной конференции «Идентификация систем и задачи управления» SICPRO04. Москва, Институт проблем управления им. В.А.Трапезникова РАН. М.: 2004. С.187-208.
  2. Грунина Е.А., Кирьянов К.Г. Подход к исследованию математических моделей функциональных подсистем сложных биосистем (на основе определения их базовых параметров). Статья в настоящем сборнике.
  3. Горбунов А.А., Кирьянов К.Г. Сравнение подходов к оценке расстояния единственности криптосистем. Статья в настоящем сборнике.