40. Динамические экспертные системы

Вид материалаДокументы

Содержание


58. Методы построения отказоустойчивых систем, работающих вне реального масштаба времени.
Методы активной отказоустойчивости
Резервирование замещением с горячим резервом и обнаружением ошибок с использованием контроля по модулю
Подобный материал:
1   2   3   4   5   6   7   8   9

Функцию на последних четырех наборах доопределим, ис­ходя из условия получения минимальной формы записи функ­ции решающего органа. Тогда



Можно найти условия, при которых использование схемы резервирования с постоянным замещением более выгодно (по надежности и аппаратурным затратам), чем схемы с мажори­тарным резервированием.

Отметим, что сложность мажоритарного органа в схеме резервирования с голосованием по большинству практически равна сложности решающего органа в схеме резервирования с постоянным замещением.

Возможны два варианта разбиения исходной схемы уст­ройства на подсхемы:

на низком уровне (надежность решающего и мажоритар­ного органов соизмерима с надежностью резервируемых под­схем) ;

на более высоком уровне (сложность решающих органов несоизмеримо меньше сложности резервируемых подсхем) надежностью решающего и мажоритарного органов можно пренебречь

Остановимся на втором случае, так как первый не имеет практического применения. Обозначим сложность (число эле­ментов) исходной резервируемой схемы , а сложность схемы обнаружения ошибки (схемы контроля) . Тогда

где — коэффициент, указывающий во сколько раз схема обнаружения меньше по сложности исходной схемы.

Найдем предельно допустимую сложность схемы обнару­жения, при которой сложность схемы резервирования с по­стоянным замещением будет еще оставаться ниже слож­ности схемы резервирования с голосованием по большинству

Nмаж, Т. е.



Из УСЛОВИЯ НАХОДИМ

Приведем сравнение рассматриваемых избыточных схем

по .надежности:



где p(t), pK(t) —надежность схем исходной и обнаружения ошибки.

Графически зависимость Рмаж(t) =f[p(t)] и Paail{t) = = ф[р(t)] показана на рис. 23.

При схема резервирования с постоянным замещени­ем всегда имеет более высокую надежность, чем схема ре­зервирования с голосованием по большинству, причем чем больше а, тем существеннее получаемый выигрыш в надеж­ности.

Схема резервирования с постоянным замещением обладает рядом достоинств по сравнению со схемой мажоритарного ре­зервирования.

При мажоритарном резервировании для исправления не­исправностей кратности d аппаратурные затраты определя­ются сложностью исходных схем, где . Для ис­правления неисправностей той же кратности в схеме резерви­рования с постоянным замещением—сложностью лишь = d+1 исходных схем.

В схеме резервирования с постоянным замещением выра­батываемый сигнал ошибки — индикатор отказа, позволяю­щий точно указать канал, в котором произошел отказ. Реа­лизация такой возможности в схеме резервирования с голо­сованием по большинству требует специального дополнитель­ного оборудования.

Если резервируемая схема имеет больше одного выхода, то число схем обнаружения ошибок может и не увеличивать­ся, так как одна схема обнаружения может быть использо­вана для всех или по крайней мере для нескольких выходов.

Использование корректирующих кодов

Из п двоичных символов можно получить различных кодовых комбинаций (кодовых слов или кодовых векторов). Если для передачи или преобразования информации исполь­зуется N кодовых комбинаций таких, что , такой код называется натуральным двоичным.

Все N комбинации этого кода — рабочие или разрешен­ные, а сам натуральный двоичный код — безубыточный. Ис­кажение любого символа в кодовом слое приводит к получению некоторого кодового слова, которое также разрешенное.

Для исправления (обнаружения) ошибок в кодовых сло­вах .применяют корректирующие коды .(рис. 24).

Корректирующие коды избыточные [5]. Из общего числа возможных кодовых комбинаций только разрешенные, остальные (NNh) — запрещенные. Это обстоя­тельство и .позволяет 'проводить коррекцию ошибок. Подроб­но .корректирующие коды рассматриваются в части II данного учебного пособия.


^ 58. Методы построения отказоустойчивых систем, работающих вне реального масштаба времени.

С целью повышения надежности широко применяют раз­личные методы обеспечения отказоустойчивости [4].

Отказоустойчивость это свойство цифрового устройства со­хранять работоспособность при отказе отдельных его частей (элементов). При этом необходимо учитывать характер работы исходного устройства, т. е. работает ли это устройство в реальном, либо в нереальном масштабе времени.

Для устройств, работающих вне реального масштаба вре­мени, реализация отказоустойчивости связана с выполнением трех операций:
  1. обнаружением отказа;
  2. локализацией отказа;
  3. реконфигурацией структуры устройства, в результате кото­рой отказавший элемент (узел) должен быть исключен от участия в работе.

Такой вид отказоустойчивости называют активной отказо­устойчивостью (требует введения временных затрат).

К устройствам, к которым могут быть применимы мето­ды активной отказоустойчивости, относятся устройства, имею­щие либо возможность накапливать информацию в ЗУ и ве­сти ее обработку в общем случае по произвольной програм­ме (ЭВМ), либо устройства, где допустимы перерывы в ра­боте, что не сказывается на конечном результате (устрой­ства измерительной техники).


^ Методы активной отказоустойчивости

Методы активной отказоустойчивости применимы прежде всего для повышения надежности ЭВМ и многомашинных вычислительных систем. Эти методы предполагают введение трех типов избыточности:

временной, заключающейся в наличии дополнительного вре­мени для решения задач, с. тем, чтобы в случае возникнове­ния отказов или сбоев можно было их исправить путем повто­рения вычислений;

алгоритмической, обусловленной применением та:ких алго­ритмов, которые обеспечивают удовлетворительные результаты в случае наличия или возникновения ошибок в процессе вы­числений; как правило, алгоритмическая избыточность предполагает наличие временной избыточности и пред­ставляет собой способ ее реализации (например, свой­ствами избыточных алгоритмов обладают итерационные алго­ритмы, обеспечивающие сходимость при больших случайных отключениях (промежуточных результатов;

структурной, которая выражается в наличии дополнитель­ных элементов, узлов ((устройств) и является наиболее эффек­тивным видом избыточности; заметим, что введение времен­ной избыточности всегда требует некоторой структурной из- быточности (организация коммутации, хранение информа­ции и т. п.).

Остановимся «а двух методах активной отказоустойчи­вости:

•резервирование замещением с горячим резервом и обна­ружением ошибок с использованием контроля по модулю (рис. 25 а);

резервирование замещением с горячим резервом и обна­ружением ошибок с использованием сравнения выходных сигналов и тестового контроля (рис. 25 6).


^ Резервирование замещением с горячим резервом и обнаружением ошибок с использованием контроля по модулю

Предполагается, что ЭВМ разбита на отдельные блоки, которые могут быть зарезервированы. Зарезервированный блок (блоки) будем называть каналом.

Принцип работы схемы резервирования замещением с контролем по модулю в каждом канале (см. рис. 25 а) за­ключается в следующем. Оба канала работают параллельно, по на выход подключен только один канал. В случае отказа одного из каналов со схемы контроля этого канала поступит сигнал ошибки, который переключит триггер ГОш и выдаст сигнал в блок управления на повторные операции. На выход при этом подключится другой исправный канал.

Результат операции, при проведении которой произошла ошибка, списывается. Если в первом канале произошел не отказ, а сбой, то сигнал на выходе триггера через некоторое время исчезнет и схема снова будет готова к работе. Если сбой повторится, то схема будет переключаться с одного ка­нала на другой, пока сбой в одном из каналов не самоустра­нится.

Этот же принцип резервирования может быть использо­ван на уровне ЭВМ. Две ЭВМ связаны между собой общей шиной и имеют общее поле памяти. Основная ЭВМ выполня­ет рабочую программу и посылает в резервную информацию с контрольных точек с тем, чтобы последняя смогла продол­жить работу при отказе основной. В резервной ЭВМ имеется копия программы и всех файлов. Отказ основной ЭВМ об­наруживается резервной по отсутствию ответа на периодичес­кое сообщение «Исправно», которая берет на себя выполне­ние программы [6].


Резервирование замещением с горячим резервом и обнаружением

ошибок с использованием сравнения выходных сигналов

и тестового контроля

Схема резервирования замещением с контролем и исполь­зованием тестового контроля для выявления неисправного канала (см. рис. 25 6) работает следующим образом.

При наличии несовпадения выходных сигналов с основно­го и резервного блоков в блоке сравнения вырабатывается сигнал ошибок, прерывающий прохождение текущей опера­ции, промежуточный результат записывается в ЗУ и блок уп­равления переходов дает команду на проведение тестового контроля блоков.

По результатам тестового контроля определяется неис­правный блок, который по сигналу анализатора теста бло­кируется на выходе в схеме выходного коммутатора.

Рассматриваемый метод резервирования замещением тре­бует дополнительного времени для выполнения контроля. Как и в предыдущем методе здесь необходимо разбить программу на участки и при несовпадении результатов операции повто­рять отдельные участки. Это связано с необходимостью дли­тельного хранения информации в ЗУ.

Очевидно, что такой метод резервирования может быть применен и при резервировании ЭВМ ,в целом.

Отказоустойчивость многопроцессорных и многомашинных систем

Типовая структура многопроцессорной системы приведена на рис. 26 а. Подключение отдельных модулей проводится с помощью матричных коммутаторов. Широко используется также многопроцессорная система с шинной организацией (рис. 26 6).

В отказоустойчивой многопроцессорной системе все основ­ные функциональные модули зарезервированы. По сигналу ошибки, выданному средствами аппаратного контроля про­цессора, его работа блокируется и запускается резервный процессор.

Переход на продолжение программы происходит в три этапа:

установка состояния системы (задание начального адреса, состояний регистров ошибки, сброс триггеров остановки

и др.);

защита данных, хранимых в резервном ЗУ; запуск программы. Помимо контроля функционирования отдельных модулей осуществляется также контроль шинных магистралей, кото­рые, в свою очередь, могут быть зарезервированы.

При проектировании многомашинных систем [7] исполь­зуют несколько типовых структур (рис. 27). Создание рабо­чей конфигурации системы при выходе из строя одной из ЭВМ происходит по сигналу отказа этой ЭВМ. Устройство реконфигурации исключает неисправную ЭВМ из системы и определяет работоспособную конфигурацию структуры. При этом система может деградировать, т. е. потерять исходную производительность.

В схеме (рис. 27 а) каждая ЭВМ соединена со всеми ос­тальными по выделенному каналу. При отказе одной ЭВМ система продолжает работать. При отказе основных линий связи могут использоваться резервные пути передачи данных. В схеме (рис. 27 6) все сообщения разбиты на пакеты и пе­редаются через доступные узлы. Между двумя ЭВМ сущест­вуют минимум два пути. При отказе одной ЭВМ система продолжает работать.

В схеме (рис. 27 в) используется общая (глобальная) ши­на, по которой осуществляется взаимодействие между ЭВМ. Отказ системы происходит только при отказе шины. Отказ отдельных ЭВМ при наличии соответствующих схем изоляции и защиты не приводит к отказу системы.

В кольцевой структуре (рис. 27 г) передача данных по кольцу обеспечивается по дублированным магистралям. От­каз кольцевой магистрали в какой-либо точке может обнару­живаться как прекращение передачи синхронизирующего сигнала. Местонахождение отказа фиксируется по признаку нарушения обмена между ЭВМ, после чего выдается коман­да на передачу информации между этими машинами по про­тивоположному неповрежденному контуру кольца.

В многомашинных системах используются различные ме­тоды функционального и тестового диагностирования. При поиске неисправностей в отказоустойчивой системе с по­мощью встроенных средств функционального диагностиро­вания, как правило, в начале проверяют наличие ошибок во входных данных ЭВМ (в противном случае возможно лож­ное выявление дефектов), а затем правильность сигналов синхронизации, питающих напряжений и функциональных частей ЭВМ.