Агрегирование моделей анализа надежности и безопасности технических систем сложной структуры 05. 13. 01 Системный анализ, управление и обработка информации (в технических системах)

Вид материалаАвтореферат

Содержание


Вид Расчета
Подобный материал:
1   2   3
Глава 3 посвящена исследованиям надежности и производительности технологических систем, в рамках которых решаются задачи создания динамической модели надежности двухфазных технологических участков с промежуточными накопителями, построения и декомпозиции модели многофазных участков, программной агрегации динамических моделей с логико-вероятностной моделью надежности системы.

Многофазными называют системы, в которых технологический процесс и обеспечивающее оборудование разделен на участки, называемые фазами. Работа многофазной системы организована так, что на вход ее первого участка с производительностью q1 на каждом отрезке времени t поступает столько единиц продукции, сколько он сможет обработать за это время при безотказной работе. После обработки на первом участке продукция поступает на вход второго участка, затем третьего и т.д. Вся система считается работоспособной в данный момент времени, если она может выдавать продукцию на выход своего последнего участка. Отказы устройств любого из участков, если не приняты специальные меры обеспечения отказоустойчивости, приводят к вынужденному простою системы и снижают ее производительность. Один из способов улучшения показателей надежности и эффективности заключается во введении в многофазную систему промежуточных накопителей, позволяющих при отказах не останавливать работу смежных с отказавшим участков, реализовав, таким образом, раздельный резерв времени.

В разделе 3.1 проведена классификация многофазных систем по признакам: количества потоков перерабатываемой продукции (однопоточные, многопоточные); типов накопителей (транзитные, тупиковые, смешанные); особенностям функционирования, отказов, обслуживания; уровням производительности; соотношения номинальных производительностей в фазах; необходимости опустошения накопителя при ремонте.

В работах Черкесова Г.Н. проведено исследование надежности многофазных однопоточных систем с абсолютно надежными накопителями. Диссертационная работа расширяет и дополняет эти исследования учетом ненадежности накопителей и многопоточности.

Раздел 3.2 посвящен методическим аспектам построения математической модели (двухпараметрического марковского процесса) двухфазных систем с накопителями.

Схема однопоточной двухфазной системы с транзитным накопителем показана на рис.3.

Рис.3. Однопоточная двухфазная система с транзитным накопителем

Здесь 1 и 2 – обрабатывающие устройства, 3 – накопитель.

Каждое устройство характеризуется производительностью qi, интенсивностью отказов i, интенсивностью восстановлений i; накопитель характеризуется емкостью z (0 ≤ z ≤ zM), интенсивностью отказов н, интенсивностью восстановлений н . Состояния двухфазной системы будем обозначать трехразрядным двоичным цифровым кодом. Первые два разряда обозначают, соответственно, состояния каждого из двух устройств, а третья – состояние накопителя. Цифра 1 означает работоспособное состояние, 0 – неработоспособное.

Каждое устройство характеризуется тремя уровнями запаса в накопителе:
  • нулевой уровень (z = 0); подмножество состояний марковской модели, соответствующее нулевому уровню будем обозначать G
  • максимальный уровень (z = zM); подмножество состояний марковской модели, соответствующее максимальному уровню будем обозначать V
  • промежуточный уровень (0 < z < zM); подмножество состояний марковской модели, соответствующее промежуточному уровню будем обозначать W

Определим порядок построения пространства состояний и графа переходов:
  1. Выписываются все возможные состояния для подмножеств G, V, W
  2. Анализируются состояния в соответствии с учитываемыми особенностями функционирования и отказов и вычеркиваются те из них, которые невозможны для рассматриваемого подмножества и к которым нет перехода
  3. Определяются те состояния системы, к которым осуществляются предельные переходы (это переходы из подмножества W в подмножества V и G, связанные с переходами запаса накопителя на предельные уровни; на графе обозначаются пунктиром).
  4. Определяются граничные переходы из подмножества V и G в подмножество W (эти переходы осуществляются для тех состояний подмножества V и G, для которых отказ или восстановление какого-либо элемента приводят к изменению уровня запаса, начиная с предельного уровня; на графе также изображаются пунктиром с соответствующей интенсивностью).

После построения ориентированного графа состояний составляется математическая модель системы. Обозначим вероятности состояний для подмножества W как P(z,t), а для подмножества V и G – F(zM,t) и F(0,t) соответственно.

В работе изложен методика составления разностного уравнения для характерных состояний системы. В качестве характерных берутся следующие:
  1. Состояния, в которые и из которых осуществляются переходы в пределах одного подмножества
  2. Состояния, в которые осуществляется предельный переход
  3. Состояния, из которых осуществляются граничные переходы (уравнения для этих состояний определяют граничные условия).

На рис.4 приведены графы, для состояния αi которых описана методика составления разностных уравнений и получения по ним дифференциальных уравнений в частных производных.



Рис.4. Графы переходов в пределах одного подмножества и предельными переходами

Разностное уравнение для случая 1 (переходы в пределах одного подмножества) имеет вид

(9)

Дифференциальное уравнение в частных производных:

(10)

Рассматривая стационарный участок при t, получим (т.к. )

(11)

На основании полученного уравнения (11) можно сформулировать следующее правило для составления дифференциального уравнения для любого состояния системы в пределах одного подмножества состояний.

Правило 1. Производная вероятности состояния по уровню запаса накопителя (z), умноженная на скорость изменения уровня запаса, равна произведению вероятности этого состояния на сумму интенсивностей перехода из этого состояния, взятая со знаком минус, плюс сумма произведений интенсивностей перехода в это состояние на вероятность тех состояний, откуда осуществляется переход.

Аналогичные рассуждения использовались при составлении дифференциального уравнения и формулировки правила для случая 2. Здесь состояние αi. характерно тем, что помимо обычных переходов, в пределах рассматриваемого подмножества с интенсивностями i и i, есть предельный переход из подмножества W (рис.4).

……(12)

Для стационарного участка (t) получаем алгебраическое уравнение

……(13)

и формулируем правило составления уравнения для состояния, в которое существует предельный переход.

Правило 2. Вероятность рассматриваемого состояния, умноженная на суммарную интенсивность выхода из него, равна сумме вероятностей перехода из других состояний в данное и вероятности предельного перехода. Вероятность предельного состояния равна вероятности состояния, из которого совершен предельный переход, умноженной на абсолютную величину скорости изменения уровня запаса в данном состоянии.

Рассмотрение случая 3 позволило вывести граничные условия, появляющиеся при переходе из состояний, принадлежащих подмножествам V и G, в состояния подмножества W:

(14)

Граничные условия на стационарном участке:

(15)

Исходя из положений и правил, выведенных в разделе 3.2, в разделе 3.3 построена модель надежности однопоточной двухфазной системы (рис.3) для трех вариантов соотношений производительности обрабатывающих устройств1,2 (q1=q2=q; q1 > q2; q1 < q2). Для всех трех случаев построены графы переходов в пространстве состояний, составлены системы дифференциальных уравнений в частных производных (по времени и уровню запаса в накопителе), получены системы дифференциально-алгебраических уравнений для стационарного случая (t  ).

Так, например, графовая модель при равенстве производительностей входного (1) и выходного (2) обрабатывающих устройств приведена на рис.5.



Рис.5 Граф переходов в пространстве состояний однопоточной двухфазной системы при равенстве производительности обрабатывающих устройств (q1=q2=q)


С
н
истема дифференциальных уравнений в частных производных для модели с одинаковыми производительностями имеет вид


(16)


Граничные условия:

(17)

Для стационарного случая (t  ) система (16) преобразуется в следующую систему дифференциально-алгебраических уравнений:



(18)

Система решается с учетом граничных и нормировочных условий

(19)

В диссертации разработана машинно-ориентированная процедура решения стационарной системы (18), основанная на получении выражения для плотности вероятности P101(z):

, (20)

где

Далее определяется вероятность F101(z) через плотность

. (21)

А затем каждое i-е неизвестное Fijk(z) представляется в виде произведения постоянного и переменного сомножителей: C1Hi, где Hi рекурсивно вычисляется на основе Hi-1 , а постоянный множитель С1 определяется из условия нормировки (19).

Стационарный коэффициент готовности Kг(z) и математическое ожидание производительности С(z) двухфазной системы равны

Kг(z)=F111(z)+F011(z)+F111(0)+F111(zm); С(z)=Кг(z)q. (22)

В разделе 3.4 разработан алгоритм получения нижней оценки коэффициента готовности многофазных однопоточных и многопоточных систем с двухуровневым функционированием во всех фазах (рис.6).



однопоточная двухпоточная

Рис.6. Примеры многофазных систем

Для коэффициента готовности Kг 1,2,3 исходной многофазной системы показано, что

, (23)

где Кпр.i, Кгi – коэффициенты простоя и готовности i-го устройства, i,j – коэффициент простоя системы при условии, что устройство j работоспособно, а устройство i – нет (коэффициент наложения потерь), - коэффициент простоя при замене 1-го и 2-го устройства с накопителем между ними одним устройством.

Полученный результат позволяет сформулировать алгоритм расчета нижней оценки коэффициента готовности однопоточных и многопоточных систем с двухуровневым функционированием, основанный на следующей декомпозиции. Из всей структуры выделяются подструктуры из двух устройств и накопителя между ними. Эти подструктуры заменяются одним элементом с рассчитанными по математическим моделям раздела 3.3 коэффициентом готовности и производительностью. Действуя последовательно, таким образом, приходим в конце работы алгоритма к одному эквивалентному устройству с вычисленным коэффициентом готовности и средней производительностью, что и является показателями системы. Производить выделение подструктур для “свертки” необходимо в направлении потока, двигаясь от менее вместимых накопителей к более вместимым, что уменьшает погрешность оценки.

В разделе 3.5 описано программное обеспечение (Bunker), реализующее предложенные модели и метод декомпозиции. Исходные надежностные характеристики (интенсивности отказов и восстановления обрабатывающих устройств и накопителей) могут задаваться пользователем вручную или извлекаться из библиотек универсального ПО АНБ Relex, а рассчитанные значения показателей надежности и производительности передаваться в модуль блок-схем надежности Relex и использоваться в качестве входных параметров блоков для общесистемных расчетов на логико-вероятностных моделях.

Сопряжение ПО Bunker с Relex осуществляется на основе подхода с использованием COM технологии. Основным используемым объектом автоматизации является объект Relex.Project, доступ к методам и свойствам которого осуществляется через диспетчерский интерфейс IPrjDoc.

Раздел 3.6 посвящен практическому использованию результатов главы 3 на этапе обоснования инвестиций в проект портово-транспортного технологического комплекса Штокмановского газоконденсатного месторождения, что позволило рассчитать и обосновать экономически выгодное проектное решение на основе использования промежуточных накопителей для установки регенерации ингибитора гидратообразования (моноэтиленгликоля (МЭГ)).

Статическая модель надежности установки регенерации МЭГ, набранная в модуле блок-схем надежности Relex, представлена на рис.7. Из входных устройств основного производства и установки регенерации насыщенный МЭГ поступает в промежуточную буферную емкость E1. Процесс регенерации МЭГ реализуется оборудованием специальных фильтров, холодильников и выпарных и дистилляционных колонн. Обеднённый МЭГ подается в ёмкость Е2, из которой и закачивается обратно в трубы, доставляющие к береговым входным устройствам многокомпонентный поток.

При выполнении проекта необходимо было выдать рекомендации по выбору параметров структуры установки регенерации МЭГ, а именно объемов емкостей E1,E2 и производительности оборудования, обеспечивающих бесперебойную подачу регенерированного МЭГ в подводный трубопровод. Решение поставленной задачи при использовании только ПО Relex оказалось невозможным ввиду отсутствия в нем моделей анализа надежности и производительности с учетом накопителей. Поэтому была организована совместная работа двух программных средств (Bunker и Relex). Итерационный расчет c помощью Bunker позволил решить задачу выбора рациональных значений параметров структуры (емкостей, производительности), обеспечивающих требуемые значения показателей готовности системы (Кг .0.99). Расчет проводился для удельных значений производительности, а именно, номинальная производительность выходного оборудования E2 была принята за единицу. Результаты расчета сведены в таблицу 1.

Полученное значение коэффициента готовности могло бы быть достигнуто введением резервирования обрабатывающего оборудования, однако затраты на реализацию резервированного варианта намного превышают затраты на введение накопителей (емкости являются наиболее дешевым оборудованием).



Рис.7. Блок-схема надежности установки регенерации МЭГ


Таблица 1. Расчетные значения структурных параметров установки регенерации МЭГ

Коэффициент готовности

Установки

Производительность входного оборудования емкости Е1 (1/ч)

Емкость накопителя Е1 (ч)

Производительность промежуточного оборудования между емкостями Е1 и Е2 (1/ч)

Емкость накопителя Е2 (ч)

Производительность выходного оборудования емкости Е2 (1/ч)

0.998273

1.8

240

1.5

360

1


В главе 4 решаются задачи агрегирования марковских моделей при анализе надежности отказоустойчивых вычислительных систем. Рассматриваются однородные ОВС, т.е. системы, состоящие из резервированных подсистем с одинаковой технической структурой и с однотипной реакцией элементов на возникшую неисправность. Однородность поведения и технической структуры системы снижает размерность моделей и позволяет решить задачу анализа надежности, оставаясь в рамках марковских моделей без привлечения логико-вероятностного моделирования.

Общий подход к моделированию надежности однородных ОВС был предложен в работах Альгирдаса Авижиениса и заключался в раздельном построении марковских моделей обработки неисправностей и моделей деградации технической структуры ОВС. Приемы агрегирования марковских моделей, предложенные Авижиенисом и в последствии часто используемые в работах других авторов, основываются на укрупнении состояний сбой и отказ в одно состояние и корректировки интенсивностей выхода из укрупненного состояния с учетом успешности завершения процедур парирования сбоев. В разделе 4.1 проводится анализ результатов расчетов показателей надежности на моделях с укрупнением и показывается, что укрупнение существенно различных состояний (сбой, из которого есть возврат в исходное состояние; отказ, из которого принципиально отсутствует возврат в исходное состояние) порождает значительную относительную погрешность вычисления. Некорректность использования подобного укрупнения усугубляется тем, что при вычислении такого показателя как вероятность отказа оно дает оценку снизу.

Для дублированной ОВС, для которой возможно получение аналитического решения марковской модели надежности, рассмотрены следующие случаи: (1) укрупнение проводится при моделировании быстрых процессов обработки неисправностей; (2) укрупнение проводится при моделировании медленных процессов деградации технической структуры ОВС. Сравнение значений показателя вероятности отказа, полученных на точной модели без укрупнения состояний сбой и отказ и на моделях (1) и (2), позволило выявить два параметра, в наибольшей степени влияющих на погрешность вычисления – доля сбоев и средняя длительность сбоя. В зависимости от изменения параметра доля сбоев относительная ошибка вычисления вероятности отказа в модели (1) изменялась от 0 до 25%. При уменьшении средней длительности сбоя модель (1) порождала ошибки от 0 до 80%. Верхняя граница относительной ошибки, порождаемой моделью (2), приближалась к 100%.

В разделе 4.2 предложена агрегированная модель надежности ОВС, в которой медленный процесс деградации технической структуры описывается марковским процессом с непрерывным временем, а быстрый процесс обработки неисправностей – дискретной марковской цепью. Описана техника интеграции модели обработки неисправностей в общесистемную модель надежности, основанная на раздельном рассмотрении событий возникновения постоянных отказов и сбоев. Сбой трактуется как самоустраняющаяся неисправность, присутствующая в системе как физическое явление случайное время. Последствия сбоя могут привести к искажению нормального хода выполнения вычислительного процесса и требуют запуска внедренных в систему процедур восстановления, очередность и длительность которых определяется специальными протоколами.

Работа агрегированной модели продемонстрирована на примере анализа отказоустойчивой вычислительной системы, состоящей из трех машин, связанных между собой (полносвязный граф, т.е. каждая вычислительная машина связана с двумя другими). Отдельная машина состоит из базовой части (БЧ), адаптера связи с абонентом (А), приемо-передатчика межмашинного обмена (П/П). Критерием отказа ОВС является невозможность правильной работы не менее, чем по двум (из трех) каналам связи с абонентом внешней среды.

Факторами, учитываемыми при построении модели надежности, явились:
  • возможность возникновения двух типов неисправностей – постоянных отказов и сбоев
  • отсутствие восстановления работоспособности ОВС, нарушенной возникновением постоянных отказов
  • наличие резервирования (троирование) базовых и периферийных частей
  • введение специальных процедур обработки сбоев базовых частей машин
  • наличие видов отказов (например, пробой по питанию) элементов небазовой части ОВС (адаптер, приемо-передатчик), которые могут привести к неисправности базовой части

Модель обработки неисправностей описывала k последовательных программных попыток восстановления нормального хода вычислительного процесса ((перезапись памяти, повторы сегментов программ, откаты на контрольные точки…)). Предполагалось, что неуспех i-ой попытки восстановления мог быть вызван тремя факторам
    • длительность сбоя (как физического явления) превышает длительность i-ой попытки восстановления
    • за время выполнения i-ой попытки восстановления произошел повторный сбой восстанавливаемой базовой части ОВС
    • за время выполнения i-ой попытки восстановления произошел сбой или отказ других частей ОВС

Кроме того, предполагалось, что часть отказов и сбоев может носить катастрофический характер (система переходит в отказ, минуя деградацию).

Дискретная марковская модель процесса обработки неисправностей приведена на рис.8



Рис. 8. Марковский граф процесса обработки неисправностей ОВС (k=3)

Состояния 2 и 5 графа соответствуют неуспешному завершению первой попытки программного восстановления по сбоям. Состояния 3 и 6 – неуспеху второй попытки. Всего в системе реализовано три попытки восстановления.

Переходные вероятности находятся из следующих соотношений:

(23)

Вероятность успешного восстановления по сбоям:

, (24)

где - вероятность отсутствия сбоя или отказа с двумя другими машинами, λб интенсивность отказов базовой части ОВС, λнб интенсивность отказов небазовой части ОВС;

-условная вероятность возникновения некатастрофического сбоя;

-условная вероятность возникновения некатастрофического отказа;

- вероятность того, что длительность сбоя (σ) превышает время одной попытки восстановления (τ);

- вероятность повторного сбоя машины во время ее восстановления;

- вероятность отказа машины во время ее восстановления.

Вероятность неуспеха восстановления по сбоям:

(25)

Вероятность перехода в отказ во время восстановления:

(26)

Вероятность перехода в отказ системы во время бессмысленного восстановления по сбоям машины, в которой на самом деле произошел постоянный отказ

(27)

Переходная матрица P и вектор начальных условий p(0) позволяют вычислить распределение финальных вероятностей за n шагов, как [0, 0, 0, 0, 0, 0, p7(n), p8(n), p9(n)] = p(0)Pn. Причем, если p(0) = [1, 0, 0, 0, 0, 0, 0, 0, 0], т.е.моделируется событие возникновения постоянного отказа, то при n  3 p7(n) = 0, p8(n) = PF, p9(n) = PD. Если рассматривается возникновение сбоя, то p(0) = [0, 0, 0, 1, 0, 0, 0, 0, 0] и при n  3 p7(n) = Pr, p8(n) = Pf, p9(n) = Pd. Таким образом, минуя укрупнения состояний сбой и отказ, получены коэффициенты, корректирующие интенсивности переходов непрерывной марковской модели надежности ОВС.

Анализ отказоустойчивого трехмашинного вычислительного комплекса на предложенной агрегированной модели подтверждает факт существенной зависимости надежности ОВС от сбоев. Неучет в моделях надежности ОВС сбоев приводит к получению необоснованно завышенных оценок показателей надежности. В тоже время, если в моделях надежности будут учитываться сбои, но не будет отражен факт просеивания потока сбоев введением специальных процедур восстановления, то полученные оценки недопустимо исказят реальность (см. таблица.2).

Таблица 2. Расчет показателей надежности ОВС

 

Вид Расчета

показатели

расчет по постоянным отказам без учета сбоев


расчет по сбоям и постоянным отказам без учета специальных процедур обработки неисправностей

расчет по сбоям и постоянным отказам с учетом специальных процедур обработки неисправностей

Вероятность Безотказной Работы

0,992122

4,137050E-03

0,848385

Вероятность Отказа

7,878300E-03

0,995863

0,151615