Агрегирование моделей анализа надежности и безопасности технических систем сложной структуры 05. 13. 01 Системный анализ, управление и обработка информации (в технических системах)

Вид материалаАвтореферат

Содержание


Официальные оппоненты
Ведущая организация
Общая характеристика работы
Содержание работы
В первой главе
Вид Расчета
Разделы 5.4 – 5.5
Основные результаты диссертации
Подобный материал:
  1   2   3

УЧРЕЖДНИЕ РОССИЙСКОЙ АКАДЕМИИ НАУК

ИНСТИТУТ ПРОБЛЕМ УПРАВЛЕНИЯ

им. В.А.ТРАПЕЗНИКОВА РАН

На правах рукописи


ВИКТОРОВА ВАЛЕНТИНА СЕРГЕЕВНА


АГРЕГИРОВАНИЕ МОДЕЛЕЙ АНАЛИЗА

НАДЕЖНОСТИ И БЕЗОПАСНОСТИ

ТЕХНИЧЕСКИХ СИСТЕМ СЛОЖНОЙ СТРУКТУРЫ


05.13.01 Системный анализ, управление и обработка информации

(в технических системах)


АВТОРЕФЕРАТ

диссертации на соискание ученой степени

доктора технических наук


Москва – 2009

Работа выполнена в Учреждении Российской Академии Наук Институте проблем управления им.В.А.Трапезникова РАН



Официальные оппоненты:



доктор технических наук, профессор

Корноушенко Евгений Константинович


доктор технических наук, профессор

Можаев Александр Сергеевич


доктор технических наук

Швецова-Шиловская Татьяна Николаевна


Ведущая организация:



ФГУП “НИИ “Субмикрон”



Защита состоится 2009 г. в 14 час на заседании диссертационного совета Д.002.226.01 Института проблем управления им. В.А.Трапезникова РАН по адресу: 117997, г. Москва, ул. Профсоюзная, д. 65. Телефон/факс Совета (495) 334-93-29.


С диссертацией можно ознакомиться в библиотеке Института проблем управления РАН им. В.А. Трапезникова


Автореферат разослан 2009 года.


Ученый секретарь

диссертационного совета

доктор технических наук Акинфиев В.К.


Общая характеристика работы

Актуальность. Современный этап исследований в области надежности характеризуется тем, что основные теоретические разработки нашли свое воплощение в универсальных программных средствах, включающих в себя не только реализацию созданных в 60-х – 90-х годах моделей и методов, но и унифицированные процедуры обработки и расчета исходных данных. Универсальное программное обеспечение анализа надежности и безопасности, как правило, включает в себя блоки логико-вероятностного, марковского и статистического анализа, а также стандартизованные расчетные соотношения для вычисления интенсивностей отказов элементной базы, средних времен восстановления, модули поддержки качественных процедур выявления видов и последствий отказов. Структура, особенности функционирования, отказов и восстановления реальных технических систем столь разнообразны, специфичны и сложны, что моделирование и анализ их “надежностного поведения” возможны лишь с применением подобного программного обеспечения. Однако даже самые мощные программные средства не в состоянии оказать полную поддержку при проведении анализа надежности и безопасности. Решение этой проблемы может быть осуществлено двумя путями. Первый путь это создание “с нуля” программного обеспечения, реализующего как основные классы моделей и методов анализа (логико-вероятностные, марковские, статистическое моделирование), так и модели и методы, учитывающие особенности, выходящие за рамки основных моделей. Второй – модификация и расширение универсальных программ анализа надежности с целью внедрения специальных моделей и методов. Второй путь более предпочтителен, он позволяет с меньшими трудозатратами, целенаправленно выполнить поставленные задачи, не отвлекаясь на уже решенные проблемы и используя программно реализованные разработки, созданные во всем мире почти за полувековой период развития теории надежности. Второй путь основывается на решении научной задачи декомпозиции исследуемой системы, разработке моделей и методов, адекватных структуре и особенностям функционирования, отказов и восстановления выделенных при декомпозиции частей, агрегировании полученных моделей и рассчитанных показателей в общесистемные модель и показатели.

В соответствии с выдвинутым принципом автоматизации анализа надежности и безопасности сложных систем актуальным является
  • создание общей методологии агрегирования статических моделей анализа надежности и безопасности на основе деревьев отказов, деревьев событий с динамическими моделями процессов возникновения отказов и восстановления
  • разработка новых методов представления и преобразования деревьев отказов, ориентированных на автоматизацию агрегирования динамических и статических моделей надежности
  • разработка динамических моделей надежности, направленных на решение конкретных задач, и автоматизация их сопряжения с результатами качественного анализа видов, последствий и критичности отказов и количественного анализа безотказности элементной базы

Актуальность работы определяется теоретическим и практическим решением перечисленных задач и их востребованностью в химико-технологических и нефте-газоперерабатывающих отраслях промышленности, в областях космического и авиационного приборостроения.

Целью работы является разработка концепции анализа надежности и безопасности сложных технических систем на основе агрегирования статических и динамических моделей надежности, создание агрегированных моделей анализа надежности и безопасности сложных систем с учетом характеристик средств встроенного контроля, специальных процедур обработки неисправностей, промежуточных накопителей, развитие методологии автоматизации агрегированных моделей и ее практическое внедрение при построении специализированных программных приложений, являющихся расширениями универсального программного обеспечения анализа надежности и безопасности.

Методами исследования, применяемыми в диссертационной работе, являются методы математического моделирования, используемые в теории надежности и основанные на методах и положениях теории вероятностей, алгебры логики, комбинаторного анализа, теории и численных методов решения дифференциальных и алгебраических систем уравнений. Программная реализация теоретических результатов работы основана на теории реляционных баз данных, объектно-ориентированном программировании и COM технологии.

Научная новизна
  • разработан метод агрегирования на модельном и программном уровнях статических логико-вероятностных моделей блок-схем надежности и деревьев отказов с марковскими моделями, учитывающими динамические особенности функционирования сложных систем; предложено эффективное бинарное представление логики возникновения вершинных событий деревьев отказов/успехов, позволяющее проводить количественный анализ без определения наборов минимальных сечений /путей
  • созданы динамические модели и машинно-ориентированные расчетные процедуры определения показателей надежности и производительности двухфазных систем с ненадежными накопителями, предложен метод анализа многофазных, многопоточных систем, структура которых описывается графом типа дерева, основанный на декомпозиции на двухфазные модели; доказано, что полученная агрегированная оценка коэффициента готовности и средней производительности многофазной системы является нижней
  • предложен основанный на COM технологии метод сопряжения программной реализации моделей многофазных многопоточных систем с логико-вероятностными модулями и библиотеками элементов универсального программного обеспечением анализа надежности, что позволило строить более адекватные модели технологических систем
  • созданы модели и методы исследования контролепригодности систем, предложен интегральный показатель достоверности контроля, позволяющий оценивать его качество с учетом полноты, глубины, отказов первого и второго рода; разработан и практически реализован метод сопряжения программного обеспечения анализа надежности и безопасности систем с встроенным контролем с универсальными программами; метод основан на разделении импортированной базы данных видов и последствий отказов
  • предложен подход к анализу надежности отказоустойчивых управляющих вычислительных систем на моделях деревьев отказов, основанный на выделении групп несовместных событий по состояниям основного процессорного блока, что позволяет декомпозировать задачу оценки показателей надежности и преодолевать проблему размерности модели, возникающую при учете двух видов неисправностей (отказов и сбоев), алгоритмов постепенной деградации работоспособности системы, высокой степени резервирования устройств связи с объектом управления
  • разработаны динамические модели надежности компонентов отказоустойчивых вычислительных систем на основе марковских случайных процессов и метода интегральных соотношений, позволяющие учитывать внедренные в систему процедуры обработки неисправностей, “просеивающие” поток сбоев, и последовательности возникновения неисправностей, приводящие к различным последствиям на системном уровне

Полученные в работе результаты направлены на теоретическое развитие и обобщение важной практической задачи моделирования и оценки надежности и безопасности технических систем сложной структуры с различными особенностями функционирования, процессов возникновения отказов и восстановления работоспособности.

Практическая значимость и реализация результатов. Решение поставленных в диссертации задач позволяет осуществлять практическое внедрение программных реализаций предложенных теоретических моделей в проектные расчеты надежности, безопасности, производительности. Разработанные методы программного агрегирования позволяют внедрять модели в универсальные программные системы анализа надежности и использовать встроенные библиотеки элементов и видов отказов, что повышает точность моделирования и решает проблему обоснованного задания исходных данных.

Практическая ценность полученных результатов подтверждается их использованием при
  • анализе надежности, безопасности и контролепригодности проекта семейства российских региональных самолетов Sukhoi Superjet 100
  • оценке комплексных показателей надежности для различных концепций морского обустройства Штокмановского газоконденсатного месторождения
  • исследовании надежности и производительности российских объектов уничтожения химического оружия
  • анализе надежности управляющей бортовой вычислительной системы с программно-реализованной сбое-отказоустойчивостью.

Апробация работы. Основные результаты диссертационной работы докладывались на Всесоюзном совещании “Надежность, живучесть и безопасность автоматизированных комплексов”, Суздаль, 1988, 1991; VII Всесоюзной научно-технической конференции “Проблемы комплексной автоматизации судовых технических систем”, Ленинград, 1989; Международной конференции по вычислительным системам и информационным технологиям, Сидней (Австралия), 1989; 6м Международном симпозиуме IMEKO TC 10 по технической диагностике, Прага (Чехословакия), 1989; научном семинаре “Надежность и качество функционирования систем”, Москва, МГУПС (МИИТ), 1990, 2006; Всесоюзном совещании “Проблемы построения перспективных бортовых управляющих систем”, Владивосток, 1991; Международной конференции по проблемам управления, Москва, ИПУ РАН, 1999, 2003, 2006; 5м Международном научно-техническом симпозиуме "Авиационные технологии 21-го века. Наука на МАКС-99", Жуковский, 1999; Международной конференции “Параллельные вычисления и задачи управления PACO’ 2001”, Москва, ИПУ РАН, 2001; XV Международной конференции “Математические методы в технике и технологиях”, Тамбов, 2002; Международном семинаре “Relex – программное обеспечение для анализа надежности, безопасности, рисков”, Москва, ИПУ РАН/RSCE, 2003; 4й Научно-технической конференции “Функциональная Безопасность”, СНИИП, Москва, 2003; 6ом Международном семинаре ИКК МНТЦ “Наука и Компьютерные технологии ”, Москва, 2003; Международной научной конференции “Математические Методы в Технике и Технологии - 16”, Санкт-Петербург, 2003; Международном семинаре “Система Управления Качеством - FRACAS”, Москва, ИПУ РАН/RSCE, 2004; Научно-практической конференции “Современное состояние процессов переработки нефти”, Уфа, 2004; 9м Научном семинаре “Промышленная Безопасность. Программные средства в области анализа техногенного риска”, Москва, 2005;  международной конференции Межгосударственного Авиационного Комитета “Программные продукты информационного обеспечения безопасности полетов, надежности и технической эксплуатации авиационной техники”, Москва, 2006; Международной школе-семинаре по программным продуктам и проектным решениям “Relex Reliability Studio”, Salem (Germany), RSCE, 2006, 2007;. Международной научной школe "Моделирование и Анализ Безопасности и Риска в Сложных Системах” (МА БР), Санкт-Петербург, 2003, 2005, 2008;

Публикации. Основные результаты научных исследований по теме диссертации содержатся в 30 публикациях, в их числе 11 публикаций в изданиях перечня Высшей аттестационной комиссии. Список публикаций приведен в конце автореферата.

Структура и объем диссертации. Работа состоит из введения, 5-ти глав, заключения, содержит 223 страницы, 75 рис., 12 табл., список литературы из 128 названий.


Содержание работы

Во введение определена цель исследований, приведено обоснование актуальности темы и научной новизны диссертационной работы, описаны методы исследований и полученные практические результаты.

В первой главе с позиций анализа надежности рассмотрены особенности технических систем сложной структуры, выделены два класса моделей (статические и динамические), проведен сравнительный анализ отечественного и зарубежного программного обеспечения анализа надежности и безопасности (ПО АНБ), предложен новый подход к разработке программ анализа надежности.

К специфическим особенностям сложных систем относятся:
  • наличие нескольких уровней эффективности функционирования (например, производительности) и постепенная деградация по эффективности при возникновении неисправностей
  • реализация разнообразных способов резервирования (структурного, временного, алгоритмического), стратегий восстановления, технического обслуживания, например, различная «нагруженность» резерва, присутствие общих элементов в различных резервированных звеньях, контроль функционирования, ограничения на ЗИП, число ремонтных бригад
  • внедрение алгоритмических методов обработки неисправностей (в основном для вычислительных устройств) с классификацией на сбои и отказы
  • возможность возникновения нескольких несовместных видов отказов элементов, приводящих, при определенной кратности и последовательности возникновения, к различным последствиям на системном уровне; наличие скрытых и явных отказов.

В разделе 1.1 предложено разделение моделей анализа надежности на два класса: cтатические, в которых состояния системы определяются наборами работоспособных и неработоспособных элементов в момент времени t; динамические, когда происходящие события, отказы рассматриваются как процессы, развивающиеся во времени.

В рамках статических моделей анализ надежности проводится следующими методами:
  • метод, использующий основные формулы теории вероятностей (вероятность суммы и произведения событий, формула полной вероятности) и комбинаторики; применяется, главным образом, для последовательно-параллельных, параллельно-последовательных структурных надежностных схем и схем m из n
  • методы, основанные на записи логических условий, интересующих исследователя функций через состояния элементов системы с последующим применением теории алгебры логики (логико-вероятностные методы, используемые в деревьях отказов, схемах функциональной целостности (СФЦ), блок-схемах надежности).

Классические статические модели для восстанавливаемых систем позволяют рассчитывать лишь дифференциальные (мгновенные) показатели надежности, определяемые в момент времени t (коэффициент готовности, параметр потока отказов, средняя эффективность в момент времени t).

В рамках динамических моделей применяются:
  • моделирование систем марковскими процессами
  • методы теории восстановления, полумарковских и регенерирующих процессов (в основном, используются асимптотические результаты либо для системы в целом, либо для отдельных резервированных звеньев)
  • статистическое имитационное моделирование (Монте Карло)

Динамические модели позволяют вычислять все основные показатели надежности - мгновенные, интервальные (вероятность безотказной работы (отказа) на интервале времени), независящие от времени стационарные показатели (средняя наработка между отказами, среднее время простоя…).

Задача адекватного моделирования надежности систем сложной структуры решается только с помощью декомпозиции системы (структурной, логической, по процессам) и применения различных расчетных методов к выделенным частям. Однако моделирование, даже выделенных частей сложных систем, порождает известные проблемы размерности (рост пространства состояний модели и связей между состояниями), и, как следствие, невозможность ручного входного описания модели, определения ее параметров, выполнения расчетов. Проблема может быть решена только с помощью автоматизации, причем, программное обеспечение анализа надежности и безопасности должно включать в себя всю совокупность методов как статических, так и динамических моделей.

В теоретических исследованиях и разработках как динамических, так и статических моделей наша страна находится на лидирующих позициях. Широко известными являются работы Рябинина И.А., Можаева А.С., Филина Б.П., Акуловой Л.Г. (логико-вероятностные методы), Половко А.М., Шубинского И.Б., Лубкова Н.В. (марковские, полумарковские случайные процессы), Ушакова И.А., Соловьева А.Д., Калашникова В.В. (асимптотические методы - полумарковские, регенерирующие процессы, теория восстановления), Ушакова И.А,, Калашникова В.В., Кузнецова Н.Ю., Буянова Б.Б., Акуловой Л.Г. (ускорение статистического моделирования), Волика Б.Г. (анализ эффективности и техногенной безопасности), Черкесова Г.Н. (системы с временной избыточностью)…

Наиболее развитыми и известными отечественными программными средствами анализа надежности и безопасности являются: АРБИТР (ПК АСМ СЗМА) – программный комплекс автоматизированного структурно-логического моделирования и расчета надежности и безопасности систем; Автоматизированная система расчета надежности (АСРН-2000, 2002), реализующая стандартизованные модели безотказности радиоэлектронной элементной базы; АСОНИКА-К – программное обеспечение расчета надежности на основе методов статистического моделирования и аналитических формул для последовательно-параллельных систем; УНИВЕРСАЛ – программное обеспечение анализа надежности и безопасности, использующее полумарковское моделирование.

Лидерами зарубежных программных продуктов являются Isograph (Англия, США), ITEM iQRAS (Англия, США), RAM Commander (Израиль), Relex Reliability Studio (США). Это интегрированные программные средства, включающие различные методы анализа, реализующие разнообразные формы задания моделей (графы, деревья отказов, событий, блок-схемы надежности), содержащие обширные базы исходных данных, имеющие развитый графический интерфейс пользователя, исчерпывающе документированные, имеющие как локальную, так и сетевую конфигурации, сопрягаемые по импорту-экспорту с базами данных, текстовыми редакторами, электронными таблицами, логистическим ПО, САПР.

В разделах 1.2 – 1.10 первой главы проведен сравнительный анализ отечественного и зарубежного ПО АНБ по направлениям: количественные и качественные методы анализа, полнота моделей отказов, восстановлений, резервирования, рассчитываемые показатели надежности, обеспеченность исходными данными, нормативная база, способы задания моделей, сопрягаемость с внешним ПО, точность расчетов. В результате анализа сделан вывод о том, что отечественные программные средства анализа надежности и безопасности характеризуются высоким теоретическим уровнем и оригинальностью отдельных решений, например, представление моделей с помощь схем функциональной целостности в АРБИТРе, решения по автоматизации задания полумарковских моделей в УНИВЕРСАЛе. Однако они уступают их зарубежным аналогам в объеме реализованных методов и решаемых задач, развитости интерфейса пользователя, наличии модулей статистической обработки результатов эксплуатации и испытаний, соответствии международной нормативной документации, сопрягаемости с внешними источниками данных и исполняемыми программами.

У отечественных создателей ПО АНБ нет людских, временных, финансовых ресурсов, необходимых для создания интегрированных сред уровня Relex или Isograph, но есть высокий интеллектуальный потенциал, позволяющий создавать новые и совершенствовать имеющиеся модели и методы. Поэтому в работе предлагается подход к программной реализации новых моделей и методов анализа надежности, сопрягаемой с универсальными ПО. В разделе 1.11 первой главы описаны два возможных способа такого сопряжения. Первый способ основан на разделения внешних источников информации, в частности файлов баз данных. Второй использует принципы COM-технологии, что позволяет внешним программам использовать внутренние сервисы универсального ПО АНБ с помощью механизма интерфейсов. Основным достоинством предложенного подхода является то, что специалисты данной предметной области (как теоретики, так и “надежностно-ориентированые” программисты) могут сосредоточиться на решении действительно актуальных и практически востребованных задач, минуя повторения созданного (интерфейс пользователя, библиотеки исходных данных по интенсивностям и видам отказов элементов, графические редакторы, утилиты импорта-экспорта и пр., включая основное – реализацию классических классов моделей и методов).

В главе 2 описана общая методология агрегирования различных моделей и методов при исследовании надежности и безопасности и приведен пример ее использования при анализе надежности управляющей отказоустойчивой вычислительной системы (УОВС). В качестве первичного описания систем предлагается логико-вероятностная модель деревьев отказов (успехов) (ДО), что обосновывается компактностью задания модели (например, по сравнению с марковскими графами) и ее широким практическим использованием (ДО являются международным стандартом де-факто для исследования надежности и безопасности в авиации и атомной энергетике). Предлагается выполнение следующих этапов исследования:
  1. Выделение в процессе структурного анализа основного блока, отказы которого наиболее существенным образом влияют на надежностное поведение системы, переводя ее в состояния полного или частичного отказа (невозможности выполнения отдельных функций).
  2. Определение полной группы несовместных событий (состояний основного блока) и анализ путей перехода в возможные системные состояния отказа при возникновении неисправностей остальных элементов системы для каждого события. Построение укрупненного ДО, имеющего n основных ветвей в соответствии с n выделенными несовместными событиями.
  3. Построение моделей, учитывающих различные аспекты событий возникновения отказов компонентов системы (возможность возникновения как постоянных отказов, так и сбоев, специальные процедуры обработки сбоев, “просеивающие” суммарный поток неисправностей). Здесь могут быть использованы Марковские модели (с непрерывным и дискретным временем), комбинаторные формулы.
  4. Построение марковского графа переходов в пространстве состояний основного блока и определение соответствующих вероятностей пребывания в состояниях. Марковская модель выбрана для учета характеристик контроля, различных способов резервирования, нескольких видов отказов. Интенсивности переходов марковской модели определяются с учетом расчетов по сбоям, проведенным в п.3.
  5. Построение “вложенных” деревьев, детализирующих переход в отказ (отказы) системы для каждого несовместного события (состояния основного блока). Расчет вероятностей реализации соответствующих вершинных событий. Исходные надежностные параметры для базовых событий определяются с учетом расчетов по сбоям, проведенным в п.3.
  6. Задание исходных надежностных параметров базовых событий укрупненного дерева (п.2) на основе расчетов по марковской модели (п.4) и вложенным деревьям (п.5). Вычисление показателей надежности системы в целом.

Отметим, что агрегирование статических и динамических моделей можно проводить на общесистемной статической модели, в частности, на деревьях отказов, схемах функциональной целостности, вводя новые динамические вершины-операторы и не проводя декомпозицию системы

В разделах 2.1 – 2.3 приводится описание качественных и количественных методов анализа деревьев отказов и способов их реализации в современном программном обеспечении. В рамках качественного анализа определяются наборы минимальных сечений. Результатом проведения количественного анализа являются численные значения следующих показателей надежности:
  • коэффициент готовности/неготовности (вероятность реализации вершинного события в заданный момент времени) (К(t))
  • вероятность отказа/безотказной работы (вероятность реализации вершинного события на заданном интервале времени) (P(t))
  • параметр потока отказов (w(t))
  • средняя наработка между отказами
  • среднее время восстановления
  • среднее число отказов за заданный интервал времени

В зарубежном ПО, как правило, реализованы методы расчета показателей, основанные на теореме о вероятности суммы совместных событий (в данном случае под событием понимается реализация минимального сечения):

, (1)

где Q(t) – вероятность наступления вершинного события дерева, Сi – i-ое минимальное сечение, n - число минимальных сечений. Для дерева отказов вероятность Q(t) является коэффициентом неготовности, а для дерева успехов – коэффициентом готовности. Трудности возникают при вычислении интервального показателя вероятности безотказной работы для восстанавливаемых систем. В этом случае обычно используют прием, когда система искусственно делается невосстанавливаемой, и получают нижнюю оценку показателя. В работе предложена приближенная формула для вычисления вероятности безотказной работы восстанавливаемых систем, численное решение по которой хорошо автоматизируется и выдает результаты предписанной точности при использовании адаптивных квадратурных алгоритмов

. (2)

В разделе 2.4 рассмотрены вопросы создания динамических деревьев отказов с помощью внедрения динамических вершин (операторов), определен набор вершин (динамических и статических), позволяющих строить адекватные модели УОВС. Предложена реализация n-входового динамического оператора PAND, учитывающего последовательность возникновения входных событий на интервале (0,T) c помощью рекуррентного интегрального соотношения:

, (3)

где Qn(T) – вероятность последовательного возникновения n входных событий оператора (слева – направо); Fi(t) и fi(t) соответственно функция распределения и плотность распределения случайного времени наступления i-го входного события. Использование интегральной модели (3) вместо марковской позволило снять ограничения на экспоненциальный характер функции распределения.

В разделе 2.5 предложено решение задачи представления деревьев отказов структурами данных, обеспечивающими быстроту обхода дерева и получение отображаемой деревом логической функции отказа (работоспособности) в дизъюнктивной ортогональной форме: f = Y1  Y2  …  Ym, где Yi Yj =0 для ij; Yi - бесповторная форма в базисе конъюнкция-отрицание.

Программная реализация количественного анализа деревьев отказов является сложной программисткой задачей, так как требует разработки быстрых алгоритмов генерации наборов минимальных сечений и сложных процедур кодирования выражения (1). Новейшей тенденцией в автоматизации представления и преобразования функций алгебры логики является привлечение современных эффективных методов дискретной математики. В качестве искомого представления логики дерева предлагается применять диаграммы двоичных решений (ДДР). В терминах ДДР логические функции представляются в виде направленного ациклического графа (бинарного дерева), у которого внутренние вершины представляют аргументы функции. Кроме того, выделены два типа терминальных вершин, обозначенные как 0 и 1. Каждая нетерминальная вершина графа имеет двух потомков. Ветви графа упорядочены – проход по левой означает, что аргументу присвоено значение 1, а по правой – значение 0. Значение логической функции определяется спуском по дереву от корня к терминалам.

При автоматизации задач надежности важными преимуществом ДДР являются
  • представление логических функций в ортогональной форме перехода к замещению, допускающих замещение логических переменных вероятностями, а логических операций арифметическими. Это достигается за счет того, что сам принцип построения ДДР обеспечивает разложение логической функции на ортогональные слагаемые.
  • при машинной реализации ДДР воплощается нелинейной динамической структурой данных – двоичным деревом, для которого разработаны эффективные алгоритмы обхода узлов, сложность которых зависит от количества уровней дерева, т.е. приблизительно от log2n (n – количество узлов).

Использование диаграмм двоичных решений и описанный в первой главе принцип агрегирования на программном уровне позволяют предложить следующую процедуру количественного анализа деревьев отказов, содержащих динамические вершины, моделирующие специфические особенности “надежностного поведения”, которые не охватываются моделями универсальных программ:
  • задать структуру дерева в графическом редакторе универсального программного обеспечения и с использованием COM-технологии или импорта данных сделать доступной программам, реализующим специфические модели
  • выполнить анализ каждого объекта переданной структуры на принадлежность группам: базовые события, сложные события (вложенные деревья), статические вершины (И, ИЛИ, НЕ), простые динамические вершины со входами, состоящими только из базовых событий, динамические вершины, все или часть входов которых являются другими вершинами дерева (сложные динамические вершины)
  • рассчитать стационарные коэффициенты неготовности (готовности Kг) и параметр потока отказов  для простых динамических вершин. Далее определить средние наработки между отказами Тм и времена восстановления τв из соотношений Тм = Kг/; τв = ((1-Kгм)/Kг и заменить каждую динамическую вершину эквивалентным базовым событием, время возникновения которого распределено асимптотически экспоненциально (доказано в работах Соловьева А.Д., Ушакова И.А) с интенсивностями отказов λ=1/Тм и восстановлений  =1/τв.
  • осуществить аналогичную редукцию сложных динамических вершин, последовательно заменяя простые динамические вершины и вложенные деревья эквивалентными базовыми событиями, и получить результирующее дерево, состоящее из “классических” вершин (И, ИЛИ, НЕ)
  • полученное дерево преобразовать в диаграмму двоичных решений и провести необходимый качественный и количественный анализ

В диссертации предложен алгоритм преобразования ДО в ДДР:
  • Упорядочить базовые события дерева: x12<…xn
  • Каждому i-му базовому событию поставить в соответствие тройку (xi,1,0)
  • Каждой вершине дерева отказов соотнести оператор Fi(xj,fi1,fi0), определяемый по правилам:


(4)

  • Последовательно применяя правила, получить “алгоритмическую свертку” операторов для вершинного события дерева отказов

(5)


  • Последовательно раскрывая “единичные” и “нулевые” составляющие, сформировать двоичное дерево
  • Вычислить вероятность реализации вершинного события исходного дерева отказов как сумму вероятностей путей, ведущих от корня двоичного дерева до терминальной вершины “1”

В разделе 2.6 в соответствии с изложенной методологией проведен анализ надежности управляющей вычислительной системы с программно реализуемой сбое- отказоустойчивостью, разработанной в НИИ “Субмикрон”. Основным блоком системы являются три параллельно работающие вычислительные машины (ВМ), имеющие по две тройки устройств связи (УС). Система обеспечивает прием информации из внешней среды и выдачу управляющих воздействий. В процессе функционирования системы при возникновении неисправностей (отказов элементов) она деградирует. Деградация происходит по сложной “траектории”, начальным состоянием которой является трехмашинная конфигурация, а конечным – состояния, соответствующие отказам системы. В процессе деградации система может принимать двухмашинную конфигурацию с блокировкой третьей ВМ и одномашинную, при которой одна ВМ осуществляет обмен с внешней средой, другая работает в режиме “подслушивания” (контроля) работающей, а третья заблокирована. Возможны два вида отказа системы в целом – отказ, при котором система выдает во внешнюю среду приоритетную команду безопасного останова (БО), и опасный отказ (ОО), при котором не обеспечена выдача команды БО, и внешняя среда либо не воспринимает управляющих команд от системы, либо система выдает неверные команды.

Реакция системы на возникшую неисправность организована следующим образом. При нарушении нормального хода работы системы в результате отказа или сбоя ее структурного элемента (УС, ВМ) этот элемент программным путем исключается из рабочей конфигурации. Решение о возможности дальнейшего использования исключенного элемента принимается на основе двух критериев. Первый критерий (“частотный”): элемент признается отказавшим, если до конца заданного интервала Δt будет дополнительно зафиксировано (mкр-1) нарушений функционирования у данного элемента. Второй критерий (“последовательностный”): элемент признается отказавшим, если после первого нарушения его функционирования нарушения будут происходить еще (mкр-1) раз подряд.

Использование пуассоновского приближения к биномиальному распределению позволило получить выражение для вероятности признания по частотному критерию неисправности элемента сбоем на интервале (0,T):

(6)

Здесь λсб – интенсивность потока сбоев.

Вероятность признания неисправности элемента сбоем по последовательностному критерию была получена с использованием аппарата конечных цепей Маркова:

,

(7)

,

где - среднее время до первого попадания из начального исправного состояния в поглощающее состояние цепи, соответствующее неудавшимся попыткам выполнения заданной функции. - среднее число шагов.

Вероятность Q(t) признания элемента вычислительной системы на интервале (0,T) отказавшим определяется как

Q(T) = 1 - Ротк(T) Рсб(T), (8)

где Ротк(T) – вероятность безотказной работы элемента по постоянным отказам; Рсб(Т) – вероятность признания того, что неисправность элемента обусловлена сбоем. Рсб(Т) вычисляется по (6) или (7) в зависимости от критерия признания.

Для трехмашинной отказоустойчивой вычислительной системы с частотным и последовательностным критериями признания сбоящих компонентов отказавшими построена иерархия вложенных динамических деревьев отказов; марковская модель надежности троированного блока ВМ с учетом неполноты контроля и разделением состояний отказа на опасные и безопасные; проведена коррекция вероятностей реализации базовых событий в моделях деревьях отказов, отражающая факт “просеивания” потока сбоев специальными программно-реализованными процедурами обработки неисправностей (см. рис.1).

Разработанная модель позволила провести расчеты показателей надежности УОВС и выдать рекомендации по выбору параметров процедур восстановления вычислительного процесса, нарушенного возникновением сбоев при различных соотношениях интенсивностей сбоев и постоянных отказов ВМ и устройств сетей связи с объектом и межмашинного согласования.

График вероятности отказа ОУВС на интервале (0,10000ч) в зависимости от числа попыток программного восстановления для cб = 10 1/ч и cб = 50 1/ч при фиксированной интенсивности отказов, равной 2,34·10-6 , представлен на рис.2. Из графика видно, что при малом числе попыток восстановления (<4) сбои определяют низкую надежность системы. При увеличении числа попыток восстановления (>5) сбои практически не влияют на надежность системы, которая в этом случае полностью определяется потоком постоянных отказов.



Рис.2. График зависимости вероятности отказа ОУВС от числа попыток восстановления.




Рис.1. Фрагмент агрегированной модели анализа надежности УОВС