Удк 519. 2 Моделирование причинно-следственных связей, возникающих при анализе рисков
Вид материала | Анализ |
СодержаниеПостановка задачи Библиографический список |
- Введение в механодинамику канарёв Ф. М. kanphil@mail ru Анонс, 203.52kb.
- Егэ по обществознанию 2010-2011 учебный год, 48.29kb.
- Ьтаты анализа причинно-следственных связей между состоянием здоровья населения и факторами, 74.11kb.
- Причинно-следственные связи в теории относительности, 202.96kb.
- Образовательная программа по специальности 140306 «Электроника и автоматика физических, 86.39kb.
- Криминалистическая характеристика причинно-следственных связей при производстве судебных, 354.73kb.
- Формирования логических действий анализа, сравнения, установления причинно-следственных, 78.25kb.
- Лекция Термодинамическая картина мира (ткм), 232.29kb.
- Новом учебном году зависит от объективности и глубины анализа сделанного, правильности, 496.78kb.
- Тема урока: The Nuremberg Trials in the eyes of the children, 59.57kb.
УДК 519.2
Моделирование причинно-следственных связей, возникающих при анализе рисков
Лупач Денис Юрьевич,
ПГНИУ, E-mail: lupachdu@rambler.ru.
Аннотация: В статье рассматривается метод построения, анализа и отбора многомерных моделей для прогнозирования рисков.
Введение
Анализ существующих литературных источников показывает, что активная хозяйственная и социальная деятельность тесно связана с понятием риска. Термин «риск» получил широкое распространение в научной литературе и повседневной жизни. Для различных областей жизнедеятельности определяют огромное количество специфических рисков, отражающих частные особенности неблагоприятных ситуаций различных отраслей и видов деятельности. Величину риска нельзя непосредственно измерить, а можно лишь с некоторой надежностью оценить, используя количественные характеристики факторов риска и показатели откликов, находящихся под воздействием этих факторов. В существующей на сегодняшний день литературе под оценкой риска чаще всего понимается использование доступной информации и научно-обоснованных прогнозов для оценки воздействия социально-экономических факторов на функционирование исследуемой системы.
Количественная оценка риска осуществляется, как правило, методами математической статистики, поскольку невозможно одновременно учесть воздействие всех возможных факторов на отклик. В связи с этим возникают статистические зависимости, исследование которых занимает основное место при построении всех процедур и методов оценивания рисков. Одним из наиболее эффективных методов, используемых для построения моделей, описывающих причинно-следственные связи, при решении задачи оценивания рисков является метод регрессионного анализа [1].
Постановка задачи
Функционирование реальной системы, как правило, можно описать набором переменных, среди которых выделяются:


ζ1, ζ2, ζ3, …, ζm – латентные (то есть скрытые, не поддающиеся непосредственному измерению) случайные компоненты, отражающие влияние на

Определим матрицу



Общая задача статистического исследования причинно-следственных связей между факторами и откликами может быть сформулирована следующим образом: по результатам k измерений исследуемых переменных на объектах анализируемой совокупности построить такую векторную функцию

которая позволила бы наилучшим (в определенном смысле) образом восстанавливать значения откликов по заданным значениям управляющих факторов. Функции вида



Будем рассматривать модель многомерной регрессии следующего вида:

где







для l-го наблюдения.
Исходные статистические данные
Данные, с которыми приходится иметь дело, решая задачи исследования причинно-следственных связей и прогнозирования, имеют достаточно сложную трехмерную структуру (см. рис.1). Она подразумевает наличие сложных структур взаимосвязей, которые содержатся в анализируемых массивах информации. Причем связи возникают не только между управляющими факторами и ответами, но и обнаруживаются внутри совокупности, образованной управляющими факторами (например, связанными являются такие показатели, как размер начисленных штрафов и размер взысканных штрафов). Кроме того, возможны ситуации, когда связанными являются ответы (количество обращений по поводу сердечнососудистых заболеваний и количество обращений по поводу заболеваний органов кровообращения также коррелируют между собой).
Только полный учет структуры и характера всех взаимосвязей позволяет построить модель, наиболее адекватно отражающую действительность, и, как следствие, получить наиболее эффективный инструмент управления рисками.

Рис. 1. Структура статистических данных
Предлагаемый метод решения задачи
В основу предлагаемого метода матричного прогнозирования рисков [3] положены следующие принципы:
- признание существенной многомерности анализируемой статистической информации;
- учет многообразия взаимосвязей между анализируемыми признаками и их структуры;
- Неоднородность совокупностей данных в различные периоды наблюдения.
Метод состоит из следующих этапов:
- Классификация наблюдений (
),
на однородные группы по совокупности откликов
.
- Исследование структуры взаимосвязей.
- Построение многомерных моделей регрессии.
- Исследование статистических свойств построенных моделей.
- Исследование устойчивости моделей.
Выбор наиболее значимой и устойчивой модели для каждой совокупности данных в сформированных однородных группах, позволяет осуществлять прогнозирование рисков с достаточно большой степенью достоверности.
На первом этапе применяется метод k-средних кластерного анализа, который позволяет на основании данных, содержащихся в матрице Y провести разбиение всей анализируемой совокупности на однородные группы.
Далее для каждой группы проводится анализ парной зависимости между управляющими факторами



Модель (1) предполагает отсутствие линейной зависимости между управляющими факторами, поскольку ее наличие приводит к вырожденности симметричной матрицы

На следующем этапе анализируется взаимосвязь между факторами управления и управляемыми факторами на основе коэффициента линейной корреляции вида


и коэффициента ранговой корреляции Спирмена по формуле

где




Если оба коэффициента оказываются незначимыми на уровне α=0,05, то соответствующий управляющий фактор в дальнейшем анализе не участвует. Таким образом, получаем набор «модифицированных» управляющих факторов. Обозначим такие факторы



Такую процедуру необходимо проделать для каждого


- проверку значимости коэффициентов модели с помощью критерия Стьюдента [2];
- вычисление коэффициента детерминации,
- проверку значимости модели в целом с помощью критерия Фишера [2].
Отобрав, таким образом, все значимые модели, на следующем этапе, из них выделяются наиболее «устойчивые» к изменениям в структуре данных, возникающим с течением времени.
Анализ «устойчивости моделей» производится на основании анализа матриц B с использованием статистики амплитудного коридора [4]

(3)
о



Здесь





Данный метод построения, анализа и отбора многомерных моделей в настоящее время положен в основу программного компонента, разрабатываемого в рамках научного проекта Федерального научного центр медико-профилактических технологий управления рисками здоровью населения [3].
Библиографический список
1. Айвазян С.А. Прикладная статистика: Исследование зависимостей/ С.А. Айвазян, И.С. Енюков, Н.Д. Мешалкин. – М.: Финансы и статистика, 1989.
2. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. «ЮНИТИ». Москва, 1998.
3. Бабушкина Е.В., Гусев А.Л., Лупач Д.Ю. Разработка базовых элементов информационно-аналитической поддержки анализа причинно-следственных связей факторов среды обитания и здоровья населения // Материалы Всероссийской науч.-практич. конф.-Кумертау, 2010.
4. Гусев А.Л., Хрущева Е.В. Выбор модели на основе сравнения аиплитудных коридоров в задачах управления рисками здоровью населения // Вестник Пермского университета: Математика. Механика. Информатика, Пермь, 2010. Вып. 3(3), С. 76-79
Modeling casual-and-effect relations in the risks analysis
Lupach D.U.
Perm State University, E-mail: lupachdu@ramber.ru
The article describes the method of construction, analysis and selection of multidimensional models for risk prediction.