Темы диссертаций по экономике » Математические и инструментальные методы экономики

Вероятностно-статистический анализ максимумов временных рядов с псевдостационарным трендом тема диссертации по экономике, полный текст автореферата



Автореферат



Ученая степень кандидат физико-математических наук
Автор Кудров, Александр Владимирович
Место защиты Москва
Год 2009
Шифр ВАК РФ 08.00.13
Диссертация

Автореферат диссертации по теме "Вероятностно-статистический анализ максимумов временных рядов с псевдостационарным трендом"

ии^4К2551

На правах рукописи

Кудров Александр Владимирович

ВЕРОЯТНОСТНО-СТАТИСТИЧЕСКИЙ АНАЛИЗ МАКСИМУМОВ ВРЕМЕННЫХ РЯДОВ С ПСЕВДОСТАЦИОНАРНЫМ ТРЕНДОМ

Специальность 08.00.13 - Математические и инструментальные

методы экономики

Специальность 01.01.05 - Теория вероятностей и математическая

статистика

Автореферат

диссертации на соискание ученой степени кандидата физико-математических наук

Москва 2009

003462551

Работа выпонена в Государственном университете Высшей Школе Экономики

Научные руководители:

доктор физико-математических наук, профессор Айвазян Сергей Арутюнович; доктор физико-математических наук, профессор Питербарг Владимир Ильич

Официальные оппоненты:

доктор физико-математических наук Бродский Борис Ефимович; доктор физико-математических наук, профессор Тюрин Юрий Николаевич.

Ведущая организация: Учреждение Российской академии наук

Вычислительный центр им. А. А. Дородницына РАН.

Защита состоится л Я

12009 г. в 12.00 часов на заседании Диссертационного совета Д 002.013.02 в Учреждении Российской академии наук Центральном экономико-математическом институте РАН по адресу: 1174)8, г. Москва, Нахимовский проспект, д. 47, ауд. 520.

С диссертацией можно ознакомиться в библиотеке ЦЭМИ РАН.

Автореферат разослан л/^ фЯьрИ-1^2009 г.

Ученый секретарь диссертационного совета кандидат физико-математических наук

С.В. Борисова

I. Общая характеристика работы.

Актуальность темы. Задачи статистического оценивания распределения экстремальных начений экспериментальных данных и статистических выборок является одной из важнейших адач теории вероятностей и математической статистики. Поведение экстремальных значений татистической выборки как правило является предметом первоочередного внимания сследователя. При оценивании вероятностей экстремальных природных явлений, таких как аводнения, ураганы, высокие концентрации загрязнений, при моделировании сценариев яжелых аварий сложных технических устройств, таких как ядерные установки, при оценивании ероятностей больших страховых выплат, ценовых пиков, продожительности жизни в задачах трахования исследователь в первую очередь интересуется распределением экстремальных начений. Классическая вероятностно-статистическая теория экстремумов родилась в первой оловине XX столетия работами Р. Фишера и Л. Типпета (1928) и Б. В. Гнеденко (1943). В снове вероятностной части теории лежит фундаментальная предельная теорема Гнеденко для аксимума случайной выборки и метод ее доказательства, базирующийся на теории правильно еняющихся функций. Далее вероятностная теория экстремумов интенсивно развивалась по ути получения уточнений теоремы Гнеденко и ее обобщений на случай зависимых выборок отрезков временного ряда) и на непрерывное время. Статистическая часть теории развивалась о пути оценивания параметров предельного распределения максимума, и, как следствие, ффективному оцениванию квантилей высокого уровня исходной функции распределения и рогнозу вероятности высокого максимума выборки. Эти задачи решались как в классической остановке, когда наблюдается последовательность независимых одинаково распределенных лучайных величин, так и для зависимых наблюдений, что чрезвычайно важно при сследовании экономических и финансовых рядов, динамики природных явлений. В настоящее ремя имеется большое число методов оценивания вероятностей экстремумов как в ассической постановке, когда имеется стандартная выборка независимых одинаково аспределенных числовых или векторных наблюдений, так и в случае, когда наблюдается тационарный временной ряд или стационарный случайный процесс. Современное состояние ероятностно-статистической теории в основном описано в монографиях 'А Однако в реальной рактике возникают серии наблюдений, которые не могут удовлетворять стандартным условиям днородности выборки. Обычной ситуацией в конкретных статистических исследованиях вляется пропуск или утеря, по тем или иным причинам, некоторых наблюдений. В случае аблюдения временного ряда с определенной структурой зависимости, это может достаточно ильно повлиять на выбор методики исследования. Теория непараметрического и параметрического оценивания в статистике временных рядов и случайных процессов предлагает соответствующие методики. В то же время развитие соответсвующих методов в статистике экстремумов только начинается. Далее, временные ряды и случайные процессы, которые мы наблюдаем в экономике, финансах, окружающей среде, не всегда можно считать однородными. Как правило, присуствует тренд и сезонные составляющие. Исследуя экстремальные явления, где явно присутствует сезонная составляющая, статистики, как правило, сужают выборку, рассматривая лишь максимальные значения по периодам (дневные, сезонные годичные максимумы). Представляется, что при этом теряется определенная часть информации,

' A. Fereira, L. de Haan, (2006). Extreme value theory. An introduction. Springer Series in Operations Research and Financial Engineering. Springer.

2 Leadbetter M.R., Lingren G-, Rootzen H., (1983). Extreme and related properties of random sequences and precesses. Springer Statistics Series. Berlin-Heidelberg-New York:Springer.

поскольку ближайшие к абсолютным сезонным максимумам значения также содер-информацию о распределении максимальных значений. Исследования в этих направлен находятся в начальной стадии \4. В первой работе рассмотрено поведение оце экстремального индекса временного ряда в случае пропущенных наблюдений, во вто рассмотрена стандартная статистическая выборка с добавленным малым почти периодичес трендом. В настоящей работе эти две задачи объединяются в одну - мы исследуем предель распределение максимума временного ряда с добавленным малым почти периодичес (псевдостационарным) трендом и рассматриваем поведение статистических оценок, основаш на этой модели. Таким образом, в настоящей работе рассмотрены две актуальные зад статистической теории экстремумов - задача об оценивании вероятности высокого максим при наличии пропусков в наблюдениях и с учетом тренда типа сезонной составляющей.

Основные цели работы:

Х вывод приближенной формулы для распределения максимума отрезка случайного стационарного временного ряда с добавленным трендом и доказательство соответствующей предельной теоремы в условиях слабой зависимости далекоотстоящих экстремумов;

Х вывод приближенной формулы для совместного распределения максимума отрезг временного ряда и того же отрезка с пропущенной частью наблюдений;

Х конкретизация условий слабой зависимости в данной постановке для случая гауссовской последовательности;

Х исследование предложенных приближений при помощи методов статистического моделирования и на реальных данных.

Научная новизна диссертации заключается в разработке методов анализа макиму прореженных нестационарных временных рядов. Доказаны предельные теоремы о совмест! распределении максимума случайной стационарной последовательности с добавлен! псевдостационарным трендом и ее прореженной подпоследовательности. Для доказатель введено новое условие перемешивания (слабой зависимости) далеко отстоящих экстремумо случае гауссовской последовательности получен окончательный результат о предель распределении максимума. Все полученные теоретические результаты являются новым доказаны автором лично. На основании этих математических результатов предложена н методика обработки данных об экстремальных значениях временных экономических рядов, методика апробирована на данных, полученных методом статистического моделирования, I реальных данных - потребление электроэнергии в России и температура в центральной ча Англии. Последние данные достаточно часто используются в литературе для апробации но статистических методов.

Методы исследования. Использован аппарат асимптотического анализа (ме Лапласа), асимптотической теории гауссовских процессов, методы стохастическ

1 Mladenovirc P., Piterbarg V.I. (2008). On estimation of the exponent of regular variation using a sample with missing observations. Statistics and probability letters, 78,4, 327-335.

4 Кузнецов Д. С. (2005). Предельные теоремы для максимума случайных величин. Вестник МГУ. Сер. Машем. Механ., 3, 6-9.

моделирования, методы статистического анализа экстремумов, такие как методы оценивания квантилей и экстремального индекса. Также использовались типичные для статистического анализа методы визуализации данных (квантильные бумаги и графики Пикандса) с последующим применением методов линейного регрессионного анализа.

Теоретическая и практическая ценность. В работе получены важные аппроксимации для функции распределения максимума стационарной случайной последовательности с добавленным псевдостационарным трендом. Эти аппроксимации позволяют оценивать высокопроцентные квантили распределения и вероятности высоких максимумов с большой точностью. Полученные предельные теоремы представляют собой новый шаг в развитии вероятностно-статистического анализа экстремумов. Численные исследования разработанных на основании полученных аппроксимаций статистических методов показали их хорошую эффективность по сравнению с классическими, применяемыми в моделях с малым трендом.

Апробация результатов исследования. Основные результаты работы докладывались на:

1). Семинаре "Многомерный статистический анализ и вероятностное моделирование реальных процессов" в ЦЭМИ РАН.

2). УИ-ой международной школы-семинара по многомерному статистичесому анализу и эконометрики, пос. Цахкадзор (Республика Армения), 2008 год.

3). Научном семинаре кафедры математической экономики и эконометрики, ГУ ВШЭ.

4). Семинаре по теории вероятностей университета Черногории, Подгорица.

5). Семинаре по теории вероятностей на механико-математическом факультете МГУ.

Публикации. По теме диссертации опубликовано 4 научные работы (в том числе 3 основные работы) общим объемом 2,5 п. л., личный вклад автора 2,4 п. л., 1 работа опубликована в журнале, рекомендованном ВАК.

Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения, списка литературы из 87 наименований, 1 таблицы, 36 рисунков.

II. Основное содержание работы.

Во введении обосновывается актуальность темы и дается краткое содержание работы.

В первой главе рассматривается задача аппроксимации распределения максимума прореженных значений временного ряда

= Х,- +аДт^ 1=1,2,...,л = 1,2,... (1)

где {X;, I =1,2,...} - строго стационарная случайная последовательность, где случайная величина X] имеет функцию распределение /""(дс), которое предполагается максимум-устойчивым; {т,-, I = 1,2,...} - тренд, ведущий себя стационарным образом в определенном ниже смысле (например, сезонная составляющая), а (ап),(Ьп) - последовательности, для которых выпоняется предельное соотношение:

limF"(anx + bД) = H(x), (2)

где H(x)Ч невырожденная функция распределения.

Обозначим и^ ~anx + bn, и^ =any + bn, ип =шах(и\,и*).

В первом параграфе первой главы вводится условие типа Лидбеттера на перемешивание больших значений в модели (1), которое носит название условие D2(u]l,u2,an,{mk }к=, Д). Оно состоит в следующем:

последовательность случайных величин {X;, I = 1,2,...} удовлетворяет условию D2(ujl,u2,all,(mk }i=1 Д), если найдется семейство чисел {Д ,}, п,1 = 1,2,... и последовательность натуральных чисел {/Д } такие, что ln = о(п), CCn t Ч 0, и для любых х, у и произвольных множеств натуральных чисел I = ,..., ip},J = [j\,..., } таких, что

1 < /, < /2 <... < ip < 7, <... < jq < п, J] - ip > /Д, выпоняется неравенство

suplР( р| {Xj<u?J)-anmj))-а jzlUJ

- />(f|{ Xj < и]f"> - anmjm(~][Xj < и? - anmj}) |< ,

je/ je J

где супремум берется по всем отображениям сх из множества натуральных чисел в множество

Условие D2 (ulll,ufl,an,[mk)k=iп) гарантирует перемешивание (слабую

зависимость) далеко отстоящих больших значений временного ряда (1).

Вводится также допонительное условие для случайной последовательности

i = 1,2,...} - условие D (ип - тап ):

lim lim sup п ^Г > ип -man\Xj > ип - тап} =0.

*->~ Д_,л, 2<)<rJk

Это условие гарантирует отсуствие кластеров экстремумов, аналогично случаю независимых,

подробности см. в

Пусть имеется случайная последовательность из нулей и единиц {<5, ,/= 1,2,...}, где событие {<5, =0} символизирует пропуск наблюдения Хг

Для 77=0,1 введем "выборочные функции распределения" значений тренда для пропущенных и наблюдаемых ,

0Д (х) =-,

Т] = 0,1, знак # обозначает число элементов множества.

Пусть в - неубывающая неотрицательная непрерывная справа ограниченная функция, обозначим а+ := шах(д,0), и определим функции

Ll(z,G) = e~z V</G(0; L2(z,G)=jz-t)0dG(t),J3<O-,

Сформулируем условие псевдостационарности последовательности [тк,к Ч1,2,...} относительно случайной последовательности {5^, к = 1,2,...}:

найдутся функции G0 (д) и G[ (д;) такие, что для обоих 77 = 0,1 имеет место сходимость по вероятности

(х) -> Gjj (х), при п->

во всех точках непрерывности х соответствующей функции ад Х Кроме того, для любого V = 1,2,3, если F е Dv, то для всех х и Т] = 0,1 существуют конечные пределы

hm e(m*,g;;))=zv(*iG17)<OO.

Функции Zy (х,Gjj) участвуют в формулах для предельного распределения вектора Мп,МП-Заметим, что при выпонении условия 2 лишь L2 (х, G^ ) не обязательно конечно.

Во втором параграфе первой главы представлены вспомогательные леммы и их доказательства. Среди них - аналог теоремы Лидбеттера для последовательности

[Yf"\n = l,2,...,i = 1,2,...} и двух пороговых уровней.

В третьем параграфе доказан основной результат первой главы - предельная теорема для случайного вектора

МД = max(X; +m,aД; i = 1,...,л} и Мп = тах{Х,- + mian\i = 1,.,.,/гД- =1} при неограниченно растущем п.

Теорема 1 Пусть в модели (1) F И Dv, где V Ч1,2 или 3. Предположим, что для последовательности случайных величин {Х(-,1 = 1,2,...} выпонены условия

2 | 9 Х

D {ип,и~,ап,[тк)к=.(.....Д),D (ия Ч тап).Предполодим далее, что последовательность

{тк, к = 1,2,...} псевдостационарна относительно случайной последовательности [бк , к Ч 1,2,...} и ограничена сверху {rn :Ч supi=| ^ mi ) Пусть последовательности {Х(-, / = 1,2,...) и {Sj,i = 1,2,...} независимы. Тогда,

если V = 1 ши V = 3, ото для всех х, у,

lim Р[Мп <и)-Мп = (4)

если V = 2, то для всех х,у > т,

Во второй главе исследуется ассимптотическое поведение совместного распределения максимума гауссовской последовательности и максимума ее же с детерминированным прореживанием в модели

{X,- +mian,i = 1,2.....п = 1,2,...},

где X,-, / = 1,2,...,- гауссовская стационарная последовательность с нулевым средним и

единичной I Обозначим

единичной дисперсией, т,-, / = 1,2,...,- псевдостаный тренд, ап =(2 In и) 1/2

ЬД = л/21пл--;-(In Inn + 1п4л").

Отметим, что последовательности (ап ),(ЬД) являются нормирующими последовательности в предельной теореме для максимума последовательности независимых гауссовских случайных величин (2), см. 2Д

Прореживание задается с помощью множества индексов непрореженных наблюдений GД = {/(1),...,)}, которое является подмножеством NД, п = [л/л*], К> 1 , [Х] - целая часть.

В первом параграфе второй главы определяется псевдостационарная последовательность относительно детерминированного прореживания: последовательность {ck ,к Сп}, где СД С NД и | СД |Ч> +оо при Ч называется псевдостационарной с функцией распределения С(х), если для любого х предел

5 Berman S. M. (1964). Limit theorems for the maximum term in stationary sequences. Ann. Math. Statist., №35(2), 502516.

С(х) = lim

1{г:с,- <x,ieCn}\

существует. Через | А | обозначено число элементов этого множества А.

Отметим, что С(х) - не обязательно вероятностная функция распределения, то есть, С(+

Во втором параграфе доказываются вспомогательные леммы, а также дана формулировка обобщенного неравенства Бермана, введенного и доказанного В. И. Питербаргом6, которое состоит в следующем:

пусть имеется два гауссовских вектора X = {Х\,..., Хп) и Y = (У| ,...,Yn ) с нулевыми средними и конариациями Г\(к,1) and r0(k,l), соответственно, причем гх (к,к) = Гу (к,к) = 1. Пусть имеется набор действительных чисел (z<0(&) < ... < им (к), к = 1,...,л}. Обозначим через U агебру подмножеств R", порожденную всеми паралелепипедами вида х"_| [iii (г), и1+1 (/')]. Тогда для любого U е. U, имеет место неравенство

Здесь <р(х, у\г) - гауссовская двумерная плотность с нулевыми средними, единичными дисперсиями и ковариацией г, а гЛ = /гг( + (1 Ч /г)г0.

В третьем параграфе второй главы доказана предельная теорема для предельного совместного распределения случайных величин

max \'пк |=o(ln/i) при

к = 1.....п

Введем преобразование Лапласа функции распределения М ,

М(с) = [yxdM(x)

и обозначим

где (р - плотность стандартного нормального распределения.

Питербарг В.И. (19К8). Асимптотические методы в теории гауссовских процессов. Изд. МГУ.

Мы предположим, что (т,- : i е NД}, так же как [nij: ie Gn), п = 1,2,..., псевдо-стациойарные последовательности с функциями распределениями N(x) и G{x), соответственно. Заметим, что если К = 1, тогда G(x) = N(д:). Предположим, что

j^e^dN(x) < <~ (7)

G(1)*0. (8)

Положим, что для ковариационной функции г(п) гауссовской последовательности {X;, / = 1,2,...} выпоняются следующие условия:

r(n)lnл = 0(1) (9)

r(D-, Inn

= о{Х)прип Ч(10)

для некоторого действительного Л. '

В частности, можно предполагать г{п) произвольной на "редких" множествах Я с Z, таких что j

I [к : к е R,k = 1,...,лJ |= 0(п/(Цп)\пп))

для любого Цп) Ч

lim p{MД(X)-M(1,v(X)<(lJt;MД,jr(X)<b,liJr + a/1y}=FA'v-cUy), (И)

Ьп г = т/21п(п//г)--pL=(ln4/r + Inln/i).

Рассмотрим случай, когда частичная выборка является на самом деле поной, то есть, найдем предельное распределение максимума гауссовской стационарной последовательности с почти периодическим трендом. В этом случае

Ff'c(x,y) = j^expj-e-'^-^Afd )Jp(z)dz =: (12)

то есть для любых х,

lim P(Mn <anx+bn)=F?(x).

Этот результат оформлен в виде следствия 2.4 во второй главе.

Все результаты, полученные для максимумов Мп, очевидным образом переносятся на минимумы, так как справедливо следующее соотношение:

Задача оценки функции распределения максимумов выборок случайных последовательностей с псевдостационарным трендом играет важную роль при определении резервов, прогнозировании пиков потребления (например, потребления электроэнергии), в прогнозировании экстремальных погодных явлении (например, высоких температур) и др. К решению этих задач можно подходить как с позиции результатов классической теории экстремумов, так и с позиции результатов, являющихся расширением классической теории экстремумов, с учетом сезонности данных. Рассматриваемые данные обрабатываются с помощью этих двух подходов.

В третьей главе при помощи методов стохастического моделирования, проведено сравнение классическим подхода (без учета тренда) оценки функции распределения максимума и подхода с учетом псевдостационарного тренда, основанного на результатах из главы 1. А именно, проведено сравнение качества подходов на примерах смоделированных прореженных выборок из некоторых случайных последовательностей, каждый элемент которых представим в виде суммы стационарной последовательности {Xiti Ч1,2,...}, где Xj имеет функцию распределения F(x), которая максимум-устойчива, и добавочной псевдостационарной составляющей аД sin(2Tn/3), где последовательность (ап) такая, что выпоняется (2). Рассмотрены случаи, когда элементы стационарной последовательности имеют гауссовское распределение, распределение Коши и равномерное на отрезке [0;1] распределение, и в которых элементы стационарной последовательности являются независимыми случайными величинами, так и случаи, в которых элементы стационарной последовательности являются 2 -зависимыми. Прореживание моделируется при помощи последовательности ():

{I) - последовательность независимых случайных величин, не зависящих от {X,/ = 1,2,...}. Пусть {X, } удовлетворяет условиям основного результата главы 1. Применим этот результат к

тД = шт{Х|,...,АГД} = -тах{-Л:1,...,-Хп}.

1, с вероятностью

О, с вероятностью

Мп(Х) = тах{X,- + ап sin(2о/3);i е NД,$ = 1}.

' Ит (Х)йапх + Ьп}=К1 (*).

Смоделируем выборку стационарной последовательности {X,-, I = 1,2,...} объема 250000:

Х1,...,Х 250000.

Возьмем:

М 1(Х) = тах{Х, + а500 = 1.л = 1,Ч,500},

М5оо(Х) = шах{Х4995оо+/+ а500 8т(2л/3)., =1,/ = 1.....500}.

Порядковая статистика для М | (А'),...,М500 (X): 1

М1.500(Х)^...<М500400(Х). Тогда бумага 00 Ч квантилей функции распределения К(х) против квантилей эмпирической

функции распределения нормированных максимумов [М/(Х),1 = 1,...,п} примет вид

А(Х) = -

.'^N500 },

Нш Р{тах[Х-, :81 = 1,/е 1ЧД}< дД* + Ья) = К2(х).

Рассмотрим множество пар чисел

А(Х) = .

,500 >500

500 [ Х

Одно приближение лучше другого, если 00Ч бумага первого расположена ближе к прямой с коэффициентом наклона 1, проходящей через начало координат, чем бумага второго. Хотя в рассмотренных примерах преимущество одного приближения над другим будет заметно

визуально, мы численно измерим преимущество одного приближения над другим с использованием суммы квадратов отклонений:

где ; = 1,2, а с - пороговый индекс (мы будем брать с = 1 ,...,470).

Во всех рассмотренных случаях видно, что функция распределения Т| (х) приближает эмпирическую функцию распределения нормированных максимумов прореженной выборки лучше, чем функция распределения К2 (х),

В четвертой главе проведена обработка реальных данных о потреблении электроэнергии в России и температуре воздуха в Центральной Англии. Полученные результаты также сравнены с результатами, полученными с помощью классического подхода.

В первом параграфе четвертой главы представлены результаты обработки реальных данных, представляющих собой выборку, состоящую из ежедневных максимумов температур воздуха в Центральной Англии, взятых за период с 1 января 1878 по 31 декабря 1998 года, для которых описана процедура построения функции распределения годовых максимумов температур в этом регионе на основании классической теории экстремальных значений, на основании результатов главы 1 и сравним каждую из полученных функций распределения с эмпирической функцией распределения.

Во втором параграфе четвертой главы исследуются данные о почасовом потреблении электроэнергии в России за период с 7 июня 2005 года по 22 июля 2005 года. Визуальный анализ изменения потребления электроэнергии позволяет сделать вывод о периодичности потребления за сутки. Более того, можно увидеть, что имеется периодичность, связанная с днями недели, и годичная периодичность (однородность по сезонам). При поном исследовании экстремальных значений потребления необходимо учитывать и годичный тренд. Задача поного исследования в работе не ставится.

В нашем случае, такой период взят как пример однородности по сезону. Были взяты только данные со вторника по четверг каждой недели, так как максимумы потребления в течение недели за рассматриваемый период достигаются только в эти дни и для этих дней наблюдается похожая структура потребления.

Для обоих примеров данных схема оценки функции распределения максимумов на основе результатов главы 1 одна и та же:

пусть (У/) - это выборочные значения случайного ряда (У/), представимого в виде суммы некоторой детерминированной периодической составляющей (/?,) и стационарного временного ряда (X,-). то есть:

Далее.положим, что детерминированная периодическая составляющая имеет период равный г.

В качестве оценки для Pj, 1< )<г мы берем обычное эмпирическое среднее ) -ых

-КГ №01) ,

1/ =Х/+Л-

наблюдения выборки (У,-) в каждом из последующих К периодов:

** + Ук+гЧ + Рк=--.

где 1 < I < г, е N (N - множество натуральных чисел), а АГ-количество лет, охватываемые

выборкой.

Возьмем индекс 10 максимального элемента последовательности р\,..., рг и пусть 5 такое, что в промежуток времени [/0 Ч я, 10 + л] каждого периода попадают все максимумы за период нашей выборки. Будем рассматривать только такие промежутки (сезон) в каждый из периодов, охватываемых нашей выборкой. Им будут отвечать следующие элементы последовательностей

$+г(т-1) Х'е ['о - О + П N. т = 1К), (Х1+Г(т_{),{е [10 -л,/0 +5]Нт = 1,...,АГ), (р)у 16 [10-5,10+1]ПМ,1=1,...,Г).

Обозначим _/-ый элемент первой и второй подпоследовательностей через Т*, X*

(1< 7 < (25 +1)^0, соответственно, а 7-ый элемент (1< _/ < 2л +1) третьей л *

подпоследовательности - р^ .

Возьмем максимум элементов на каждом интервале индексов [(/и Ч1)(25 + 1),ш(25 +1)], где т = 1 ,..,К для ряда (Уj ) и ряда (X*), получим:

МХ,...,МК.

Пусть последовательность {X- это выборка последовательности (X , тогда (У- ) - это

выборка последовательности (X* + Р^- Положим, что {X ) обладает свойствами

стационарности и асимптотической независимости. Тогда, применив результаты главы 1 для случая, когда периодический тренд равен нулю, получим предельную функцию распределения

для нормированных максимумов случайного ряда (Х;) (функцию распределения

экстремальных типов). Оценим эту предельную теоретическую функцию распределения. Для этого необходимо оценить экстремальный индекс. Мы будем использовать оценку Пиккандса

для экстремального индекса. Возьмем вариационный ряд последовательности (X Х)

^lOltf.lOltf - ^lOIAT-MOIAT - Ч - ^I.IOIK

тогда оценка Пикандса для экстремального индекса имеет вид:

р 1 . ^/,101/f ~ ^2/.I01"

In 2 у* -У*

Кратко опишем статистические свойства этой оценки (см. [De Haan L., Ferreira А.(2006))): Х Если i(n)/n Ч> 0 при п -4 , тогда п по вероятности стремится к .

При некоторых допонительных условиях Д Ч имеет ассимптотическое нормальное

Хл и дисп

распределение с нулевым средним и дисперсией

<r-(22i+1+l)

(2(2^ - 1)1п2)2 '

Для того, чтобы выбрать оптимальное значение оценки п, прибегнем к часто используемой процедуре (см.7):

Изобразим график множества

= 1.....[rJC/4]}

Х Выберем наибольшую область, где график приблизительно горизонтален и в качестве оценки экстремального индекса берут значение соответствующее этому уровню.

Для того, чтобы оценить нормирующие коэффициенты аг,Ьг, рассмотрим квантиль-квантиль график, представляющий собой множество А, элементы которого составлены из пар, имеющих вид (квантиль уровня М(К + \) для эмпирической функции распределения С(.г); квантиль уровня И(К + 1) для функции распределения экстремальных типов с экстремальным индексом ), более формально:

G (i/(K + !)),-

:/= 1.....К

' Embrechis P., Kliippelberg C., Mikosch T. (1997). Modelling Extremal Events for Insurance and Finance. Springer, New York.

Пусть в линейной регрессии значений {(? +1)),1 = 1,..., АГ} на соответствующие

,1 = 1,...,Г>, где Ь- свободный член, а а - коэффициент при

значения < Ч

/ Г .Х гП

V и+и У

регрессоре. Тогда в качестве оценок для аг,Ьг берутся равными берутся а и Ь, соответственно. С помощью этой нормировки пронормируем максимумы МХ,...,М к:

(Мх-Ъ)1а,...,{Мк-Ъ)1а.

Обозначим эмпирическую функцию распределения величин ,..., М к через 1/(х), а эмпирическую функцию распределения величин М1 к через .

Для сравнения эмпирической функции распределения й(х) и теоретической функции

распределения экстремального типа с экстремальным индексом с учтенным псевдостационарным трендом.

Далее, воспользуемся результатами главы 1, в соответствии с которыми, при определенных достаточно общих предположениях, функция распределения

Р{х) = ехр

дожна приближать эмпирическую функцию распределения выборки нормированных максимумов (17). Для того, чтобы увидеть насколько хорошо одна функция распределения приближается другой функцией распределения, обратимся к множеству

В = {и~1 (И(К + 1))\атк +1)) + ь): I = 0,..., к\ (18)

где (/(К + 1)) является решением уравнения

_1_ 101

Заметим, что это уравнение всегда имеет решение, так как функция, стоящая слева, монотонна по ШК + \)).

Схема оценки функции распределения максимумов на основе результатов кла:сической теории экстремумов следующая:

Возьмем вариационный ряд последовательности (М :

М*к,к <...<М*К.

Для оценки экстремального индекса применим оценку Пиккандса:

1 , ^.К~МИ.К

т)ы =-1 Ч-г^Ч-

' 1п2 ЬЛъл-МАик

Для того, чтобы выбрать оптимальное значение оценки 77, Д, прибегнем к уже описанной процедуре:

Х Построим график функции Т)1 п, / = 1,..., ЛУ4

Х Выберем наибольшую область, где график приблизительно горизонтален, и в соответствии со значением функции /7, п, отвечающем этому уровню, выбираем значение оценки Пикандса.

Определим линейную нормировку, построив прямую (у-ах + Ь) по методу наименьших взвешенных квадратов, приближающую квантиль - квантиль 1рафик

Г 1 } -г \

- С->(И(К + \))

на плоскости (х, у). В соответствии с этой линейной нормировкой пронормируем максимумы:

(МгА)/й.....(М^-Щ (22)

Для сравнения эмпирической функции распределения и теоретической функции

распределения экстремального типа с экстремальным индексом ^ без учета псевдостационарного тренда обратимся к квантиль-квантиль графику

с'тк+т-а

:л = 1.....К)

Сравнивая графики В и О, приходим к выводу, что учет периодического тренда позволяет получить более лучшие оценки для описания эмпирической функции распределения максимумов, чем оценки построенные на основании выборки, состоящей из ежегодных максимумов. Такие результаты можно объяснить тем, что учет нестационарности типа периодического тренда (даже малого, как в этом примере) позволяет оценивать параметры соответствующей функции распределения по большему числу данных по сравнению с числом данных, по которым оценивается функция распределения экстремального типа, а значит позволяет получить более устойчивые оценки.

III. Основные выводы по результатам исследования.

1. Получена предельная теорема для совместного распределения максимума отрезка стационарного временного ряда с добавленным малым псевдо-стационарным трендом и максимума по тому же отрезку, но с пропущенными наблюдениями. С этой целью введено понятие перемешивания высоких экстремумов при наличии тренда, обобщающее введенные ранее условия типа Лидбеттера.

2. С целью конкретизации условия перемешивания, рассмотрен случай гауссовского временного ряда. Оказалось, что если корреляционная функция г(п) исходного гауссовского

стационарного ряда ведет убывает к нулю быстрее, чем 1/1пл, то предельный закон распределения максимума совпадает с законом, полусенным в условиях перемешивания. Если же где г(п) убывает к нулю пропорционально 1/1пи, то предельный закон уже отличается, он основан не на пуассоновском распределении высоких экстремумов, а на смеси пуассоновских -на процессе Кокса. То есть, найден пример временного ряда, не удовлетворяющего введенному условию перемешивания, для которого, тем не менее, получено предельное распределение максимума.

3. При помощи методов статистического моделирования проведено сравнение точности приближения распределения максимума, основанное на полученных в данной работе предельных теоремах и точности, основанной на классических приближениях, когда рассматриваются лишь сезонные максимумы. Поскольку в в новых приближениях задействованы не только сезонные максимумы, но и близкие к ним другие значения временного ряда, новые приближения оказываются точнее.

4. На основании полученных предельных теорем в диссертации разработаны методы статистического оценивания распределения параметров максимума отрезка временного ряда в условии наличия пропущенных наблюдений и сезонной составляющей. Проведена сравнительная статистическая обработка данных классическим и новым методом. Новый метод в данной модели дает безусловно лучшие результаты.

IV. Публикации по теме диссертации.

Работы. опубликованные автором в ведущих рецензируемых научных журналах, рекомендованных ВАК Министерства образования и науки РФ:

1. Кудров А. В. Оценка функции распределения максимумов выборок стационарных последовательностей с псевдостационарным трендом.// Журнал "Прикладная эконометрика", 2008, No. 3(11).- 1.2 п.л.

Другие работы, опубликованные автором по теме диссертации:

2. Кудров А. В. О максимумах частичных выборок случайных последовательностей с псевдостационарным трендом.// Стат. методы оценивания и проверки гипотез, межвузовский сборник научных трудов, 2008. - 0.7 п.л.

3. Кудров А. В. Предельные функции распределения для и их приложения.// Труды VII-ой международной школы-семинара по многомерному статистическому анализу и эконометрики, пос. Цахкадзор (Республика Армения), 2008, 118-120.-0.12 п.л.

4. Kudrov A.V. On maxima of partial samples in gaussian sequences with pseudo-stationary trends.// Liet. matem. rink., 2007, 47, No. 1, 1-10. - 0.4 п.л. (в совторстве с профессором Piterbarg V., вклад автора - 0.3 п.л.).

Кудров Александр Владимирович

ВЕРОЯТНОСТНО-СТАТИСТИЧЕСКИЙ АНАЛИЗ МАКСИМУМОВ ВРЕМЕННЫХ РЯДОВ С ПСЕВДОСТАЦИОНАРНЫМ ТРЕНДОМ

Специальность 08.00.13 - Математические и инструментальные

методы экономики

Специальность 01.01.05 - Теория вероятностей и математическая

статистика

Автореферат

диссертации на соискание ученой степени кандидата физико-математических наук

Заказ № 8

Объем 1 п.л.

ДЭМИ РАН

Тираж 100 зкз.

Диссертация: содержание автор диссертационного исследования: кандидат физико-математических наук , Кудров, Александр Владимирович

1 Введение.

2 О максимумах частичных выборок случайных последовательностей с псевдостационарным трендом.

2.1 Определения и результаты.

2.2 Доказательство основного результата.

3 Максимум частичных выборок в гауссовских последовательностях с псевдостационарным трендом.

3.1 Определения и результаты.

3.2 Вспомогательные леммы.

3.3 Доказательство основного результата.

4 Верификация полученных аппроксимаций методом стохастического моделирования.

4.1 Случай области притяжения Гумбеля.

4.2 Случай области притяжения Фреше.

4.3 Случай области притяжения Вейбула.

5 Обработка реальных данных.

5.1 Температуры в Центральной Англии.

5.2 Потребление электроэнергии в России.

Диссертация: введение по экономике, на тему "Вероятностно-статистический анализ максимумов временных рядов с псевдостационарным трендом"

Настоящая работа является диссертацией на соискание ученой степени кандидата физико-математических наук. Она посвящена статистическому анализу экстремумов стационарных временных рядов с добавленным переменным трендом, обобщающим сезонную составляющую. При этом допускаются пропуски наблюдений, что существенно влияет на выбор методики в силу наличия статистической зависимости между членами временного ряда. Диссертация состоит из трех глав, введения, заключения и библиографии. В первой главе изучается предельное поведение распределения экстремального значения произвольного стационарного временного ряда с добавленным малым исевдостационарным трендом, в условиях случайного прореживания, при неограниченном росте числа наблюдений. При этом на временной ряд налагаются условия слабой зависимости далекоотстоящих экстремумов (условие перемешивания типа Лидбеттера). Это условие не всегда легко проверяемо, в силу этого во второй главе рассмотрены гауссовские временные ряды, для которых условие слабой зависимости может быть выражено в терминах поведения корреляционной функции на бесконечности. Вторая глава посвящена исследованию предельного распределения экстремума гауссовской стационарной последовательности с малой "почти сезонной "составляющей в условиях детерминированного прореживания. Вместо условия перемешивания требуется определенная степень стремления корреляций к нулю для далекоотстоящих наблюдений. В третьей главе рассматриваются примеры обработки реальных данных с периодической структурой но методике, основанной на результатах первых двух глав. Эти результаты сравниваются с результатами, полученными на основании классической статистической теории экстремальных значений.Также проводится сравнение классической о предлагаемой методик для данных, полученных методом стохастического моделирования.Традиционно теория экстремальных значений используется для оценки функций распределения экстремумов выборок или отрезков временного ряда. Это позволяет оценить квантили высокого уровня. Например, около 40% территории Нидерландов находится ниже уровня моря.Поэтому для того, чтобы обезопасить от морских стихий территории, расположенные вдоль побережья, необходимо сооружать дамбы. Правительство, балансируя между стоимостью и надежностью, определило, что дам3 бы дожны быть такой высоты, чтобы вероятность наводнения (вероятность того, что уровень морской воды превысит высоту дамбы) в течение года равнялась Ю- 4. Возникает вопрос, какой в этом случае дожна быть высота дамбы, чтобы соответствовать этому требованию. Помочь ответить на этот вопрос может теория экстремальных значений.Оценка вероятностей редких или экстремальных событий является важной задачей в управлении рисками финансовых портфелей. Теория экстремальных значений позволяет использовать некоторые фундаментальные результаты, необходимые для статистического моделирования таких событий и вычисления мер экстремального риска. Последние несколько лет финансовые рынки характеризовались значительной неустойчивостью. Это привело роде к определенной критике существующей системы управления рисками, что явилось мотивацией поиска более адекватных методологий описания редких событий.Обычным вопросом, на который каждый хотел бы получить ответ состоит в том, что: "Если ситуация начнет развиваться нестандартным образом, насколько неточны могут быть используемые модели. "Таким образом, проблема состоит в том, чтобы понять, как моделировать редкие события, которые лежат вне промежутка доступных наблюдений. В такой ситуации кажется важным полагаться на основательные методологии.Теория экстремальных значений (ТЭЗ) дает теоретические основания, на базе которых мы можем построить статистические модели, описывая экстремальные события.Во многих областях современной науки, инженерии и страхования, теория экстремальных событий хорошо разработана (см., например, [Embrechts et al. (1999)], [Reiss, Thomas (1977)]). Сейчас существует различные исследования, направленные на анализ экстремальных изменений, возникающих на финансовых рынках (например, кризис валютных рынков, экстремальные события на фондовых рынках, кредитные дефоты).Характер хвостов финансовых рядов анализировася, помимо прочего, в работах [Koedijk et al. (1990)], [Dacorogna et al. (1995)], [Loretan, Phillips (1994)], [Longin (1996)], [Danielsson, de Vries (2000)], [Kuan, Webber (1998)], [Straetmans (1998)], [McNeil (1999)], [Jondeau, Rockinger (1999)], [Rootzen, Kluppelberg (1999)], [Neftci (2000)], [McNeil, Frey (2000)], [Gencay et al. (2003b)]. Интересная дискуссия относительно потенциала теории экстремальных значений в управлении рисками дана в работе [Diebold et al. (1998)].В основе классической теории экстремальных значений лежит фундаментальная теорема о предельном распределении максимума Мп = тах(Хх,...,Хп) п независимых одинаково распределенных случайных величин. Этот результат впервые изложен в работе [Fisher R., Tippet L. (1928)] и получил поное математическое обоснование в работе [Gnedenko В. (1943)]. Терема Фишера-Типпета-Гнеденко описывает все возможные предельные формы распределения МД при линейных нормализациях.Теорема 1. (Гнеденко, Фишер, Типпет).Обозначим через F(x) функцию распределения случайной величины Хи тогда Р(Мп <х)= Fn{x), и (1.1) можно переписать в виде lim Fn(anx + bn) = Н(х). (1.2) пЧ>оо Если для некоторых ап > 0, Ьп выпонено (1.2), то функцию распределения F(-) называют м^^ш^еХпГ'устойчивой. Если Н{х) с точностью до линейного преобразования аргумента совпадает с одной из Ни(х), где v = 1,2,3, тогда говорят, что F(-) принадлежит области притяжения Dv, и пишут F(-) И Dv. Параметр /3 называют экстремальным индексом. Важнейшей задачей статистического анализа экстремальных значений является задача оценивания экстремального индекса р. В классическом случае выборки независимых одинаково распределенных случайных величин оценки для Р были предложены в работах [Pickands J. (1975)], [Hill В. (1975)], [Dekkers A., de Haan L. (1989)], свойства этих оценок изучены во многих работах, смотри например [Masson D. (1982)], [Hall P. (1982)], [Hausler E., Teugels J. (1985)], [Davis R., Resnick S. (1984)], [Smith R. (1994)], [Beirland J., Teugels J. (1989)]. Современное состояние статистического анвлиза экстремумов в классической постановке, включая векторные выборки и выборки, состоящие из траекторий случайных процессов, изложено в монографии [De Haan L., Ferreira A. (2006)]. Оценки экстремального индекса в случае зависимых выборок также достаточно поно изучйены, см. монографию [Embrechts P., Mikosch Т., Kluppelberg (1997)] и библиографию в ней, а также [Hsing Т. (1991)], [Mladenovic' P., Piterbarg V. (2008)].Известны критерии, дающие необходимые и достаточные условия принадлежности функции распределения F(-) к той или иной области притяжения ([Leadbetter М., Lindgren G. Rootzen Н. (1983)]). Следует отметить, что существуют функции распределения, для которых (1.2) не выпоняется ни при каких ап > 0, Ьп. В этом случае линейно нормированный максимум Мп не имеет невырожденной предельной функции распределения. Таким свойством обладает, например, распределение Пуассона (доказательство этого утверждения см. на стр. 38 в работе [Leadbetter М., Lindgren G. Rootzen Н. (1983)].Обобщение классической теории экстремальных значений происходило по двум направлениям: 1-ое напр. расширение результатов классической теории на случай зависимых стационарных временных рядов 2-ое напр. расширение результатов классической теории на случай неоднородных выборок и нестационарных последовательностей Основные результаты развития теории по первому направлению представлены в работах [Loynes R. (1965)], [Leadbetter М. (1983)], [Watson G. (1954)], [Berman S. (1964)]; по второму направлению - [Cramer H. (1966)], смотри также монографии [Leadbetter M., Lingren G. Rootzen H. (1983)] и [Embrechts P., Mikosch Т., Kluppelberg С (1997)] и библиографии в них. Заметим, что ограничения на зависимость между далеко отстоящими друг от друга элементами используются таким образом, что предельный закон для линеаризованных максимумов остается такими же, как если бы исходная последовательность была бы последовательностью независимых случайных величин. При этом предлагаемые ограничения на зависимость значительно слабее, чем ограничения, связанные с доказательством центральной предельной теоремы для сумм зависимых случайных величин, как например условие зависимости Розенблатта (см. [Rozenblatt М. (1956)]).Предложенные ограничения на зависимость формулируются следующим образом: обозначим Fllt...>in{xu...,xn) = P(Xtl < xu...,Xin < хп), где (Хп) - стационарная в узком смысле случайная последовательность.То есть, если последовательность удовлетворяет этому условию, то всякое событие А, относящееся к прошлому вплоть до момента р, "почти не зависит" от любого события В, относящегося к будущему, начиная с момента р + к + 1, когда значение к велико.Для гауссовских стационарных случайных процессов и последовательностей условие перемешивания можно заменить на условие достаточно быстрого убывания корреляции к нулю при неограниченном росте временного аргумента. Первой работой в этом направлении является работа [Berman S. (1964)], в которой доказана предельная теорема о сходимости к распределению Гумбеля для распределения максимума гауссовской стационарной последовательности (Хп), при условии, что limД_>00r(n) logn = О, где r(n) = cov(Xi,Xn+i). Далее это направление интенсивно развивалось для непрерывного времени, для гауссовских случайных полей с непрерывным и дискретным временем, имеются результаты и для более медленного убывания корреляции, получено также необходимое и достаточное условие сходимости к распределению Гумбеля в терминах поведения корреляции ([Питербарг В. И. (1981)]). Основополагающий вклад в это направление принадлежит В. И. Питербаргу. Подробное изложение этих и других фактов асимптотичской теории гауссовских процессов имеется в монографиях [Питербарг В. И. (1988)] и [Piterbarg V. (1996)].Одним из важных направлений развития статистической теории экстремумов является исследование прореженных последовательностей, что соответствует ситуации пропущенных наблюдений при статистической обработке данных. Для гауссовских последовательностей первыми работами в этом направлении являются [Mittal Y. (1978)] для дискретного времени и [Piterbarg V. (2004)] для непрерывного времени, где получены предельные распределения для совместного распределения максимумов по прореженным и поным данным. Задачи статистического оценивания параметров распределения экстремумов в условиях наличия пропущенных наблюдений впервые поставлены и частично решены в [Mladenovic' P., Piterbarg V. (2008)], где доказана состоятельность модифицированных оценок Хила (определение см. ниже) экстремального индекса в условиях пропущенных наблюдений. Отметим также статьи [Ольшанский К. А. (2004)] и [Ольшанский К. А. (2004а)], где изучено поведение оценки показателя кластеризации экстремумов для поной и прореженной последовательностей.Следующей после модели с прореживанием важной моделью в исследовании распределения экстремальных значений для неоднородных выборок является переход к выборкам и случайным последовательностям с добавленным непостоянным трендом, например, при наличии сезонной составляющей. Насколько нам известно, первой работой в этом направлении является статья [Кузнецов Д. (2005)], где рассмотрена модель стандартной статистической выборки с добавленным малым почти периодическим математическим ожиданием. В этой работе впервые получена форма предельного распределения максимума и указано, насколько малым дожен быть нестационарный тренд, чтобы существовало невырожденное предельное распределение. Этот подход является несомненно очень важным при обработке данных, в которых имеется, например, сезонная составляющая.Как сезонная составляющая, так и наличие пропущенных наблюдений, являются важными атрибутами статистического анализа временных рядов, таких как экономические и финансовые ряды, ряды, описывающие динамику изменения окружающей среды, погоды, другие. Таким образом, представляется, что разработка методов и методик статистического анализа распределений экстремальных значений стационарных временных рядов с добавленным малым трендом типа сезонного и при наличии пропущенных наблюдений, является важной и актуальной задачей статистики временных, в частности экономических, рядов.Перейдем к подробному изложению содержания настоящей диссертации.Обозначим и\ = апх + Ьп, и^ Ч апу + Ьп, ип = max(u*, и2).Условие D2(ull,ufl,an, {mk}k=i,...,n) гарантирует перемешивание (слабую зависимость) далеко отстоящих больших значений временного ряда (1.3).Вводится также допонительное условие для случайной последовательности {Xi, г = 1,2,...} - условие D (ип Ч тап): lim l imsupn \ . Р{Х\ > ип Ч тап; Xj > ип Ч тап} = О, К Х'ОО Т7 Ю*) 2<j<n/fc Это условие гарантирует отсутствие кластеров экстремумов, аналогично случаю независимых Xi, подробности см. в [Leadbetter R., Lindgren G. et al. (1983)].Пусть имеется случайная последовательность из нулей и единиц {Si, г = 1,2,...}, где событие {5i = 0} символизирует пропуск наблюдения Xi.Для 7] = 0,1 введем "выборочные функции распределения "значений тренда для пропущенных и наблюдаемых Yi, пп/ \ _ # 0 : mi<x,Si=T], 1<г<п} г] = 0,1, знак ф обозначает число элементов множества.Функции Ll/(a;, G,,) участвуют в формулах для предельного распределения вектора Мп,Мп. Заметим, что при выпонении условия 2 лишь L2(x,Gv) не обязательно конечно.Во втором параграфе первой главы представлены вспомогательные леммы и их доказательства. Среди них - аналог теоремы Лидбеттера для последовательности {Y/ , п = 1,2, ...,г = 1,2,...} и двух пороговых уровней.Во втором параграфе доказан основной результат первой главы предельная теорема для случайного вектора С^*-, ^ ^ ) > 'ЪЯМп = max{Xj+mjan; г = 1, ...,п} и Мп Ч max.{Xi-\-mian\ г = 1, ...,п, 8^ = 1} при неограниченно растущем п.2v /2hmV ; Отметим, что последовательности (ап), (Ьп) являются нормирующими последовательности в предельной теореме для максимума последовательности независимых гауссовских случайных величин (1.1), см. [Berman S. (1964)], [Leadbetter М., Lindgren G., Rootzen, H. (1983)].Отметим, что С(х) Ч не обязательно вероятностная функция распределения, то есть, С(+оо) не обязательно равно 1. Мы предположим, что {rrii : г Е Nn} , так же как {тп* : г Gn}, п = 1,2,..., псевдостационарные последовательности с функциями распределениями N(x) и G(x), соответственно. Заметим, что если к = 1, тогда G(x) = N(x).Во втором параграфе доказываются вспомогательные леммы, а также дана формулировка обобщенного неравенства Бермана, введенного и доказанного В. И. Питербаргом, [Питербарг В. И. (1988)], которое состоит в следующем: пусть имеется два гауссовских вектора X = (Xi, ...,Хп) и Y = (Y"i, ..., YД) с нулевыми средними и ковариациями rx(k,l) and ro(k,l), соответственно, причем гх(к,к) = гу(к,к) = 1. Пусть имеется набор действительных чисел {и0(к) < ... < им{к), к = 1, ...,п}. Обозначим через U агебру подмножеств Rn, порожденную всеми паралелепипедами вида x"=1[u;(i), ui+i(i)].В третьем параграфе второй главы доказана предельная теорема для предельного совместного распределения случайных величин Мп(Х) = max{Xi -f rriidn} и Мп>к{Х) = тах{Х* + т^п}.В частности, можно предполагать г{п) произвольной на "редких" множествах R С Z, таких что \{к : к G R, к = 1,..., n} | = 0(n/(L(n) Inn)) для любого L(n) Ч> оо при п Ч> оо.Все результаты, полученные для максимумов Мп, очевидным образом переносятся на минимумы, так как справедливо следующее соотношение: тп = min{Xi,...,Xn} = -max.{-Xi,...,-Xn}.Задача оценки функции распределения максимумов вАборок случайных последовательностей с псевдостационарным трендом играет важную роль при определении резервов, прогнозировании пиков потребления (например, потребления электроэнергии), в прогнозировании экстремальных погодных явлении (например, высоких температур) и др. К решению этих задач можно подходить как с позиции результатов классической теории экстремумов, так и с позиции результатов, являющихся расширением классической теории экстремумов, с учетом сезонности данных. Рассматриваемые данные обрабатываются с помощью этих двух подходов.В третьей главе при помощи методов стохастического моделирования, проведено сравнение классическим подхода (без учета тренда) оценки функции распределения максимума и подхода с учетом псевдостационарного тренда, основанного на результатах из главы 1. А именно, проведено сравнение качества подходов на примере смоделированных прореженных выборок из некоторых случайных последовательностей, каждый элемент которых представим в виде суммы стационарной последовательности {Xi,i = 1,2,...}, где Xi имеет функцию распределения F(x), которая максимум-устойчива, и добавочной псевдостационарной составляющей aДsin(27ri/3), где последовательность (ап) такая, что выпоняется (1.2). Рассмотрены случаи, когда элементы стационарной последовательности имеют гауссовское распределение, распределение Коши и равномерное на отрезке [0; 1] распределение, и в которых элементы стационарной последовательности являются независимыми случайными величинами, так и случаи, в которых элементы стационарной последовательности являются 2-зависимыми. Прореживание моделируется при помощи последовательности (Si): J 1, с вероятостью ^ ; 1 0, с вероятостью -^, {Si} - последовательность независимых случайных величин, не зависящих от {Xi, г = 1,2,...}.Пусть {Xi} удовлетворяет условиям основного результата главы 1.Применим этот результат к Мп(Х) = max{Xj + ansin(27ri/3); г G NД, 6{ = 1}.Во всех рассмотренных случаях видно, что функция распределения К\{х) приближает эмпирическую функцию распределения нормированных максимумов прореженной выборки лучше, чем функция распределения К2(х).В четвертой главе проведена обработка реальных данных о потреблении электроэнергии в России и температуре воздуха в Центральной Англии. Полученные результаты также сравнены с результатами, полученными с помощью классического подхода.В первом параграфе четвертой главы представлены результаты обработки реальных данных, представляющих собой выборку, состоящую из ежедневных максимумов температур воздуха в Центральной Англии, взятых за период с 1 января 1878 по 31 декабря 1998 года, для которых описана процедура построения функции распределения годовых максимумов температур в этом регионе на основании классической теории экстремальных значений, на основании результатов главы 1 и сравним каждую из полученных функций распределения с эмпирической функцией распределения.Во втором параграфе четвертой главы исследуются данные о почасовом потреблении электроэнергии в России за период с 7 июня 2005 года по 22 июля 2005 года. Визуальный анализ изменения потребления электроэнергии позволяет сделать вывод о периодичности потребления за сутки. Более того, можно увидеть, что имеется периодичность, связанная с днями недели, и годичная периодичность (однородность по сезонам). При поном исследовании экстремальных значений потребления необходимо учитывать и годичный тренд. Задача поного исследования в работе не ставится.В нашем случае, такой период взят как пример однородности по сезону. Были взяты только данные со вторника по четверг каждой недели, так как максимумы потребления в течение недели за рассматриваемый период достигаются только в эти дни и для этих дней наблюдается похожая структура потребления.Для обоих примеров данных схема оценки функции распределения максимумов на основе результатов главы 1 одна и та же: пусть (Yi) - это выборочные значения случайного ряда (Yi), представимого в виде суммы некоторой детерминированной периодической составляющей (pi) и стационарного временного ряда PQ), то есть: Yt = Xi+pi.Далее, положим, что детерминированная периодическая составляющая имеет период равный г.Пусть Xi = fi-pu 1<г<гК. Обозначим j-ът элемент первой и второй подпоследовательностей через Т*, Х^ (1 < j < (2s + l)K), соответственно, а j'-ый элемент (1 < j < 2s +1) третьей подпоследовательности - p*j .Возьмем максимум элементов на каждом интервале индексов \(т Ч l)(2s + l),m(2s + 1)], где т = 1,.., К для ряда (Y*) и ряда (Х^), получим: МХ,...,МК, М[,...,М'К. Схема оценки функции распределения максимумов на основе результатов классической теории экстремумов следующая: Возьмем вариационный ряд последовательности ( M j ) ^ : Мк,к < Мк^к < ... < Щк.Глава 2 О максимумах частичных выборок случайных последовательностей с псевдостационарным трендом.

Диссертация: заключение по теме "Математические и инструментальные методы экономики", Кудров, Александр Владимирович

В работе получены важные аппроксимации для функции распределения максимума стационарной случайной последовательности с добавленным псевдостационарным трендом: Х получена предельная теорема для совместного распределения мак симума отрезка стационарного временного ряда с добавленным малым псевдо-стационарным трендом и максимума но тому же отрезку, но с про пущенными наблюдениями. С этой целью введено понятие перемешивания высоких экстремумов при наличии тренда, обобщающее введенные ранее условия типа Лидбеттера.Ч с целью конкретизации условия перемешивания, рассмотрен слу чай гауссовского временного ряда. Оказалось, что если корреляционная функция г{п) исходного гауссовского стационарного ряда ведет убывает к нулю быстрее, чем 1/lnn, то предельный закон распределения макси мума совпадает с законом, полусенным в условиях перемешивания. Если же где г(п) убывает к нулю пропорционально 1/Inn, то предельный закон уже отличается, он основан не на пуассоновском распределении высоких экстремумов, а на смеси иуассоновских - на процессе Кокса. То есть, най ден пример временного ряда, не удовлетворяющего введенному условию перемешивания, для которого, тем не менее, получено предельное распре деление максимума.Эти аппроксимации позволяют оценивать высокопроцентные кван тили распределения и вероятности высоких максимумов с большой точ ностью.При помощи методов статистического моделирования проведено сравнение точности приближения распределения максимума, основанное на полученных в данной работе предельных теоремах и точности, осно ванной на классических приближениях, когда рассматриваются лишь се зонные максимумы. Поскольку в новых приближениях задействованы не только сезонные максимумы, но и близкие к ним другие значения времен ного ряда, новые приближения оказываются точнее.На основании полученных предельных теорем в диссертации раз работаны методы статистического оценивания распределения параметров максимума отрезка временного ряда в условии наличия пропущенных на блюдений и сезонной составляющей. Проведена сравнительная статисти 95 ческая обработка данных классическим и новым методом. Новый метод в данной модели дает безусловно лучшие результаты.

Диссертация: библиография по экономике, кандидат физико-математических наук , Кудров, Александр Владимирович, Москва

1. ГАЛАМБОШ Я. (1984). Асимптотическая теория экстремальныхпорядковых статистик. Изд. Наука, Главная редакция физикоматематической литературы.

2. КУДРОВ А. В. ( 2 0 0 8 А ) . О максимумах частичных выборок случайных последовательностей с псевдостационарным трендом. Стат. методы оценив, и проверки гипотез, межфакультетский сборник Перм.Гос.Унив. (в печати).

3. КУДРОВ А. В. (2008в). Оценка функции распределения максимумов выборок стационарных последовательностей с псевдостационарным трендом. Прикладная эконометрика,

4. КУЗНЕЦОВ Д. (2005). Предельные теоремы для максимума случайныхвеличин. Вестник МГУ, Сер. Матем. Механ., 3, 6-9.

5. Л И Д Б Е Т Т Е Р М., Л И Н Д Г Р Е Н Г., РОТСЕН X. (1989). Экстремумы случайных последовательностей и процессов. Изд. Мир.

6. МЕЙЗЛЕР Д.Г. (1950). О предельном распределении максимального члена вариационного ряда. ДАН УССР, 1, 1950, 3-10.

7. ОЛЬШАНСКИЙ К.А. (2004). Об экстремальном индексе прореженногопроцесса авторегрессии. Вестник МГУ, Сер. Матем. Механ., 3, 17 23.

8. ФАНТАЦЦИНИ Д. (2008). Управление операционным риском. Прикладнаяэконометрика,

9. ARTZNER P., DELBAEN F., E B E R J.M., HEATH D. (1999). Coherentmeasures of risk.Math. Finance, 9, 203-228.

10. BALKEMA A.A., DE HAAN L. (1974). Residual lifetime at great age. Ann.1. Probab., 2, 792-804.

11. BEIRLANT J., TEUGELS J.L.(1989). Asymptotic normality of Hill'sestimator. In: Lecture Notes in Statistics, 51, 148-155, eds. J. Husler and

13. BEIRLANT J., TEUGELS J.L., VYNCKIER P. (1996). Practical Analysis of

14. Extreme Values. Leuven University Press, Leuven.

15. BERMAN S. M. (1964). Limit theorems for the maximum term in stationarysequences. Ann. Math. Statist, 35, 2, 502-516.

16. BORKOVEC M. (2000). Extremal behavior of the autoregressive process with

17. ARCH(l) errors. Stoch. Proc. Appl, 85, 189-207.

18. CASTILLO E. (1988). Extreme Value Theory in Engineering. Academic Press,1. Boston.

19. CHRISTOPH G. AND W O L F W. (1992). Convergence Theorems with a Stable1.mit Law. Akademie Verlag. Berlin.

20. CLEVELAND W.S. (1993). Visualizing Data. Hobart Press, New Jersey.

21. COLES S. (2001). An Introduction to the Statistical Modeling of Extreme1. Values. Springer, London.

22. COLES S. G., J. A. TAWN (1996). A Bayesian analysis of extreme rainfalldata. Applied Statistics, 45, 463-478.

23. COHEN J. P. ( 1 9 8 2 A ) . The penultimate form of approximation to normalextremes. Adv. Appl. Prob., 14, 324-339.

24. COHEN J. P. ( 1 9 8 2 B ) . Convergence rates for the ultimate and penultimateapproximations in extreme value theory. Adv. Appl. Prob., 14, 833-854.

25. Cox D. R., D. V. HINKLEY (1974). Theoretical Statistics. London: Chapman& Hall.

26. CRAMER H. (1966). On the intersections between the trajectories of a normalstationary stochastic processes and a high level. Arkiv. Mat, 6, 337-349.

27. DAVIS R.A., RESNICK S. I. (1984). Tail estimates motivated by extremevalue theory. Ann. Statist, 13, 1050-1077.

28. DAVIS R.A., RESNICK S. I. (1989). Basic properties and prediction of max

29. ARMA processes. Ann. Appl. Probab., 21, 781-803.

30. DAVISON A. C , SMITH R. L. (1990). Models for exceedances over highthresholds (with discussion). J.R. Statist. Soc. B, 52, 393-442.

31. DAYKIN C D . , PENTIKAINEN Т., PESONEN M. (1994). Practical Risk Theoryfor Actuaries. Chapman & Hall, London

32. DEKKERS A.L.M., HAAN DE L. (1989). On the estimation of the extremevalue index and large quantile estimation. Ann. Statist, 17, 1795-1832.

33. EMBRECHTS P., KLUPPELBERG C , MIKOSCH T. (1997). Modelling

34. Extremal Events for Insurance and Finance. Springer, New York.

35. EMBRECHTS P. (ED . ) (2000) Extremes and Integrated Risk Management.

37. FALK M., HUSLER J. AND REISS R.-D. (1994). Laws of Small Numbers:

38. Extremes and Rare Events. DMVSeminar Bd 23. Birkhi'auser, Basel.

39. FISHER R. A., T I P P E T T L. H. C. (1928). Limiting forms of the frequencydistributions of the largest or smallest member of a sample. Proc. Camb. 1. Phil. Soc, 24, 180-190.

40. GAMERMAN D. (1997). Markov Chain Monte Carlo: Stochastic Simulationfor Bayesian Inference. Texts in Statistical Science, Chapman &; Hall/CRC 1. Press, Boca Raton.

41. GNEDENKO B. V. (1943). Sur la distribution limite du terme maximum d'unes'erie aleatoire. Ann. Math., 44, 423-453.

42. GRADY A. (2000). A Higher Order Expansion for the Joint Density of the

43. Sum and the Maximum with Applications to the Estimation of Climatological

44. Trends. Ph.D. dissertation, Department of Statistics, University of North1. Carolina, Chapel Hill.

45. GUMBEL E.J. (1958). Statistics of Extremes. Columbia Univ. Press, New1. York.

46. HAAN L. DE (1970). On Regular Variation and its Application to the Weak

47. Convergence of Sample Extremes. Math. Centre Tracts 32, Amsterdam.

48. HAAN L. DE, FERREIRA A. (2006). Extreme value theory. An introduction.

49. Springer Series in Operations Research and Financial Engineering. Springer.

50. HAAL P. (1982). On some simple estimates of an exponent of regularvariation. Journal of the Royal Statistical Society, B44, 37-42.

51. HALL P., P E N G L., YAO Q. (2002). Moving-maximum models for extremaof time series. Journal of Statistical Planning and Inference, 103, 51-63.

52. HAUSLER E., TEUGELS J.L. (1985). On the asymptotic normality of Hill'sestimator for the exponent or regular variation. Ann. Statist, 13, 743-756.

53. HILL B.M. (1975). A Simple General Approach to Inference about the Tailof a Distribution. Ann. Statist., 3, 1163-1174.

54. HsiNG T. (1991). On tail index estimation using dependent data. Ann.1. Statist, 19, 1547-1569.

55. HsiNG T. (1993). Extremal index estimation for a weakly dependentstationary sequence. Ann. Statist., 21, 2043-2071.

56. HSING Т., HUSLER J., LEADBETTER M.R. (1988). On the exceedance pointprocess for a stationary sequence. Probab. Theory Related Fields, 78, 97-112.

57. HOGG R.V., KLUGMAN S.A. (1984). Loss Distributions. Wiley, New York.

58. JENKINSON A. F. (1955). The frequency distribution of the annual maximum(or minimum) values of meteorological events. Quarterly Journal of the

59. Royal Meteorological Society, 81, 158-172.

60. JOHNSON N.L., KOTZ S. (1970). Distributions in Statistics: Continuous

61. Univariate Distributions-1, -2. Houghton Mifflin, Boston.

62. JOHNSON N.L., KOTZ S. (1972). Distributions in Statistics: Continuous

63. Multivariate Distributions. Wiley, New York.

64. JORION P. (2001). Value at Risk: The New Benchmark for Controlling Market

65. Risk, (first edition 1997). McGraw-Hill, New York.

66. KlNNlSON R.P. (1985). Applied Extreme Value Statistics. Battelle Press,1. Columbus.

67. KLUPPELBERG C. (2004). Risk management with extreme value theory. In

68. Extreme Values in Finance, Telecommunications, and the Environment,

69. Finkenstadt, B. and Rootzen, H., Eds., CRC/Chapman & Hall, Boca Raton.

70. KLUGMAN S.A., PANJER H.H., WILLMOT G.E. (1998). Loss Models, From

72. KOTZ S., NADARAJAH S. (2000) Extreme Value Distributions. Theory and

73. Applications. Imperial College Press, London.

74. KUDROV A.V., PlTERBARG V.I. (2007) On maxima of partial samples ingaussian sequences with pseudo-stationary trends. Liet. matem. rink., 47, 1, 1-10.

75. YNES R. M. (1965). Extreme values in uniformly mixing stationarystochastic processes. Ann. Math. Statist, 36, 993-999.

76. ADBETTER M. R. ( 1 9 8 3 A ) . Extremes and local dependence in stationarysequences. Z. Wahrsch. v. Geb., 65, 291-306.

77. ADBETTER M.R., LINGREN G., ROOTZEN H. (1983). Extreme and relatedproperties of random sequences and precesses. Springer Statistics Series.

78. Berlin-Heidelberg-New York:Springer.

79. MASSON D.M. (1982). Laws of large numbers for sums or extreme values. Ann.1. Prob, 10, 754-764.

80. MEDOVA E. (2000). Measuring risk by extreme values. Risk, November 2000,20-26.

81. MEERSCHAERT M.M., SCHEFFLER P. (2001). Limit Distributions for Sumsof Independent Random Variables: Heavy Tails in Theory and Practice. 1. Wiley, New York.

82. MlKOSCH Т., STARICA C. (2000). Is it really long memory we see in financialreturns? In: Embrechts, P. (Ed.) Extremes and Integrated Risk Management, p. 149-168. Risk Books, London.

83. MITTAL Y. (1978). Maxima of partial samples in Gaussian sequences, Annalsof Probability, 6, 3, 421-432.

84. MLADENOVIYC P., PITERBARG V.I. (2006). On asymptotic distribution ofmaxima of complete and incomplete samples from stationary sequences.

85. Stochastic Processes and their Applications, 116, 1977-1991.

86. MLADENOVIYC P., PITERBARG V.I. (2008). On estimation of the exponentof regular variation using a sample with missing observations. Statistics and probability letters, 78, 4, 327-335.

87. NANDAGOPALAN S. (1990). Multivariate extremes and the estimation of theextremal index. Ph.D. dissertation, Department of Statistics, University of

89. O'BRIEN G. L. (1987). Extreme values for stationary and Markov sequences.

91. PlCKANDS J. (1975). Statistical inference using extreme order statistics. Ann.1. Statist, 3, 119-131.

92. PITERBARG V.I. (1996). Asymptotic methods in the theory of Gaussianprocesses and fields. AMS, Providence, Rhode Island.

93. REISS R.-D. (1989). Approximate Distributions of Order Statistics. Springer,1. New York.

94. RESNICK S.I. (1987). Extreme Values, Regular Variation, and Point

96. ROBERT С P., CASELLA G. (2000). Monte Carlo Statistical Methods.

97. Springer Texts in Statistics, Springer Verlag, New York.

98. ROBINSON M. E., TAWN J. A. (1995). Statistics for exceptional athleticsrecords. Applied Statistics, 44> 499-511.

99. ROOTZEN H., KLUPPELBERG C. (1999). A single number can't hedge againsteconomic catastrophes. Ambio 28, 6, 550-555. Royal Swedish Academy of 1. Sciences.

100. ROSENBLATT M. (1956). A central limit theorem and a strong mixingcondition. Proc. Nat. Acad. Sci. U.S.A., 42, 43-47.

101. SERFLING R.J. (1980). Approximation Theorems of Mathematical Statistics.1. Wiley, New York.

102. SMITH R. L. (1986). Extreme value theory based on the r largest annualevents. J. Hydrology, 86, 27-43.

103. SMITH R. L. (1989). Extreme value analysis of environmental time series:

104. An application to trend detection in ground-level ozone (with discussion).

106. SMITH R. L. (1990). Extreme value theory. In Handbook of Applicable

107. Mathematics 7, edited by W. Ledermann. John Wiley, Chichester, 437-471.

108. SMITH R. L. (1997). Statistics for exceptional athletics records: Letter to theeditor. Applied Statistics, 46, 123-127.

109. SMITH R. L. AND GOODMAN, D. (2000). Bayesian risk analysis. Chapter 17of Extremes and Integrated Risk Management, edited by P. Embrechts. Risk 1. Books, London, 235-251.

110. SMITH R. L. (2004). Statistics of Extremes with applications inenvironment, insurance, and finance, in Extreme Values in Finance,

111. Telecommunications, and the Environment,Finkenstddt, B. and Rootzen, H.,

112. Eds., CRC/Chapman & Hall, Boca Raton.

113. SMITH R. L., WEISSMAN I. (1994). Estimating the extremal index, ournalof the Royal Statistical Society, Ser. B, 56, 512-528.

114. TAWN J. A. (1988). An extreme value theory model for dependentobservations. J. Hydrology, 101, 227-250.

115. WATSON G. S. (1954). Extreme values in samples from m-dependentstationary processes. Ann. Math. Statist, 25, 798-800.

116. WEISSMAN I. (1984). Statistical estimation in extreme value theory. In J.

117. Tiago de Oliveira (Ed.), Statistical Extremes and Applications, pp. 109-115.1. Dordrecht: Reidel.

Похожие диссертации