Концепция повышения эффективности статистического оценивания экономических показателей

Ерохов, Дмитрий Николаевич

Темы диссертаций по экономике » Математические и инструментальные методы экономики

Концепция повышения эффективности статистического оценивания экономических показателей тема диссертации по экономике, полный текст автореферата

Автореферат

Ученая степень	кандидат экономических наук
Автор	Ерохов, Дмитрий Николаевич
Место защиты	Москва
Год	2000
Шифр ВАК РФ	08.00.13

Автореферат диссертации по теме "Концепция повышения эффективности статистического оценивания экономических показателей"

МЕЖДУНАРОДНАЯ АКАДЕМИЯ ИНФОРМАТИЗАЦИИ в Генеральном Консультативном Статусе ООН и Всемирного Информациологического Парламента рр^ 0д

9 АПР 2000

На правах рукописи УДК 519.86

Ерохов Дмитрий Николаевич

Концепция повышения эффективности статистического оценивания экономических показателей

Специальность 08.00.13 - Математические и инструментальные

методы экономики

АВТОРЕФЕРАТ диссертации в виде научного доклада на соискание учёной степени кандидата экономических наук

Москва - 2000

Работа выпонена в Международной Академии ин форматизации

Официальные оппоненты:

доктор экономических наук, профессор, действительный член Международной Академии информатизации Дорофеев В. И.

кандидат технических наук, член-корреспондент Международной Академии информатизации Аванесян Г. Р.

Ведущая организация:

Московский институт информациологии

Защита состоится 15 декабря 2000 г. на заседании диссертационного совета МАИ по адресу Москва, ул. Антонова-Овсеенко, д. 13.

Диссертация в виде научного доклада разослана 15 ноября 2000 г.

Учёный секретарь диссертационного совета, канд. техн. наук Аванесян Г. Р.

Актуальность проблемы учёта случайных факторов

Исследование процессов, протекающих в экономических системах различной степени сложности, при сугубо теоретическом подходе, как правило, приводит к результатам, несколько отличающимся от реальных. Судить о наличии отклонений от истинных значений приходится не только после получения эмпирического материала, проявляющего характерные свойства, присущие наличию ошибок, но и в результате комплексного анализа факторов, влияющих на исследуемый процесс. В данном случае речь идёт о достаточно сложном механизме функционирования экономических систем, который крайне сложно описать аналитически в абсолютно точном виде. Объясняется это невозможностью учёта всего обилия цроцессообразующих факторов, во-первых, и, во-вторых, даже если бы все эти факторы и были известны, то достаточно сложно, а зачастую и просто невозможно, установить вид всех функциональных взаимосвязей между результатом и найденными формирующими воздействиями (переменными). Поэтому в реальных ситуациях исследователю приходится принимать во внимание лишь наиболее значимые для решения поставленной задачи аргументы и вынужденно упрощать математическую модель явления или системы до вида, либо заданного определёнными требованиями, например, особенностями ведения деятельности конкретного предприятия, либо доводить до вида, когда решить задачу аналитически становится реальным. В последнем случае, как правило, пытаются избавиться от громоздкого вида математических моделей и придти к форме, удобной для вычислений. Разумеется, что в подобных ситуациях, а это, строго говоря, все реальные ситуации, результат, по-

лученный в ходе вычислений, оказывается отличным от истинного. При этом большую роль играет то, как сильно отличается результат от истинного, и к каким последствиям может привести наличие составляющей в виде ошибки, в обстановке, когда возможные ошибки вообще не учитываются.

Невозможность учёта всех процессообразующих факторов, выраженных через соответствующие переменные, вынуждает исследователей не только в прикладных областях экономики, но и в теоретической её части, прибегать к введению в модели экономических процессов случайных составляющих. Таким образом, если результирующим признаком является у, то в общем случае приходится оперировать с функциональной зависимостью вида

у =/(х1,х2,...,хПге)

где Х],Х2,...,ХД - детерминированные переменные, формирующие искомый результат; е - случайная составляющая.

Следовательно, в качестве модели используется приближённое аналитическое выражение, в котором отклонение результата от истинного учитывается случайной переменной е. Именно переменная е в какой-то мере компенсирует наше незнание точного закона вычисления искомого признака у. Наличие случайных составляющих, доля которых может и дожна варьироваться в зависимости от конкретных условий, на наш взгляд, дожно являться характерной чертой современной экономической науки, стремящейся разработать эффективный инструмент управления хозяйственной деятельностью. В качестве подтверждения этой тенденции следует отметить передовые работы последнего десятилетия по синергетической экономике В. -Б. Занга, где особое внимание уделяется влиянию хаотичности на поведение экономических систем, работы по экономет-

рике Я. Р. Магнуса и др. Актуальности ради отметим, что В. -Б. Занг вообще в ряде случаев оперирует с таким понятием теории случайных процессов как шум, что демонстрирует явно некоррелированный характер случайных компонент и снижает степень детерминированности результатов. В то же время, с практической точки зрения, построение моделей, учитывающих стохастичность реальных процессов, даёт благоприятные результаты в таких важнейших направлениях как например, экономическое прогнозирование, вводя вероятностные параметры, характеризующие, в частности, степень риска принятия того или иного решения.

Конечно, не следовало бы ошибочно полагать, что можно упростить наше понимание неизвестного экономического механизма путём сокращения детерминированных составляющих, отдавая процесс на откуп стохастическим явлениям. Это крайность, которую следует избегать. Важнейшим условием моделирования в экономике является всесторонний анализ присутствующих факторов, определение их роли, их вклада в результат и, безусловно, установление вида их взаимосвязей. Необходимо стремиться к построению такой модели явления, в которой случайная составляющая не играла бы роль доминирующего фактора и не создавала бы общий случайный характер, поскольку в этом случае наша модель будет весьма далека от совершенства. В этой связи уместно было бы привести слова известного французского математика Пьера Симона Лапласа, который ещё в XIX веке писал:"...Простота законов движения небесных тел и соотношений между их массами и расстояниями позволяет проследить их движение до любой заданной точки... Это возможно благодаря точным инструментам, применяемым в астрономических наблюдениях, и небольшому числу соотношений, используемых в расчётах. Но при исследовании огромного большинства других явлений природы непоное знание причин, вызывающих явление, пре-

небрежение их сложностью, вкупе с погрешностями анализа, не позволяют нам достигать такой же определённости. Таким образом, существуют явления, для нас неопределённые, явления, более или менее вероятные, и мы ищем пути компенсации недостаточности нашего знания, вводя разные степени вероятности этих явлений".

Цель работы

Целью диссертации является вероятностный анализ отклонения оценочных значений экономических показателей от их истинных значений в результате воздействия факторов случайного характера.

Научная новизна диссертации

Научная новизна диссертации состоит в том, что предложены способы определения точности оценки как дискретных, так и непрерывных экономических показателен. При этом в качестве меры точности оценивания экономических данных введены понятия среднего риска и функции риска и получены соответствующие аналитические выражения.

Доказано, что для эффективного анализа ошибок в экономических данных, необходимо обладать априорной информацией о статистических свойствах исследуемых процессах.

Практическая ценность работы

Практическая значимость научных результатов, полученных в настоящей диссертации, главным образом состоит в возможности проводить расчёты степени риска принятия каких-либо решений, либо осуществления прогнозов и т.п. не качественно, а количественно. Таким образом, разработан инструмент, позволяющий в прикладной экономике повышать достоверность обработки статистических материалов.

Общая математическая характеристика экономических признаков

Анализ зависимых переменных у, являющихся результирующим экономическим признаком в той или иной модели, показал целесообразность их классификации по трём видам.

В первом случае >> является дискретной величиной, принимающей лишь одно из значений >7, уь ут, где /и -конечное число. Например, объём продукции, выражаемый в количестве законченных изделий, представляет собой величину дискретную.

Ко второму виду отнесём у как непрерывную величину, постоянную в течение всего интервала времени Т исследования, но принимающую любое значение в некоторых пределах

уШп< У < УДах

Ещё один вид у это непрерывная функция от некоторого аргумента, например, от времени ^ у =у(0.

В первом и во втором случаях экономический признак можно считать случайной величиной, а в третьем случае - случайной функцией. Причём для всех случаев зададимся некоторым априорным распределением Р(у), полученным на основании предшествующего опыта или теоретических предположений. При этом для каждого из вышеприведённых случаев можно задать условие нормировки.

Для дискретной случайной величины у условие нормировки выглядит так

X ]=1,2,...,тп

где Р(у) - распределение вероятностей значенийу^ у2,..., ут-

Для непрерывной случайной величины у с плотностью вероятности Р(у) условие нормировки имеет вид

P<y)dy = l.

Для случайной функции у, которую в частном случае можно считать непрерывной функцией от t со спектром, ограниченным верхней частотой /в, запишем п -мерную плотность вероятности

Р(у) = P&i у* Уп)

причём yj =y0'At) - значение функции^ в момент tj = jA t. Значение интервала, определяющего периодичность отсчётов A t, выбирают, исходя из ширины спектра исследуемой функции и, согласно известной в математике теореме, определим как At =fe/2.

В указанном случае условие нормировки имеет вид

J ХХХ i P(yi,...,yn)dyj...dyД = 1,

где интегрирование производится в области всевозможных значений переменных у.

Отметим, что в том случае, если функция Р(у) априори неизвестна, то можно допускать равномерный характер распределения, положив Р(у) - const, и упростить таким образом ход исследований.

Точность оценки дискретных случайных экономических показателей

Рассмотрим дискретные случайные показатели, получаемые от одного источника либо в различное время, либо, находясь в разных условиях. При этом в качестве источника экономических данных может выступать как сугубо математическая модель, так и данные, полученные путём конкретных реальных измерений. Будем считать, что значения исследуемых случайных величин статистически независимы. Тогда поной характеристикой точности оценки единичных экономических показателей будет матрица условных вероятностей ошибок вида

Рц...Ры Р23...Р2

Рт1 Рт2 РтЗ ХХХ Ртт-1

В приведённой матрице Ру = Р( уу), / - вероятность получения значения у, при условии, что истинное значение данного экономического показателя равно у,. При этом несложно догадаться, что вероятности безошибочного получения информации соответствует элемент Рц, который по определению в матрице отсутствует. В целом же количество элементов матрицы зависит от т, т. е. от количества возможных значений исследуемой случайной величины. Поскольку данная случайная величина является дискретной, то, следовательно, легко наложить ограничения

на число её значений. Таким образом, число элементов матрицы определим из простого выражения

М=т2 -т = т(т-1),

откуда следует, что для исчерпывающего построения картины ошибок необходимо иметь т(т-1) условных вероятностей ошибок вида Р(уД у}).

Учитывая, что необходимое количество значений условных вероятностей ошибок Рц находится в квадратичной зависимости от т, проводить практические расчёты при больших т, пользуясь матрицей вероятностей, громоздко и трудоёмко. Поэтому введём для общих случаев некоторую результирующую функцию Л, представляющую собой взвешенную сумму условных вероятностей ошибок Ру.

счР(у$ Р(у,\ я), и = 1.....т, (1)

где весовые коэффициенты

Су = 0 при / = 7 и с,у > 0 при I * у.

Назовём величину Я средним риском, являющуюся своего рода усреднённой характеристикой степени риска получения ошибочного результата.

В качестве весов при условных вероятностях ошибок Р(у\ у/), как это видно из выражения для Я, выбирают произведения априорных вероятностей Р(у) на весовые коэффициенты Су, учитывающие относительную опасность ошибок того или иного вида. Причём если степень опасности всех ошибок одинакова, то

Су = 0 при / - ] И Су =1 при / & /

и тогда весовые коэффициенты в формуле для вычисления среднего риска при г Ф у можно опустить:

Я = Р(у)Р(уШ

Можно привести несложный пример для случая, когда т = 2. Такие ситуации в экономике возможны, когда дискретная случайная величина принимает всего два значения, и каждое из них например, характеризует одно из двух состояний оборудования или принятие и непринятие какого-либо решения. В таких примерах средний риск вычисляют по формуле

Я = Р(у0 Р(у2\у0+ Р(ут) Р(у,| Уд-

Выражение для вычисления среднего риска Я, при г & у есть не что иное, как формула вычисления поной вероятности ошибки Рош получения данных. Следовательно, можно утверждать, что если ошибки имеют равный вес, то средний риск равен поной вероятности ошибок. Такое утверждение может быть введено и на основе умышленного допущения, что все ошибки равноценны ,например, в ситуациях, когда их влияние на конкретную экономическую обстановку не изучено и, соответственно, ошибкам не удаётся присвоить вес. В таком случае приходится считать, что все ошибки одинаково опасны.

Не вдаваясь в подробности преобразований, покажем также, что выражение для Р^ (т. е. для среднего риска Я при / * /) можно записать в виде

Рош = 1-Х i Р&/) Р(у}\у/) = 1 - Рпрае, 0' = 1,-,т)

Где Рправ ~Е у Р(у^ Р(У]\ У])- поная вероятность правильного получения искомых значений.

Из вышеприведённых соотношений следует, что для вычисления поной вероятности ошибки Рош необходимо знать вероятность Р(ут. е. необходимо обладать априорной информацией о распределении ошибок ( искомых значений). Если же условные вероятности правильного получения значений у Р(уД уоказываются одинаковыми для всех значений дискретной случайной величины у или, другими словами, не зависят от номера _/, то вероятность ошибки Рош не будет зависеть от априорного распределения

тВ том случае, когда все значения дискретной величины у равновероятны, т. е.

РМ = 1/т, то

Д = Рош = 1 - (1/т)Е у Р(у3\ Уд 0 = 1,...,т)

Как видно из рассуждений настоящего параграфа, оценить точность получения значений искомого экономического показателя можно, пользуясь такой вероятностной мерой как средний риск К. Причём характер производимых в этом случае оценочных расчётов в немалой степени зависит от наличия у исследователя априорной информации о статистических свойствах появляющихся ошибок, а, следовательно, и о факторах, влияющих на общий экономический механизм и не поддающихся детерминированному описанию.

Точность оценки непрерывных случайных экономических показателей

Положим, что истинное значение экономического показателя у, тогда результат его оценки обозначим как у*. Следовательно, под ошибкой оценки будем подразумевать

Ау =у* -у

Если считать, что значения у, полученные в различных опытах, статистически независимы, то будет справедливо условие нормировки

где Р(у)- одномерная плотность вероятности, являющаяся априорной характеристикой искомых показателей.

По аналогии с вышеприведённым случаем дискретных оценок введём средний риск Я, выражаемый следующей формулой

К = П Цу, у*)Р(у)Р(у*\у) у с/у* (2)

где 1(у, у*) - функция риска, удовлетворяющая условию

1(у, у*)=0 при у*=у; 1(у, у*)>0 приу*у;

Р(у*\у) - условная плотность вероятности, т. е. плотность вероятности получения значения у* при условии, что истинное значение равно у.

Средний риск Я, определяемый из (2), несложно выразить через математическое ожидание функции риска

1(у,у*У.

Я=М[1(у,у*)].

Функция риска 1(у, у*) может задаваться в различном виде. Рассмотрим функцию 1, представляющую собой квадрат разности

Несложно видеть, что в представленном виде функция риска демонстрирует как возрастает риск с увеличением отклонения у* от истинного значения показателя^. Если подставить введённое выражение для 1(у, у*) в (2), то получим соотношение, позволяющее вычислить средний риск

я= Ц (У-У*)2Р(У)Р(У*\У)<Ь<Ъ>* (V

Я=М[(у-у*)2]

Из последней формулы следует, что в нашем частном случае средний риск равен среднему квадрату ошибки получения экономического признака^.

Разумеется, что вычисления среднего риска по формулам (2) и (3) требуется знание априорного распределения шачений у Р(у), что не всегда удаётся получить. В частности, если нет подобного опыта исследований, экономисту-аналитику приходится работать в условиях с обеднённой априорной информацией, что, как правило, снижает точность вычислений. В таких ситуациях приходится вместо среднего риска Я оперировать некоторым условным риском Яу, определяемым для каждого значения у:

Яу= _( 1(у, у*)Р(у*\у) У*

Цля введённой ранее квадратичной функции риска получим

КУ=1 (У-У*)Р(У*\У)<*У*

Кроме среднего риска Л на практике полезно применять и другие вероятностные характеристики, в частности, математическое ожидание и дисперсию. Действительно, ошибка А у является случайной величиной, для которой несложно путём интегрирования определить математическое ожидание

М[Ау]=\\ (у- У*)Р(У)Р(У*\У) Ф У* В свою очередь, выражение для дисперсии запишем в виде Э[Ау] = М[(Ау-М[Ау])2] = М[(Ах)2] - (М[Ах])2.

Если математическое ожидание М[А у]-0, то имеем несмещённую ошибку, дисперсия которой определяется достаточно просто: В [А у] = М[(Ау)2].

При неизвестном априорном распределении Р(у), подобно тому, как это делалось доя вычисления среднего риска Л, приходится оперировать с условными характеристиками - с условным математическим ожиданием ошибки

Му[Ау] = / (у-у*)Р(у* | у)4у*

и с условной дисперсией ошибки

Пу[Ау] = Му[(Ау)2] - (Му[Ау])2.

Точность оценки экономических показателей - непрерывных функций

В случае экономических данных, представляющих собой непрерывные функции от какого-либо аргумента, чаще от времени /, покажем истинное значение, оценку и ошибку соответственно в виде функций от времени С.

У =У(0> У* ~У*(0 и Лу=Лу(0.

При этом каждая из представленных функций является случайной функцией, для которой могут быть вычислены вероятностные параметры. Это позволяет для анализа точности оценки непрерывных показателей без особого труда использовать комплекс статистических характеристик:

- математическое ожидание ошибки М[Л у(0]\

- средний квадрат ошибки М[(Ау(0)2];

- дисперсию ошибки

М[(Ау(0 - М[Ау(1)]2)] = М[(Ау(0)2] - (М[Ау(0])2;

- математическое ожидание интегральной квадратичной оценки

- средний риск Я.

Вычислим далее средний риск Я, для чего зададимся ограничением спектрального характера в виде наивысшей частоты /в, т. е. будем полагать, что процесс ур) не содержит в себе составляющие выше /в. Такое ограничение позволяет представить функцию у(0 в виде многомерного вектора, задаваемого отсчётами функции у(1):

У^&1,У2,-,Уь-,Уп). где у,=у(гД I), г = 1,2,...,п; =/в/2.

Периодичность взятия отсчётов, как видим, определяется верхней граничной частотой /в. Следовательно, при заданной длительности процесса у(() количество отсчётов, необходимых для векторного представления у(0, будет зависеть от спектральных свойств процесса. Как это несложно понять, чем шире оказывается частотный спектр исследуемого процесса, тем больше отсчётов приходится брать для дискретного представления функции у($ в виде многомерного вектора. Добавим также, что наивысшая частота/в в спектре функции уО) позволяет судить о скоростных характеристиках протекаемого экономического явления.

Вернёмся далее к среднему риску. Аналогично вышеприведённому вектору покажем и вектор оценок:

У*=6/1*У2*,::У1*~,Уп*). где у1*=у*№ 0, / = 1,2.....п Л ( =/в/2.

В соответствии с (2), как это уже делалось для непрерывных значений экономических показателей, получим

Я = М[1(у,у*)] = [} 1(У, у*)Р(у)Р(у*\у) & Ф*.

или, в развёрнутом виде,

Я = / ... 11((у,,...,уп), (У1*,...,Уп*)) Р(У1.-.Уп)Х

х Р(у1*,...,уД*\у1,...,угд (1у1... фпс1у}*... уД*.

Как видим, последнее выражение достаточно громоздко, так как является 2я-мерным интегралом при п 1. По этой причине вычисление среднего риска в подобных ситуациях

на практике вызывает сложности и требует больших вычислительных затрат, что не всегда оправдано - часто для эценки экономической обстановки и построения реальных прогнозов опытному исследователю достаточно вычислить гакие параметры, как математическое ожидание ошибки и [щсперсию ошибки, о чём уже упоминалось ранее.

Необходимо отметить, что важным этапом работ по статистической обработке экономической информации является оценка того, являются ли процессы стационарными я эргодичными или нет. Удовлетворение требованиям стационарности и эргодичности позволяет упрощать процедуру анализа, так как не следует учитывать сдвиг процессов во зремени, можно работать без относительной временной 1ривязки и, кроме того, появляется теоретически обосно-занная возможность замены усреднения по ансамблю реа-тизаций на усреднение по времени.

Некоторые замечания по поводу суммирования ошибок

Несмотря на то, что в предыдущих частях работы мы не рассматривали источники ошибок, а также полагали, что речь идёт о некотором случайном факторе е, следует всё же кратко остановиться на вопросе о структуре ошибок.

Строго говоря, под случайным фактором е следует рассматривать результирующую ошибку, вызванную различными источниками. Характер взаимодействия источников ошибок между собой настолько оказывается сложным, чТо говорить о точной функциональной связи результирующей ошибки с отдельными ошибками не приходится. Поэтому можно попытаться лишь дать приближённую оценку результирующей ошибки, вызванной совокупным действием ряда источников.

Результирующую ошибку Аур представим в виде

Аур=ЪАуь (1=1,2,...М)

где Ду/ - ошибка, создаваемая г- источником; N - общее число источников.

Полагая, что величины Ау, статистически независимы, т. е. источники ошибок не влияют друг на друга, покажем математическое ожидание результирующей ошибки так:

М[Аур] = ЪМ[АУ1] 0=1,2,

Соответственно дисперсия результирующей ошибки будет равна сумме дисперсий её составляющих:

0[АУр] = ЪО[Ау,] 0=1,2,....Ы) Средний квадрат результирующей ошибки:

М[(^ур)2]=(ЪМ[Ау,])2 +

В силу принятого ранее допущения, что источники ошибок взаимонезависимы, можно утверждать, что результирующая ошибка подчиняется нормальному закону распределения. При этом дожно быть достаточно большое число слагаемых, а дисперсия каждого слагаемого дожна быть много меньше суммы.

Свяжем далее вероятности появления ошибок отдельных и результирующих для случая дискретных экономических показателей. Для этого покажем, что достоверность получения этих данных характеризуется поной вероятностью ошибки Рош. Воздействие /-го источника приводит к появлению вероятности (Рош )и следовательно, вероятность правильного получения данных от 1-го источника ошибок:

(Рпр)1~1 - (Рош),

При воздействии же N источников ошибок вероятность правильного получения данных определится так

Рпр = ЩРпрЬ ИЛИ 1-Рош- ГЪ {1 - (Рош) д. Следовательно,

Рош = 1- 1Ъ(/- (Рош)().

Полученное выражение связывает поную вероятность ошибки Рош С частными вероятностями ошибок (Рош)и вызванными отдельными источниками и не взаимодействующими друг с другом, т. е. также, как и в предыдущем случае, здесь полагается, что ошибки статистически независимы.

Заключение

Экономические системы, являясь, с точки зрения обобщённого системного подхода, очень сложными системами, не могут быть однозначно описаны путём использования (разработки) какой-то одной, пусть даже достаточно совершенной модели. Сложность внутренних взаимосвязей и масса факторов как эндогенной, так и экзогенной природы, не позволяют описать экономический процесс сугубо детерминировано. По этой причине наличием случайных составляющих пренебрегать было бы некорректно, а, следовательно, их надо учитывать. Разумеется, что учёт присутствия случайных компонент, их влияние на конечный результат следует проводить исключительно методами статистического анализа. Однако какими бы совершенными они не были, а также несмотря на репрезентативность выборок, эффективность статистического анализа зависит от того, насколько известна исследователю доля возможных оши-эок. Без количественного анализа степени возможного риска получения ошибочных результатов ценность статистической обработки экономических данных остаётся невы-;окой. По этой причине экономисту-прикладнику в арсенал ;воих инструментов следует ввести приёмы, позволяющие уценивать этот риск, вычислять на уровне вероятностных ларактеристик степень получения искажённых данных или, ; другой стороны, оценивать с определённой вероятностью 1стинность полученных данных.

Публикации

1. Ерохов Д. Н. Валютные системы. - В сб.: Реформь в России и проблемы управления. Материалы научной кон ференции молодых ученых и студентов ГАУ. - М.: ГАУ 1997 г., вып. 4, с. 171 - 174.

Концепция повышения эффективности статистического оценивания экономических показателей тема диссертации по экономике, полный текст автореферата

Автореферат

Автореферат диссертации по теме "Концепция повышения эффективности статистического оценивания экономических показателей"

Похожие диссертации