Банковское дело / Доходы и расходы / Лизинг / Финансовая статистика / Финансовый анализ / Финансовый менеджмент / Финансы / Финансы и кредит / Финансы предприятий / Шпаргалки Главная Финансы Финансы
Д.Э. БЭСТЕНС, В.М. ВАН ДЕН БЕРГ, Д. ВУД. Нейронные сети и финансовые рынки: принятие решений в торговых операциях. - Москва: ТВП,1997. - хх, 236 с., 1997 | |
ВКЛАД КАЖДОЙ ИЗ ПЕРЕМЕННЫХ ПО ОТДЕЛЬНОСТИ |
|
Структура сети отражается в весах, которые имеют связи, идущие от входных переменных к выходным. Тем самым, величина веса говорит о степени важности данной переменной. Однако до сих пор не разработано никакого систематического способа количественной оценки вклада отдельного веса в выход сети, аналогичного, например, доверительным интервалам в регрессионном анализе. Мы предлагаем анализировать вклады отдельных весов в конечный результат с помощью эвристических методов.
PEl PE2 PEOUT
BIAS -0.76 -0.34 -0.63
CAL 1.26 0.11 0.85
ANNUAL -1.24 -0.30 0.15
SEA 0.01 -0.31 0.42
DAY 0.76 -0.28 0.73
CON -1.03 -0.11 -0.76
AIBOR -0.39 -0.30 -0.29
CYC -0.27 -0.39 0.08
TEM 0.36 0.04 0.35
RAIN -0.44 -0.11 -0.30
PE1 -1.56
PE2 0.09
Таблица 4.3. Матрица весов для 9-2-1 сети Анализ одного отдельно взятого веса не выявляет существа дела, поскольку при этом не учитывается пороговый уровень. Далее, большой вес не обязательно приводит к насыщению сигмоида, так как соответствующие значения входа могут быть очень маленькими. Из матрицы весов 9-2-1 модели с непосредственными связями между входами и выходами видно, что связь между вторым скрытым нейроном (РЕ2) и выходным элементом (PEOUT) имеет очень малый вес. Однако 9-1-1 сеть уже не способна давать выход того же качества (в смысле коэффициента ARV). Связи, ведущие от потребления, числа рабочих дней и календарных эффектов к первому скрытому элементу, имеют большие веса (соответственно, -1.03, 0.76 и 1.26). Отрицательные веса непосредственных соединений процентной ставки и дождя с выходным элементом (PEOUT) представляются правдоподобными, тогда как влияние потребления на результат неожиданно происходит с обратным знаком. Правительственный прогноз (ANNUAL) имеет ожидаемый знак в прямой связи с выходом, хотя по результатам регрессии можно было предположить, что абсолютная величина веса будет гораздо больше. Связь со скрытыми элементами имеет отрицательный знак, но, поскольку связь РЕ1 с PEOUT также отрицательна, итоговое косвенное влияние этой переменной вполне может оказаться положи-тельным. Рассмотрение отдельных весов вне связи с другими весами ничего не прибавляет к нашему пониманию того, какой в целом вклад вносит в конечный результат та или иная переменная. Различные наборы входных значений будут по-разному преобразовываться системой весов, поэтому при анализе необходимо учитывать и сами входные значения. Далее мы рассмотрим два эвристических способа такого анализа. Прежде всего мы измеряем чувствительность решения к изменениям значения одной входной переменной. Здесь пока каждая переменная учитывается изолированно. Для того чтобы учесть их возможное взаимодействие, мы во втором методе, независимо друг от друга, оцениваем уровни активации всех скрытых элементов. Наблюдения, принадлежащие одному кластеру, дают сходные результаты. При подходе, основанном на оценке чувствительности, измеряется вклад переменных в величину остатка для каждого наблюдения. Вся процедура происходит так: Все значения одной входной переменной х заменяются на ее безусловное математическое ожидание (т.е. среднее значение). Выход сети перевычисляется для сокращенной матрицы входов и при той же матрице весов. Абсолютный остаток полученного выхода сравнивается с абсолютным остатком выхода, полученного на исходной входной матрице, а именно: Вклад уагх= | (Цел.перем. - Прогноз нов )/(Цел.перем - Прогноз исходн )|. Если величина этого отношения меньше единицы, то это значит, что исходный остаток больше, чем повторно вычисленный, и переменная влияет на результат с отрицательным знаком. Наоборот, если дробь больше единицы, то эта переменная способствует уменьшению остатка, и ее вклад в искомое решение положителен. Значение дроби около 1 (например, в интервале [0.75,1.25]) соответствует нейтральному вкладу. Проделать все перечисленные выше действия для всех других пе-ременных. В табл. 4.4 представлена статистика по видам влияния переменных на результат, полученная на материале обучающего множества. Из нее видно, что наибольшее влияние на прогноз оказывают годовой прогноз правительства, число рабочих дней и календарные эффекты. САЬ АКЫИАЬ БЕА БАУ СОК АГВОЯ СУС ТЕМ ЯАВД Положительное 17 29 16 19 15 7 15 14 И Нейтральное 16 5 20 13 22 33 20 19 32 Отрицательное 12 11 9 13 8 5 10 12 2 Таблица 4.4. Влияние отдельных переменных (по видам) Хотя в целом переменные RAIN и AIBOR ведут себя индифферентно, обращают на себя внимание случаи, когда их вклад положителен (таких, соответственно, 11 и 7). Эти случаи заслуживают дальнейшего исследования. С другой стороны, годовой прогноз, который по результатам регрессии играет значительную роль, в 11 случаях неожиданно дает отрицательный вклад. Можно сделать вывод о том, что здесь желателен дальнейший анализ, который включал бы в себя выявление различных типов входных конфигураций и формирование на их базе архетипов. Разработка такой типологии может привести к выводу правил, с помощью которых MoF сможет более точно предсказывать уровень валовых налоговых поступлений. Подход, основанный на исследовании архетипов, соответствующих кластерам похожих наблюдений, обладает тем достоинством, что он является многомерным, и в этом состоит его отличие от анализа весов и влияний. Горман и Сейновски [127] предложили способ кластеризации наблюдений с помощью весовой матрицы, зависящей от весов соединений, идущих от входных элементов к исследуемому i-му скрытому элементу. Для к-то наблюдения метрический вектор, ИЛИ вектор весов-состояния, Q имеет ВИД Qyl)[i] = [Wijp'p], где р - выход j-го входного элемента. Затем для каждой пары векторов весов- состояния вычисляется евклидово расстояние между ними, и все они записываются в матрицу расстояний. На последнем этапе к этой матрице применяется метод иерархической кластеризации. Наблюдения с близкими векторами весов-состояния образуют кластер. Усредняя все наблюдения, принадлежащие одному кластеру, получаем центроид этого кластера. Все центроиды могут быть упорядочены по уровню выходного сигнала или по уровню активации нужного скрытого элемента. Вся процедура проделывается независимо для каждого скрытого элемента. В нашем случае конфигурация сети имеет два скрытых элемента, так что описанный шаг повторяется дважды. Особенно важны значения тех центроидов, которые наиболее сильно активируют данный элемент. Поскольку вес связи, идущей от второго скрытого элемента (РЕ2) к выходному (PEOUT), очень мал (0.09), с учетом того факта, что элемент РЕ1 не всегда насыщается (уровень активации меняется в интервале [0.01,0.77]), мы при дальнейшем анализе элемент РЕ2 из рассмотрения исключим. Подход, основанный на рассмотрении векторов весов-состояний, хорошо подходит для сетей такой архитектуры, где имеется только один скрытый слой и нет непосредственных связей между входом и выходом. Поскольку конфигурация нашей сети не удовлетворяет второму требованию, подход был несколько видоизменен. СЕ\'Т1ЮЮ САЬ АШиА. ЯЕА ОАУ СОК АВСЖ СУС ТЕМ ЯАГЫ АСТУАТСЖ С6(4)* 0.00 0.64 0.41 0,55 0.72 0.40 0.61 0.60 0.48 0.01 С5(9) 0.43 0.73 0.56 0.67 0.74 0.37 0.61 0.49 0.33 0.04 С8(1) 1.00 0.78 0.00 0.80 1.00 0.42 0.68 0.39 0.49 0.07 С3(б) 0.00 0.09 0.37 0.47 0.36 0.42 0.42 0.58 0.40 0.10 С7(7) 0.92 0.68 0.52 0.57 0.55 0.37 0.68 0.68 0.28 0.18 С4(1) 0.73 0.17 0.13 0.00 0.04 0.85 0.84 0.49 0.31 0.22 С2(10) 0.43 0.07 0.53 0.66 0.35 0.24 0.37 0.58 0.39 0.35 С1(7) 1.00 0.10 0.68 0.80 0.26 0.25 0.50 0.62 0.23 0.77 *в скобках указано число наблюдений Таблица 4.5. Значения центроидов (промасштабированные) и соответствующие значения активации (упорядо-чен) По результатам кластерного анализа в обучающем множестве было выделено 8 кластеров. Были вычислены центроиды, затем они были упорядочены по возрастанию величины активации. Две пары кластеров (6&5 и 2&1), составляющих вместе 30 наблюдений, относятся, соответственно, к очень низким и очень высоким выходным значениям первого скрытого элемента. Далее, наблюдения выявили для кластеров групп 5 и 6 высокие, а для кластеров 1 и 2 - низкие реальные значения целевой переменной. Нетрудно определить причинные факторы, вызывающие такие значения активации. Для каждой пары кластеров мы нарисовали (в промасштабированном виде) значения девяти входных переменных. В обеих парах значения переменных для обоих центроидов давали примерно одну и ту же картину. Рис. 4.3. Значения центроидов для кластеров 1 и 2, дающих большие значения активации скрытого элемента РЕ1 Рис. 4.4. Значения центроидов для кластеров 5 и 6, дающих низкие значения активации скрытого элемента РЕГ Низкие значения годового прогноза и потребления подавляют выходной сигнал скрытого элемента. В то же время, большие значе-ния календарного эффекта, числа рабочих дней и температуры стимулируют выходной сигнал элемента РЕ1, идущий к элементу РЕОиТ. Заметьте, что группы наблюдений, образующие кластеры 5 и 6, соответствуют низкому целевому показателю. Помимо сигналов, приходящих от элементов РЕ1 и РЕ2, выходной элемент принимает также 9 сигналов, идущих непосредственно от входных элементов. Как неявно заметили Горман и Сейновски, эти сигналы тоже могут быть разбиты на кластеры и упорядочены по уровню активации выходного элемента. В результате такого анализа количество кластеров может оказаться другим, причем в один кластер, вообще говоря, будут входить элементы разных групп. Поэтому определить суммарный эффект, который оказывают выходные сигналы скрытых и входных элементов, будет довольно трудно. Чтобы упростить задачу, мы для каждого из восьми кластеров вы-числили усредненный входной вектор, и вместо исходной базы данных взяли эти усредненные векторы. Затем были получены и рассортированы соответствующие уровни активации выходного элемента. Теперь усредненные входные векторы кластеров 5 и 6 порождают очень высокие значения активации элемента РЕ017Г (0.993 и 0.996), а усредненные векторы кластеров 1 и 2 дают наименьшие значения активации (0.48 и 0.77). По-видимому, такое изменение порядка говорит о том, что прямые связи (квазилинейные функции) систематически порождают завышенную оценку целевой переменной (RECEIPTS), а соединения, идущие через узел РЕ1, уменьшают этот порог. Теперь, соединяя вместе анализ матрицы весов, учет положительных и отрицательных влияний и выходных значений кластеров, мы в состоянии оценить значимость вклада каждой из переменных. В случае, если разные подходы приведут к разным выводам, следует, скорее, доверять результатам кластерного анализа в силу его многомерной природы. Календарные эффекты (VI) и число рабочих дней (V4) сильно влияют на выход сети, что подтверждается большими значениями весов их прямых соединений с выходом (0.85 и 0.73), а также кластерным анализом их соединений, проходящих через РЕ1 (центроиды 1 и 2). Поскольку эти кластеры объединяют наблюдения с низким действительным поступлением налогов, можно считать, что эти две переменные вызывают уменьшение выхода. На интуитивном уровне это понятно: возможности отсрочки платежей отрицательно сказываются на поступлении налогов. Аналогично, опосредованное влияние температуры (V12) на целевую переменную отрицательно, хотя ее суммарный вклад в выходной сигнал остается неясным. Годовой прогноз правительства (V2) влияет на выход резко положительно - все варианты анализа показывают, что высокие значения целевой переменной приходятся на высокие значения переменной V2. Но, поскольку точного совпадения в значениях этих двух переменных нет, MoF не может с абсолютной уверенностью положиться на правительственный прогноз при управлении своими активами. Здесь также играет роль то, каким образом MoF раскладывает годовой прогноз по месяцам. Далее, кластерный анализ выявляет положительную связь между потреблением (V5) и выходным значением. Большой отрицательный (-0.76) вес прямой связи невозможно объяснить экономическими соображениями, а общий результат двух влияний может указывать на нейтральность действия этой переменной. Сезонность, по-видимому, влияет на выход линейно (вес = 0.42) с небольшими побочными эффектами. Ее общий вклад примерно в 50% случаев положителен. Но эта переменная не может быть однозначно связана только с большими либо только с малыми выходными значениями. Цикличность (VII) имеет слабое прямое влияние (вес 0.08) и слабое побочное действие. Роль остальных переменных - AIBOR (V6) и дождя (VI3) - с трудом поддается интерпретации. Их окончательное влияние нейтрально, и остается неясным, каким образом опосредованные связи компенсируют довольно большие отрицательные веса прямых связей (-0.29 и -0.3). |
|
<< Предыдушая | Следующая >> |
= К содержанию = | |
Похожие документы: "ВКЛАД КАЖДОЙ ИЗ ПЕРЕМЕННЫХ ПО ОТДЕЛЬНОСТИ" |
|
|