Банковское дело / Доходы и расходы / Лизинг / Финансовая статистика / Финансовый анализ / Финансовый менеджмент / Финансы / Финансы и кредит / Финансы предприятий / Шпаргалки Главная Финансы Финансы
Д.Э. БЭСТЕНС, В.М. ВАН ДЕН БЕРГ, Д. ВУД. Нейронные сети и финансовые рынки: принятие решений в торговых операциях. - Москва: ТВП,1997. - хх, 236 с., 1997

Очистка и преобразование базы данных

Стоит начать с того, чтобы изобразить распределение переменной с помощью гистограммы или же рассчитать для него характеристики асимметрии (симметричность распределения) и эксцесса (весомости лхвостов распределения). В результате будет получена информация о том, насколько распределение данных близко к нормальному. Многие методы моделирования, в том числе, - нейронные сети, дают лучшие результаты на нормализованных данных. Далее, с помощью специальных статистических тестов, например, на расстояние Махаланобиса, можно выявить многомерные выбросы, с которыми затем нужно разобраться на предмет достоверности соот-ветствующих данных. Эти выбросы могут порождаться ошибочными данными или крайними значениями, вследствие чего структура связей между переменными может (а может и не) нарушаться (см. [19]). В некоторых приложениях выбросы могут нести положительную информацию, и их не следует автоматически отбрасывать.
Предварительное, до подачи на вход сети, преобразование данных с помощью стандартных статистических приемов может существенно улучшить как параметры обучения (длительность, сложность), так и работу системы. Например, если входной ряд имеет отчетливый экспоненциальный вид, то после его логарифмирования получится более простой ряд, и если в нем имеются сложные зависимости высоких порядков, обнаружить их теперь будет гораздо легче. Очень часто ненормально распределенные данные предварительно подвергают нелинейному преобразованию: исходный ряд значений переменной преобразуется некоторой функцией, и ряд, полученный на выходе, принимается за новую входную переменную. Типичные способы преобразования - возведение в степень, извлечение корня, взятие обратных величин, экспонент или логарифмов (см. [250]). Нужно проявить осторожность в отношении функций, которые определены не" всюду (например, логарифм отрицательных чисел не определен). После этого могут быть применены дополнительные преобразования для изменения формы кривой регрессии. Часто это на порядок уменьшает требования к обучению [284], [251].
Для того чтобы улучшить информационную структуру данных, могут оказаться полезными определенные комбинации переменных - произведения, частные и т.д. Например, когда вы пытаетесь предсказать изменения цен акций по данным о позициях на рынке опционов, отношение числа опционов пут (put options, т.е. опционов на продажу) к числу опционов колл (call options, т.е. опционов на покупку) более информативно, чем оба этих показателя в отдельности. К тому же, с помощью таких промежуточных комбинаций часто можно получить более простую модель, что особенно важно, когда число степеней свободы ограниченно.
Наконец, для некоторых функций преобразования, реализованных в выходном узле, возникают проблемы с масштабированием. Сигмоид определен на отрезке [0,1], поэтому выходную переменную нужно масштабировать так, чтобы она принимала значения в этом интервале. Известно несколько способов масштабирования: сдвиг на константу, пропорциональное изменение значений с новым минимумом и максимумом, центрирование путем вычитания среднего значения, приведение стандартного отклонения к единице, стандартизация (два последних действия вместе). Имеет смысл сделать так, чтобы значения всех входных и выходных величин в сети всегда лежали, например, в интервале [0,1] (или [-1,1]), - тогда можно будет без риска использовать любые функции преобразования.
Еще одна важная проблема (которая одновременно является основным преимуществом нейронно-сетевых методов) - способность работать с данными качественного характера. Отношения эквивалентности или порядка нужно суметь записать для входа (или выхода) сети. Это можно сделать, вводя искусственные переменные, принимающие значения 1 или 0. Одна прикладная задача с качественными данными рассмотрена в гл. 8.
<< Предыдушая Следующая >>
= К содержанию =
Похожие документы: "Очистка и преобразование базы данных"
  1. ГЛОССАРИЙ
    очистка, высокие требования к соответствию импортируемых товаров национальным техническим и санитарным стандартам, внутренние сборы и налоги на импортные товары, жесткое антидемпинговое законодательство и т.п.) Радикальные системные реформы (лшоковая терапия) - решительные, широкие и быстрые системные преобразования в рамках односек- торного пути трансформации Разведанные запасы полезных
  2. Словарь
    очистку товара. Цена базисная - цена для определения сорта или качества товара, согласованная сторонами в сделке купли-продажи и являющаяся исходной для определения окончательной цены фактически поставляемого товара. При поставке товара, показатели качества которого отличаются от положенных в основу базисной цены, предусматриваются надбавки и скидки в заранее обусловленном размере в зависимости
  3. 1.1. Развитие отечественного предпринимательства
    преобразованию предметов труда и управлению этим процессом; предпринимательский же доход рассматривался как часть прибавочной стоимости, а деятельность, направленная на получение предпринимательского дохода, - как форма эксплуатации рабочего класса. Во-вторых, обобществление производства трактовалось, в основном, как его огосударствление, национализация частного имущества, превращение народного
  4. ГОСУДАРСТВЕННОЕ РЕГУЛИРОВАНИЕ РАЗВИТИЯ МАТЕРИАЛЬНОГО ПРОИЗВОДСТВА
    очистка от загрязнения территории, на которой проводи лись работы по соглашению. Право пользования участком недр на основе соглашения о раз деле продукции предоставляется только путем лицензирования. Лицензия выдается инвестору органом исполнительной власти соответствующего субъекта РФ и федеральным органом управле ния государственным фондом недр или его территориальным под разделением. Лицензия
  5. 6.2. Сущность, функции и виды прибыли, ее планирование распре-деление и использование. Рентабельность предприятия.
    очистке сточных вод, платежи за предельно допустимые выбросы (сбросы) загрязняющих веществ в природную среду и другие аналогичные расходы. В расходы налогоплательщика на оплату труда включаются лю бые начисления работникам в денежной и (или) натуральной формах, стимулирующие начисления и надбавки, компенсационные начисления, связанные с режимом работы или условиями труда, премии и единовре
  6. 7.2. ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И РАЗВИТИЕ ЛОГИСТИКИ В ДЕЯТЕЛЬНОСТИ ЗАРУБЕЖНЫХ КОМПАНИЙ
    преобразований служила все возрастающая конкуренция, вместе с которой менялись требования к принципам планирования. Программы класса планирования производственных ресурсов позволяли оптимально загружать производственные мощности и при этом закупать именно столько материалов и сырья, сколько необходимо для выполнения текущего плана заказов, и именно столько, сколько возможно обработать за
  7. 1.5. АВТОМАТИЗИРОВАННОЕ РАБОЧЕЕ МЕСТО - СРЕДСТВО АВТОМАТИЗАЦИИ РАБОТЫ КОНЕЧНОГО ПОЛЬЗОВАТЕЛЯ
    преобразованию информации. Создание АРМ на базе персональных компьютеров обеспечивает: Х простоту, удобство и дружественность по отношению к пользователю; Х простоту адаптации к конкретным функциям пользователя; Х компактность размещения и невысокие требования к условиям эксплуатации; Х высокую надежность и живучесть; Х сравнительно простую организацию технического обслуживания.
  8. 2.1. СТРУКТУРНАЯ И ФУНКЦИОНАЛЬНАЯ ОРГАНИЗАЦИЯ АИС И АИТ
    преобразованию, обработке, хранению, поиску и выдаче. Эти действия обеспечивают нормальное протекание информационного процесса и входят в технологию управления. Они реализуются технологическими процессами обработки данных с использованием электронных вычислительных машин и других технических средств. Применение технических средств для получения информации в ходе наблюдения за деятельностью
  9. 4.7. СИСТЕМЫ УПРАВЛЕНИЯ БАЗАМИ ДАННЫХ
    очистки файла от данных, перезаписи файлов и так далее. Средства СУБД также позволяют организовать систему паролей для защиты от несанкционированного доступа к данным базы. Наиболее известной среди СУБД является система dBASE, кроме нее существуют FoxBase, FoxPro, Paradox, SQL, R:base, Clipper, Oracle и др. СУБД предполагает работу пользователя с базой данных в разных режимах: Х режим
  10. 4.8. ТЕХНОЛОГИЯ ИСПОЛЬЗОВАНИЯ ЭКСПЕРТНЫХ СИСТЕМ
    базы знаний), структурированных в целях формализации процесса принятия решений. Экспертные системы разрабатываются с расчетом на обучение и способны обосновать логику выбора решения, т.е. обладают свойствами адаптивности и ее аргументирования. У большинства экспертных систем имеется механизм объяснения. Этот механизм использует знания, необходимые для объяснения того, каким образом система