Экономическое прогнозирование с помощью нейронных сетей: в случае ежедневного оборота акций IBM

Хальберт Уайт

Перевод с английского: Столяр А.И.


Источник: Источник: Департамент Экономики Калифорнийский университет, Сан-Диего, 2000.
http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?tp=&arnumber=23959&isnumber=907


АННОТАЦИЯ

Данный документ предоставляет отчет о некоторых результатах действующего проекта, используя моделирование нейросетей и изучая методы исследования и распознание нелинейных закономерностей движения цен на активы. В данной работе мы акцентируем внимание на случае обычного ежедневного оборота акций IBM. Приходится иметь дело с немыми свойствами экономических данных, которые выдвигают на передний план роль статистической гипотезы и необходимыми изменениями, чтобы стандартизировать изучение методов, которые могут быть полезными в других сферах.

I. ВВЕДЕНИЕ

Значение методов моделирования нейросетей при выполнении распознавания сложных образов и задач нелинейного прогнозирования в данный момент демонстрируется в огромном диапазоне применений. Учитывая такой успех, совершенно естественно спросить, могут ли такие методы быть полезными в получении нелинейных закономерностей из экономического временного ряда. Не удивительно, что наибольший интерес вызывает возможность распознавание раннее незамеченных закономерностей в движении цен на активы, таких как ежеминутные или ежедневные колебания обычной цены на акции. Такие закономерности, если их обнаружить, могут быть ключом к огромному богатству.

Вопреки оптимистической надежде, что методы нейросети могут открыть тайну торговли на фондовой бирже, есть пессимистическая общепринятая мудрость (по крайней мере, среди ученых) о «гипотезах эффективных рынков». В простейшем случае, данная гипотеза утверждает, что цены на активы следуют случайному порядку. Именно это, в отличие от возможной постоянной ожидаемой прибыли (лишенный риска доход плюс премия за удержание рискованных активов), движение цены активов абсолютно не зависит (непредсказуемо) от общедоступной информации, такой как цена и значение истории самого актива либо других активов. (К сведению, предсказуемость благодаря недоступной обществу (внутренней) информации не учитываем.) Обоснование отсутствия прогнозирования сродни причине, почему так мало стодолларовых банкнот лежит на земле. Не считая факта, что их не так часто бросают, они имеют тенденцию быть найденными очень быстро. То же самое касается и возможных перспектив прибыли на бирже активов: они используются так быстро, как только появляются. В случае уверенного ожидания повышения цены, участники рынка продолжают (покупают) поднимать цену к их ожидаемому уровню, таким образом, уничтожают возможность прибыли, которая существовала всего одно мгновения назад. Исходные человеческие и финансовые ресурсы обращены к попытке обнаружить и эксплуатировать такие возможности, гипотеза эффективного рынка действительно привлекательна. Также она являет собой один из немногих хорошо документированных успехов ученых в современной теории экономики. Множество исследований нашли незначительное свидетельство против простой гипотезы эффективности рынка, которое просто описывает, хотя смешанные результаты были получены благодаря использованию некоторых более тонких методов.

Не смотря на преимущество простой гипотезы эффективности рынка, это все еще только теория, а всякая теория может быть опровергнута соответствующим доказательством. Возможно, что технологии, способные найти такие доказательства, еще не были применены. Более того, теория практически смягчена ограниченными рациональными аргументами. Такие суждения утверждают, что люди по своей сути ограничены в своих возможностях обрабатывать информацию, так что их эффективность может удерживаться только в рамках восприятия информации человеком. Если новые технологии (такие как методы нейросетей) вдруг станут доступными для обработки имеющейся в наличии информации, тогда возможности прибыли для владельца могут возрасти. Технологии фактически разрешают создание форм внутренней информации. Однако, гипотеза эффективного рынка означает, что как только новые технологии станут общедоступными, эти преимущества потеряют значение (очень быстро) и в конечном счете исчезнут.

В виду относительной новизны методов нейросетей и учета ограниченной рациональности, это, по меньшей мере, потенциальные предварительно необнаруженные закономерности существуют в данных о ценах на активы, и такие закономерности, возможно, все еще сохраняются. Целью данного документа является иллюстрация того, как исследование с помощью методов неросетей таких закономерностей могут развиваться, используя случай ежедневного оборота акций IBM как пример. Необходимость иметь дело с немыми свойствами экономического временного ряда, которая выдвигает на передний план роль методов статистического умозаключения и также требует изменения методов изучения нейронных сетей, которые могут быть полезными в общем смысле.

II. ДАННЫЕ, МОДЕЛИ, МЕТОДЫ И РЕЗУЛЬТАТЫ

Интересующий нас результат в данной работе – rt, - скорость однодневного оборота обычной акции IBM за день t, за данными Центра Исследования Курса Ценных Бумаг ("CRSP данные"). Оборот за один день определяется как r(t) = (p(t)-p(t-1)+d1) / p(t -1), где p – заключительная цена в день t и d - дивиденды, оплаченные в день t. Однодневный оборот r также устанавливает разделения пая. Среди доступных 5000 дней оборотных данных мы выбираем выборку из 1000 дней с целью тренировки, вместе с 500 днями до и после тренировочного периода, что мы используем для оценки любых знаний, приобретенных нашей сетью. Тренировочная выборка покрывает дни торговли на протяжении периода с 1974:II до 1978:I. Период обучения покрывает с 1972:II по 1974:I и с 1978:II по 1980:I.

Заявлено официально, что простая гипотеза эффективного рынка утверждает, что E(r(t) I I(t-1)) = r', где E(r(t) I I(t-1)) – обозначает условный ожидаемый результат r(t), данная публично доступная информация во время t-1, (формально I(t-1) поле v, сгенерировано доступной информацией), и r' – константа (которая может быть неизвестной), включающая в себя лишенную риска прибыль плюс премию за риск. Так как I(t-1) включает в себя предыдущую историю цен IBM, сила простой гипотезы эффективных рынков заключается в том, что эта история бесполезна в прогнозировании r(t).

В экономической литературе стандартный путь тестирования формы гипотезы эффективных рынков начинается как вложение ее в качестве специального случая в линейную авторегрессивную модель оборота активов для формы r(t)=w0+w1 r(t-1)+…+wр r(t-р)+e(t), t=1,2,… где w=(w0, w1,…,wр) ' – неизвестный вектор весов, р – положительное целое число, определяющее порядок авторегрессии, и e(t) – стохастическая ошибка, предполагаемая быть такой, что E(e(t) I I(t-1))=0.

Гипотеза эффективных рынков заключает в себе ограничение w1=…=wр=0. Таким образом любое эмпирическое доказательство, что w1не =0 или w2не =0… или wрне=0, это доказательство против гипотезы эффективных рынков. С другой стороны, эмпирическое утверждение, что w1=…=wр=0, если не опровергает гипотезу эффективных рынков, но и не подтверждает ее; множество реализаций определения нелинейных процессов с любой нелинейной структурой, которая сейчас хорошо известна (на пример, Сакаи и Токумару (1980); смотрите также Эккманн и Руле (1985)). Обнаружили, что w1=…=wр=0 – совместимо с гипотезой эффективных рынков или наличием линейно неопределенных нелинейных закономерностей.

Эквивалентный результат простой гипотезы эффективных рынков, который будет главным образом интересовать нас здесь, это var r(t)=var e(t), где var означает дисперсию переменной, определенной случайным образом. Эквивалентно R^2=1-var r(t)/var e(t)=0 простой гипотезе эффективных рынков. Таким образом, эмпирическое доказательство, что R^2не=0 – доказательство против простой гипотезы эффективных рынков, пока эмпирическое утверждение R^2=0 совместимо с гипотезой эффективных рынков или существующей нелинейной структурой.

Таким образом, как первый шаг, мы исследуем эмпирическое утверждение против простой гипотезы эффективных рынков, используя линейную модель, описанную ранее. Линейная авторегрессивная модель порядка р (AR(p)-модель) соответствует двум очень простым слоям сети с прогнозированием. Исходные данные: r(t-1),…, r(t-p), выходные данные сети поданы как r(t)=w0+w1 r(t-1)+…+wр r(t-р), где w0, w1,…,wр – веса сети, подобранные для удобной процедуры обучения. Наш интерес связан с эмпирической оценкой R^2, вычисленным стандартным путем как: R^2=1- var e(t)/var r(t)=0, n – число тренировочных результатов. Тут n=1000.

Когда ОНК применяется к линейной сети с p=5, мы получаем R^2=0.0079. По структуре R^2 должно лежать между нулем и единицей. Это факт, что R^2 так мало предлагает опровержений простой гипотезе эффективных рынков. Фактически, под некоторыми статистическими закономерными состояниями nR^2 распределены приблизительно как , где w1=…=wр=0. В нашем случае, nR^2= 7.9, так что мы имеем опровержение этому выражению w1=…=wр=0 менее, чем 10ти %ого уровня, которое принадлежит обычно к статистически значительному уровню. График r(t) также показывает виртуальное отсутствие какой бы то ни было связи r(t) и r(t).

Таким образом, стандартный метод дает стандартные заключения, хотя нелинейные закономерности не исключаются. Расследуя возможность, что нейросети могут определять нелинейные закономерности, что противоречит простой гипотезе эффективных рынков, мы обучили 3хслойную прогнозирующую сеть с пятью одинаковыми входами и пятью скрытыми узлами за один и тот же тренировочный период. Выбор пяти скрытых узлов не полностью случайный, так как это представляет собой компромисс между обязательным включением достаточного количества скрытых узлов таким образом, что, по меньшей мере, простые нелинейные закономерности могут быть определены сетью, и необходимостью избегать включения большого количества скрытых узлов, чтобы сеть была способна «запомнить» всю тренировочную последовательность. На наш взгляд, это последнее требование очень важно, если одно желание получить сеть, надеясь, что она могла бы адекватно делала выводы об окружающей среде, в которой выходные данные не то же самое, что и входная функция, но представляла бы случайные варианты некоторого среднего значения, полученного от входа.

III. ЗАКЛЮЧИТЕЛЬНЫЕ КОММЕНТАРИИ

Не смотря на то, что некоторые, должно быть, разочарованы провалом простой сети, призванной найти опровержение простой гипотезы эффективных рынков, данное обучение предлагает некоторые стоящие изречения:

  1. нахождение доказательств против эффективных рынков с помощью подобных простых сетей дело непростое;
  2. даже простые сети способны на ошибочный подбор ряда цен на активы с таким большим количеством наблюдений 1000;
  3. с другой стороны, такая простая сеть способна на очень разнообразное динамическое поведение, как показано на графике r(t)

Данное обучение дает практические выгоды в повышении развития эффективных вычислительных методов для достижения разумных сетей (Уайт 1988). Также важную роль играют статистические выводы в развитии представления моделей нейросетей, и, фактически, наводят на мысль о некоторых новых интересных статистических проблемах (нахождение распределения nR^2). Решение последних проблем даст статистический метод для выбора включения или исключения добавочных скрытых узлов в исходной сети.

Конечно, обзор нынешних упражнений очень ограничен; на самом деле, первоначально это планировалось как механизм представления значительных доходов в отношении несложных установок, и для иллюстрации важных методов. Расширять границы исследования опровержений гипотезы эффективных рынков – задача первой важности. Это может быть выполнено путем разработки сети, позволяющей дополнительные входы (на пример, объем, другие цены на акции и объем, ведущий указатель, данные макроэкономики и т.д.) и установлением рекуррентной связи, о которой говорил Джордан (1980). Любая из этих разработок должна быть поддержана огромным вливанием данных для тренировочного периода: чем больше связей, тем больше опасность ошибки. Также может быть полезно понимание, увеличенное разрешением дополнительных выходов, на пример, обороты через несколько разных диапазонов (2 дня, 3 дня и т.д.) или цены на другие активы через несколько разных диапазонов, так же хорошо, как при использовании в пределах более чем между данными дня.

Другое важное ограничение данного обучения это то, что методы оптимизации использовались тут исключительно локально. Хотя конечные значения весов были определены как, предоставляющие лучшее значение в ряде разных начальных значений наших итераций, нет гарантии, что глобальный максимум был найден. Глобальный метод оптимизации, такой как моделирование нормализации либо генетический алгоритм – более предпочтительны.

И, наконец, очень важно отметь, что пока метод наименьших квадратов адекватен для тестирования гипотезы эффективных рынков, необязательно использовать только этот метод, если интересуешься построением сети для целей рыночной торговли. Такие сети нужно развивать и обучать, используя доход и потери в долларах в подобных торгах, не возводить в квадрат ошибки прогнозирования. Обучающие методы для этого критерия развиваются автором.

Литература

  1. Baillie, R.T. 11986): "Econometric Tests of Rationality and Market Efficiency," Michigan State University Department of Economics Working Paper.
  2. Davies, R.B. [1997]: "Hypothesis Testing When a Nuisance Parameter is Present Only Under the Alternative," Biometrika 64, 247-54.
  3. Davies, R.B. [1997]: "Hypothesis Testing When a Nuisance Parameter is Present Only Under the Alternative," Biometrika 74, 33-43.