ДонНТУ  |  Портал магистров
русский   english  

Автореферат

"Преимущества модели ARIMA для краткосрочного прогнозирования поведения ценовых графиков Forex".

   Введение

Рынок FOREX (FOReign EXchange market) – межбанковский рынок обмена одних валют на другие, сформировавшийся в 1971 году, когда международная торговля перешла от фиксированных курсов валют к плавающим. Рынок представляет собой совокупность сделок агентов валютного рынка по обмену оговоренных сумм денежной единицы одной страны на валюту другой по согласованному курсу на определенную дату. Контракты на рынке FOREX заключаются, главным образом, с целью игры на разности валютных курсов. При обмене курс одной валюты относительно другой определяется очень просто: спросом и предложением – обмен, на который согласны обе стороны.

Главная особенность валютного рынка Forex, привлекающая к нему мелких игроков, – это возможность купли и продажи иностранных валют при отсутствии у трейдера всей суммы, необходимой для совершения сделки. Брокеры, предоставляющие услуги маржинальной торговли, требуют внесения залогового депозита и дают возможность клиенту совершать операции купли-продажи валют на суммы, в 40 – 50, иногда в 100 раз большие, чем внесенный депозит. Риск потерь возлагается на клиента, депозит страхует брокера.

Доходность инвестирования на этом рынке зависит от изменения котировок валют. Валютный рынок Forex привлекает инвесторов быстротой совершения сделки и дополнительным банковским сервисом – кредитованием сделок с кредитным плечом от 1:1 до 1:1000.

Двигателем валютного рынка Forex является перемещение капитала между государствами, экономические показатели ведущих стран мира, политические, психологические факторы, а также технический анализ.

Основными валютами, используемыми для торговли на рынке Forex, являются:

  • евро (EUR),
  • японская иена (JPY),
  • фунт стерлингов (GBP),
  • швейцарский франк (CHF).
Все валюты торгуются по отношению к американскому доллару (USD).

   Актуальность темы

Разрабатываемая тема является достаточно актуальной, т.к объемы операций мирового валютного рынка постоянно растут, что связано с развитием международной торговли и отменой валютных ограничений во многих странах. Кроме того, в настоящее время, когда Украина готовится к вступлению в ВТО, биржевая торговля становится для нашей страны весьма распространенным и перспективным видом деятельности, что обуславливает необходимость проведения исследований в области прогнозирования поведения ценовых биржевых графиков. Эти исследования помогут строить точные прогнозы применяя, согласно рекомендациям, ту или иную модель класса ARIMA.

Выбрав правильную стратегию поведения, трейдер, при относительно небольшом депозите (как упоминалось выше), может получить большую прибыль в течение короткого периода времени. Для выбора правильной стратегии поведения, трейдеру необходимо произвести статистический анализ имеющихся ценовых графиков, выполнить краткосрочный прогноз поведения ценовых графиков на ближайших барах и определить, не произойдет ли разворот рынка на ближайших барах. Т.к. ценовые графики в реальности являются нестационарными процессами, то необходимо создание такой модели, которая будет адекватна постоянно меняющейся рыночной ситуации.

В данной работе в качестве прогнозной модели выбрана регрессионная модель ARIMA. ARIMA-процессы – это класс стохастических процессов, используемых для анализа временных рядов. Модели позволяют получать точные прогнозы, опираясь только на информацию, содержащуюся в предыстории прогнозируемых рядов ценовых графиков. Эти модели относятся к классу линейных моделей и могут хорошо описывать как стационарные, так и нестационарные временные ряды. Кроме того, если анализировать научные публикации последнего десятилетия можно видеть, что в подавляющем количестве работ по прогнозированию классическими методами используется именно ARIMA, как наиболее обоснованный и надежный алгоритм (из статистических).


    Цель и задачи работы

Целью данной работы является определение лучшей модели из множества моделей ARIMA для построения краткосрочного прогноза поведения ценовых графиков для разных значений временного окна прогнозирования, также определение наиболее подходящей модели для осуществления прогноза на определенных участках ценового графика. Таким образом, цель данной работы – выбор прогнозной модели ARIMA в зависимости от величины временного окна осуществления прогноза и используемого критерия, формулировка качественных рекомендаций по выбору и использованию модели на основе количественных оценок.

Схематическое описание выполнения прогноза поведения ценовых графиков с помощью моделей ARIMA с разными наборами параметров. (Анимация содержит 12 кадров, выполняется 10 циклов повторений)
Рис.1 - Схематическое описание выполнения прогноза поведения ценовых графиков с помощью моделей ARIMA с разными наборами параметров. (Анимация содержит 12 кадров, выполняется 10 циклов повторений)

Прогнозирование с помощью моделей ARIMA успешно осуществляется уже достаточно длительное время, но новизна данной работы состоит в проведении комплексного анализа преимуществ и недостатков использования конкретной модели из класса ARIMA в зависимости от сложившейся рыночной ситуации. Для этого в работе проводится прогнозирование с помощью различных моделей ARIMA (моделей с различными наборами параметров). Последовательность действий следующая: идентифицировать модель, т.е. определить количество параметров различного типа, которые присутствуют в модели, оценить параметры модели, исследовать адекватность модели и на основе модели построить прогноз, затем определить лучшую прогнозную модель.


    Методология прогнозирования Бокса-Дженкинса

Модели ARIMA опираются, в основном, на автокорреляционную структуру данных. В методологии ARIMA не предусматривается какой-либо четкой модели для прогнозирования данного временного ряда. Задается лишь общий класс моделей, которые описывают временной ряд и, которые позволяют как-то выражать текущее значение переменной через ее предыдущие значения. Потом алгоритм, подставляя внутренние параметры, сам избирает наиболее пригодную модель прогнозирования. Существует целая иерархия моделей Бокса-Дженкинса. Логично ее можно определить так:

AR(p)+MA(q) → ARMA(p,q) → ARMA(p,q)(P,Q) → ARIMA(p,q,r)(P,Q,R) → ...

Методология прогнозирования Бокса-Дженкинса отличается от большинства методов, потому что в ней не допускается какой-либо особенной структуры данных часовых рядов, для которых выполняется прогноз. В ней используется итеративный подход к определению допустимой модели среди общего класса моделей. Потом выбранная модель сопоставляется с историческими данными, для того чтобы проверить точно ли она описывает ряды. Модель считается приемлемой, если остатки, в основном, малые, распределенные случайно, и не содержат полезной информации. Если заданная модель не удовлетворительна, процесс повторяется, но уже с использованием новой улучшившей модели. Подобная итерационная процедура повторяется до тех пор, пока не будет найденной удовлетворительной модели. Из этого момента заданная модель может использоваться для целей прогнозирования. На рисунке иллюстрируется стратегия выбора модели согласно метода Бокса-Дженкинса.

Блок-схема стратегии выбора модели согласно методу Бокса-Дженкинса
Рис.2 - Блок-схема стратегии выбора модели согласно методу Бокса-Дженкинса


    Модель ARIMA

Внутренняя структура динамического ряда, зависимость уровня yt от предыдущих его значений yt-1, yt-2, ... , yt-p описывается авторегрессионной функцией:

где р – порядок авторегрессии;

ap – коэффициент авторегрессии.

Процесс авторегрессии порядка р функционально связан с автокорреляционной функцией

где p = 1,2,...m – лаг автокорреляции (сдвигание yt на p значений назад);

r0 = 1
Согласно с этим соотношением единственный коэффициент авторегрессии первого порядка равняется коэффициенту автокорреляции первого порядка, то есть a1 = r1. Для авторегрессии второго порядка имеем систему уравнений

Отсюда .

Следовательно, коэффициент авторегрессии, как и коэффициент автокорреляции, изменяются в границах
от –1 до +1.

При моделировании нестационарных по своей природе экономических процессов, авторегрессионная функция объединяется с другими методами анализа динамики: скользящей средней, трендом, сезонной волной. Объединение разных моделей в единственное целое существенно расширяет сферу их использования. Кроме того, Объединенные модели формируются на основе одних и тех же статистических характеристик – автокорреляционных функций, разрабатывается один алгоритм расчета параметров модели и определения прогнозов.

В модели ARIMA уровень динамического ряда yt определяется как взвешенная сумма предыдущих его значений и значений остатков et – текущих и предыдущих. Она объединяет модель авторегрессии порядка р и модель скользящей средней остатков порядка q. Тренд включается в ARIMA с помощью оператора конечных разностей ряда yt. Для фильтрации линейного тренда используют разницы первого порядка, для фильтрации параболического тренда – разницы второго порядка и т.д. Разница d должна быть стационарной.

Вид модели ARIMA, адекватность ее реальному процессу и прогнозные свойства зависят от порядка авторегрессии р и порядка скользящей средней q. Через то ключевым моментом моделирования считается процедура идентификации – обоснования вида модели. В стандартной методике ARIMA идентификация сводится к визуальному анализу автокоррелограмм и основывается на принципе экономии, по которому ( p + q ) <= 2.

Модель ARIMA порядка (р,d,q) достаточно гибкая и описывает широкий спектр несезонных процессов. При наличии сезонных колебаний в модели учитывается их периодичность с лагом s (для квартальных данных s = 4, для помесячных s = 12), и аналогичного смысла параметрами (P,D,Q)s. Порядок мультипликативной модели ARIMA составляет .

Самые простые виды моделей ARIMA:

  • (1,0,0) – авторегрессионная функция;
  • (0,1,0) – скользящая средняя;
  • (1,0,1) – комбинированная модель авторегрессии и скользящей средней;
  • (0,1,1) – экспоненциальная средняя;
  • (1,1,1) – нестационарный процесс с линейным трендом;
  • (0,1,1)×(0,1,1) – мультипликативная модель сезонного процесса.

Сезонные данные имеют четкую структуру, которая повторяется каждый год. В месячных данных с годовой сезонной структурой значения для тех же месяцев в разные годы должны коррелировать между собой, т.е коррелировать между собой должны не только отдельные наблюдения в течение одного и того же года, но и наблюдения с периодом, кратным целому году. Коэффициенты автокорреляции и частичной автокорреляции подобных данных будут ненулевыми при небольших интервалах опоздания (внутренние взаимосвязи). Интерпретация коэффициентов автокорреляции и частичной автокорреляции при сезонных интервалах будет такой же, как и для коэффициентов автокорреляции и частичной автокорреляции при малых интервалах.

Сезонные модели ARIMA включают в себя обычные авторегрессионные члены и члены скользящего среднего, которые отвечают за корреляции при низких интервалах, а также авторегрессионные члены и члены скользящего среднего, которые отвечают за автокорреляции и частичные автокорреляции при сезонных интервалах. В случае нестационарных сезонных рядов для достижения полноты описания часто необходимо дополнительно учесть в модели сезонные разницы.


    Критерии выбора модели

Модели ARIMA устанавливаются (выбираются) путем анализа исследуемого ряда и сравнения структуры его функций выборочной автокорреляции и частичной автокорреляции с известной теоретической структурой процессов ARIMA. Однако этой процедуре присуща определенная доля субъективизма и возможно, что две (или более) моделей будут достаточно точно отвечать имеющейся структуре функций выборочной автокорреляции и частичной автокорреляции. Более того, после оценки и проверки может оказаться, что обе модели вполне адекватно описывают данные. Если модели содержат одинаковое количество параметров, тогда преимущество следует отдать модели с наименьшей среднеквадратичной ошибкой s2. Если количество параметров в моделях разное, то по принципу экономии рекомендуется более простая модель. Однако модели с большим количеством параметров могут иметь существенно меньшую среднеквадратичную ошибку.

Учитывая все вышесказанное, было разработано несколько подходов к выбору модели, которые учитывают как качества модели, так и количество ее параметров. Информационный критерий Akaike или AIC [2], позволяет выбрать наилучшую модель из группы моделей-претендентов. Согласно этому критерию, выбирается модель, которая минимизирует выражение

,

где
– остаточная сумма квадратов, деленная на количество наблюдений;
n – количество наблюдений;
r – общее количество слагаемых (включительно с постоянным слагаемым) в модели ARIMA.

Согласно с Байесовским информационным критерием или ВIС [2], выбирается та модель, которая минимизирует следующее выражение

Второе слагаемое в формулах АІС и ВIС – это "штрафной фактор", который учитывает привлечение к модели дополнительных параметров. Критерий ВIС налагает более ограничений на количество параметров сравнительно с критерием АІС. Потому минимизация критерия ВIС при выборе модели всегда дает количество параметров, не превышающее количество, установленное согласно с критерием АІС. Часто оба критерия дают одинаковый результат.
Критерии АІС и ВIС следует рассматривать как дополнительные процедуры, призванные помочь при окончательном выборе модели. Они не в состоянии полностью заменить внимательное изучение поведения выборочных коэффициентов автокорреляции и частичной автокорреляции.

В работе модель, позволяющая осуществить наиболее качественный прогноз, определяется с помощью двух критериев. Критериями выбора лучшей модели являются следующие: максимизация значения вероятности осуществления правильного (адекватного) прогноза, которое вычисляется для каждой из моделей ARIMA с различным набором параметров отдельно для осуществляемого прогноза с разными значениями временного окна ( m1 = 15 и m2 = 30 ), и минимизация средней квадратичной ошибки.

Значение вероятности рассчитывается следующим образом:

,

где
ki – количество случаев, когда полученное прогнозное значение отклоняется от реального не более чем на ± 2 σ,
n – общее число прогнозных значений.

После вычисления всех значений , находится максимальное из них () и именно модель с iым набором параметров признается лучшей по данному критерию. В ходе работы для осуществления краткосрочного прогноза по имеющимся данным колебания валютных курсов, применяется модель ARIMA (p,d,q) для различных значений временного окна и прогнозирование осуществляется на следующий бар (на одно значение вперед), и полученные результаты сравниваются между собой.

Вторым критерием выбора наиболее подходящей модели является минимизация средней квадратичной ошибки прогноза, полученного с помощью определенной модели. Значение ошибки вычисляется следующим образом:

,

где
yj – реальные данные
– данные, полученные в результате прогнозирования с помощью iой модели.

После вычисления всех значений , находится минимальное из них () и именно модель с iым набором параметров признается лучшей согласно данному критерию.


   Результаты исследования

Для формулировки качественных рекомендаций по использованию модели ARIMA с определенными наборами параметров на разных участках ценового графика, в работе проводится сравнительный анализ выполнения краткосрочного прогнозирования с помощью различных моделей.
На рисунке 2 представлен ценовой график курсов валют EUR-USD валютного рынка Forex с 01.05.2002 по 18.09.2002 (100 значений).

Ценовой график на рынке Forex 01.05.2002-18.09.2002
Рис.2 - Ценовой график на рынке Forex 01.05.2002-18.09.2002

Выбрано временное окно m = 30 и прогнозирование осуществляется на 1 бар вперед. По имеющимся реальным данным строится коридор ± 2 σ. На настоящий момент прогнозирование выполнено с помощью моделей ARIMA (1,0,0) и ARIMA (0,0,1), которые, по сути, являются моделями авторегрессии AR(1) и скользящего среднего MA(1) соответственно. На рисунке 3 представлены полученные значения краткосрочного прогноза с помощью указанных моделей.

Прогноз с помощью моделей ARIMA(1,0,0) и ARIMA(0,0,1)
Рис.3 - Прогноз с помощью моделей ARIMA(1,0,0) и ARIMA(0,0,1)

Проведя тестирование на соответствие 1-ому критерию, получены следующие результаты:
Значения вероятностей соответственно равны и , т.о., согласно критерию максимизации выполнения адекватного прогноза, выбирается модель ARIMA(1,0,0).
Из графика видно, что

  • на данном участке ценового графика модель ARIMA (1,0,0) дает более точный прогноз, чем ARIMA (0,0,1).
  • обе модели достаточно четко предсказывают разворот рынка (изменение направленности тренда)
  • обе модели перестают давать адекватный прогноз, когда происходит разворот рынка - это положение требует дальнейшего более детального анализа, возможно, следует изменить значение временного окна и повторить прогноз
  • резкое изменение рыночной ситуации отражается данными моделями с некоторым запаздыванием
  • модель скользящего среднего дает адекватный прогноз в менее чем 50% случаев и сильно отличающийся от реальных данных, возможно потому, что придает одинаковые веса как более новым ценам, так и более старым, хотя логичнее было бы предположить, что новые цены важнее, т.к отражают более близкую к текущему моменту рыночную ситуацию.
    Выводы

Прогнозирование с большим значением временного окна дает более точный результат, т.к. прогнозирование с помощью моделей ARIMA выполняется путем анализа информации, которая содержится в предыстории временного ряда, а чем больше временное окно, тем большее количество информации имеется для выполнения анализа и построения качественного прогноза.

Достоинства моделей ARIMA:

  • Подход Бокса-Дженкинса к анализу временных рядов является весьма мощным инструментом для построения точных прогнозов с малой дальностью прогнозирования.
  • Модели ARIMA достаточно гибкие и могут описывать широкий спектр характеристик временных рядов, которые встречаются на практике.

Однако использование моделей ARIMA имеет и несколько недостатков:

  • Необходимо относительно большое количество исходных данных
  • Не существует простого способа корректировки параметров моделей ARIMA, – когда привлекаются новые данные, модель приходится почти полностью перестраивать, а иногда требуется выбор абсолютно новой модели.
  • Также для оценок используется та или иная модель, а это означает наличие модельного риска в расчетах. Поэтому необходима периодическая проверка адекватности применяемой модели.
  • Таким образом, общий недостаток прогнозирования при помощи этих моделей заключается в том, что все они независимо от применяемых методов вычисления используют исторические данные. И если условия на рынке (например, волатильность рынка или корреляция между активами) резко меняются, то эти изменения будут учтены только через определенный промежуток времени. А до этого момента предсказания будут некорректны.

Вышеназванные факторы приводят к тому, что данные модели хорошо работают в случае стабильного состояния рынков и перестают адекватно отражать поведение цен, когда на рынках происходят существенные изменения.

В результате работы будет сделан вывод о правилах применения модели ARIMA с различными наборами параметров для осуществления краткосрочного прогноза на валютном рынке FOREX и разработаны рекомендации для корректировки трейдерами стратегии своего поведения и эффективного управления своими активами.

Примечание: В настоящий момент работа находится в стадии разработки, исследования в полном объеме еще не закончены, завершение планируется в декабре 2007г.

В работе планируется дополнительно провести анализ прогнозирования ценовых графиков с разным значением временного окна с помощью следующих моделей:

  • (1,0,0) – авторегрессионная функция;
  • (0,0,1) – скользящая средняя;
  • (1,0,1) – комбинированная модель авторегрессии и скользящей средней;
  • (0,1,1) – экспоненциальная средняя;
  • (1,1,1) – нестационарный процесс с линейным трендом

    Перечень ссылок

  1. Єріна А. М. "Статистичне моделювання та прогнозування", Навчальний посібник. – К.: КНЕУ, 2001. – 170с.
  2. Ханк Дж., Райтс А. "Бизнес-прогнозирование", 7-е издание: Пер. с английского. – М.:"Вильямс", 2003. – 656с.
  3. Басовский Л. Е. "Прогнозирование и планирование в условиях рынка", Учебное пособие - М.: ИНФРА-М, 2001. - 260с.
  4. Бокс Дж., Дженкинс Г. "Анализ временных рядов. Прогноз и управление" – М.: Мир, 1994 г.
  5. Кендэлл М. "Временные ряды" Москва, Финансы и статистика, 1981 г.
[Главная]  [Биография]  [Автореферат]  [Библиотека]  [Ссылки]  [Отчет о поиске]  [Индивидуальное задание]