Источник: http://www.nickart.spb.ru/analysis/index.php




МЕТОДЫ ПРОГНОЗИРОВАНИЯ

Настоящая статья представляет собой обзор основных концепций построения прогностической модели. Ее цель – дать общее представление о проблеме и предостеречь начинающего аналитика от возможных ошибок.

Модель и метод

Существует большое количество моделей, с помощью которых осуществляется прогноз. Например, линейная регрессионная модель (LRM), логистическая регрессионная модель (Logit), модель авторегрессии и скользящего среднего (ARIMA) и т.п.

Построение любой модели сопряжено с оценкой параметров этой модели. Для регрессионной модели это оценка коэффициентов регрессионного уравнения, для ARIMA – параметры авторегрессии «р», порядок разности «d», параметры скользящего среднего «q» и т.п.

Оценивать параметры модели можно с помощью различным методов. Например, с помощью метод наименьших квадратов (OLS), метода взвешенных наименьших квадратов и т.п.

На этапе практической разработки моделей и прогнозов начинающие исследователи часто не различают понятий «метод» и «модель». Поэтому для начала необходимо четко различать что есть «модель», а что - «метод». Кроме того, нельзя любой метод применить для оценки параметров любой модели. Применение каждого метода обусловлено некоторыми предпосылками (напр. – симметричное распределение остатков, отсутствие автокоррелляции в остатках и пр.). Эти предпосылки фиксируются моделью. Рассматривать конкретный метод вне модели столь же неправильно, сколь говорить, о значении слова «пакет» вне контекста:

Речь может идти о пакете акций, полиэтиленовом пакете, или средстве для прогнозирования.

В качестве примера корректной формулировки можно привести утверждение: "OLS дает BLUE оценки коэффициентов в СLRM" Обратим внимание на то, что утверждение разделяет Метод (OLS), модель (CLRM), и результаты применения: (BLUE оценки коэффициентов) Утверждение "OLS дает BLUE оценки" уже будет некорректным, поскольку данный метод применим не для всех моделей.

Исходные данные и их специфика

При выборе комбинации модель-метод необходимо четко определять основы, на которых стоишь – исходные данные. Именно исходные данные и постановка задачи определяют конкретных «претендентов».

Шкала прогнозируемой величины

В первую очередь следует определиться, прогнозируем мы количественную, порядковую, или номинальную величину. Для прогнозирования количественной переменной можно строить, к примеру, модели CLRM и ARIMA. Если зависимая величина принимает значения "0" или "1" (да/нет) – используются модели бинарного выбора. Деревья классификации или мультиномиальные регрессионные модели позволяют прогнозировать значение номинальной переменной, которая принимает более двух значений. Для построения прогноза величины, измеренной в порядковой шкале, можно применять так называемые «ordered» – модели. Следует помнить, что некорректное сочетание метод-модель может привести в данной ситуации к абсурдным результатам. Если мы строим прогнозную модель, которая должна ответить на вопрос: кто победит на следующих выборах, Путин(1), Зюганов(2), или Миронов(3), то прогнозируемая величина у нас измеряется в номинальной шкале. Применяя в данном случае метод OLS, достаточно сложно будет интерпретировать результат "1,56".

Финансовые временные ряды

Особо стоит отметить проблематику прогнозирования финансовых временных рядов. Характерная особенность последних заключается в их «толстых хвостах», а также в том, что они обнаруживают существенно более сильную реакцию на отрицательные шоки, чем на положительные. Эти и некоторые другие идеи отражены в разработках Ингла (ARCH модели), Борислева (GARCH модели), а также в более поздних подходах к анализу условной гетероскедастичности. Визуальная предпосылка для их реализации – кластеризация дисперсии.

Экзогенные переменные

В ситуации, когда отсутствуют экзогенные переменные (факторы), перечень моделей, применяемых для прогнозирования, существенно сужается. Для прогнозирования количественных переменных при отсутствии дополнительных объясняющих переменных применяются, как правило, ARIMA, или экспоненциальное сглаживание. Экспоненциальное сглаживание, в отличие от ARIMA, не очень требовательно к объему исходной выборки, но позволяет строить только краткосрочные прогнозы.

Кросс-проверка

Любую задачу можно решить несколькими способами. Прогнозирование – не исключение из этого правила. В большинстве ситуаций при разработке модели аналитик вправе применить несколько подходов, и внедрить на практике наиболее эффективный. Для проверки прогностических качеств модели используют процедуру кросс-проверки. Модель строится по выборке с обрезанным «хвостом», а затем сравниваются «хвост» и прогноз. Кроме этого, принято тестировать прогноз на устойчивость путем удаления нескольких наблюдений из исходной выборки. И, наконец, даже получив «хорошую» в смысле качества прогноза модель не следует пренебрегать процедурой мониторинга.

Сокрашения:

  • OLS метод наименьших квадратов
  • ARIMA авторегрессионный процесс скользящего среднего
  • ARCH авторегрессия с условной гетероскедастичностью
  • CLRM классическая линейная регрессионная модель
  • BLUE лучшие в классе линейных и несмещенных оценки