Источник: http://www.nickart.spb.ru/analysis/index.php МЕТОДЫ ПРОГНОЗИРОВАНИЯНастоящая статья представляет собой обзор основных концепций построения прогностической модели. Ее цель – дать общее представление о проблеме и предостеречь начинающего аналитика от возможных ошибок. Модель и метод Существует большое количество моделей, с помощью которых осуществляется прогноз. Например, линейная регрессионная модель (LRM), логистическая регрессионная модель (Logit), модель авторегрессии и скользящего среднего (ARIMA) и т.п. Построение любой модели сопряжено с оценкой параметров этой модели. Для регрессионной модели это оценка коэффициентов регрессионного уравнения, для ARIMA – параметры авторегрессии «р», порядок разности «d», параметры скользящего среднего «q» и т.п. Оценивать параметры модели можно с помощью различным методов. Например, с помощью метод наименьших квадратов (OLS), метода взвешенных наименьших квадратов и т.п. На этапе практической разработки моделей и прогнозов начинающие исследователи часто не различают понятий «метод» и «модель». Поэтому для начала необходимо четко различать что есть «модель», а что - «метод». Кроме того, нельзя любой метод применить для оценки параметров любой модели. Применение каждого метода обусловлено некоторыми предпосылками (напр. – симметричное распределение остатков, отсутствие автокоррелляции в остатках и пр.). Эти предпосылки фиксируются моделью. Рассматривать конкретный метод вне модели столь же неправильно, сколь говорить, о значении слова «пакет» вне контекста: Речь может идти о пакете акций, полиэтиленовом пакете, или средстве для прогнозирования. В качестве примера корректной формулировки можно привести утверждение: "OLS дает BLUE оценки коэффициентов в СLRM" Обратим внимание на то, что утверждение разделяет Метод (OLS), модель (CLRM), и результаты применения: (BLUE оценки коэффициентов) Утверждение "OLS дает BLUE оценки" уже будет некорректным, поскольку данный метод применим не для всех моделей. Исходные данные и их специфика При выборе комбинации модель-метод необходимо четко определять основы, на которых стоишь – исходные данные. Именно исходные данные и постановка задачи определяют конкретных «претендентов». Шкала прогнозируемой величины В первую очередь следует определиться, прогнозируем мы количественную, порядковую, или номинальную величину. Для прогнозирования количественной переменной можно строить, к примеру, модели CLRM и ARIMA. Если зависимая величина принимает значения "0" или "1" (да/нет) – используются модели бинарного выбора. Деревья классификации или мультиномиальные регрессионные модели позволяют прогнозировать значение номинальной переменной, которая принимает более двух значений. Для построения прогноза величины, измеренной в порядковой шкале, можно применять так называемые «ordered» – модели. Следует помнить, что некорректное сочетание метод-модель может привести в данной ситуации к абсурдным результатам. Если мы строим прогнозную модель, которая должна ответить на вопрос: кто победит на следующих выборах, Путин(1), Зюганов(2), или Миронов(3), то прогнозируемая величина у нас измеряется в номинальной шкале. Применяя в данном случае метод OLS, достаточно сложно будет интерпретировать результат "1,56". Финансовые временные ряды Особо стоит отметить проблематику прогнозирования финансовых временных рядов. Характерная особенность последних заключается в их «толстых хвостах», а также в том, что они обнаруживают существенно более сильную реакцию на отрицательные шоки, чем на положительные. Эти и некоторые другие идеи отражены в разработках Ингла (ARCH модели), Борислева (GARCH модели), а также в более поздних подходах к анализу условной гетероскедастичности. Визуальная предпосылка для их реализации – кластеризация дисперсии. Экзогенные переменные В ситуации, когда отсутствуют экзогенные переменные (факторы), перечень моделей, применяемых для прогнозирования, существенно сужается. Для прогнозирования количественных переменных при отсутствии дополнительных объясняющих переменных применяются, как правило, ARIMA, или экспоненциальное сглаживание. Экспоненциальное сглаживание, в отличие от ARIMA, не очень требовательно к объему исходной выборки, но позволяет строить только краткосрочные прогнозы. Кросс-проверка Любую задачу можно решить несколькими способами. Прогнозирование – не исключение из этого правила. В большинстве ситуаций при разработке модели аналитик вправе применить несколько подходов, и внедрить на практике наиболее эффективный. Для проверки прогностических качеств модели используют процедуру кросс-проверки. Модель строится по выборке с обрезанным «хвостом», а затем сравниваются «хвост» и прогноз. Кроме этого, принято тестировать прогноз на устойчивость путем удаления нескольких наблюдений из исходной выборки. И, наконец, даже получив «хорошую» в смысле качества прогноза модель не следует пренебрегать процедурой мониторинга. Сокрашения:
|