Прогнозирование
По опыту работы в службе технической поддержки и чтения лекций, можно сказать, что прогнозирование является чуть ли не основной целью и задачей большого числа специалистов, занимающихся анализом данных. Современные методы статистического прогнозирования позволяют с высокой точностью прогнозировать практически все возможные показатели. Данный раздел предназначен для того, чтобы облегчить пользователю решение задачи прогнозирования: задача выбора наилучшей модели прогнозирования, задача анализа адекватности и точности построенного прогноза.
Отметим прежде всего, что не существует универсально предпочтительных методов прогнозирования на все случаи жизни. В данном разделе мы будем рассматривать методы прогнозирования временных рядов, для получения более полной информации о методах прогнозирования данных которые не представляют собой временные ряды обратитесь к советнику по многомерным моделям.
Выбор метода прогнозирования и его эффективность зависят от многих условий, и в частности, от требуемой длины или времени прогнозирования:
- Краткосрочный прогноз. Краткосрочный прогноз характеризует собой прогноз "на завтра", т.е. прогноз на несколько шагов вперед. Если подходить более формально, то под этим понятием понимается построение прогноза не более чем на 3% от наблюдений или на 1-3 шага вперед. Для данного типа прогнозов применяют практически все известные методы:
Экспоненциальное сглаживание - достаточно простой тип моделей, основывающийся на сглаживание и прогнозирование тренда с/без сезонной составляющей.
АРПСС (ARIMA) - является обобщением методов экспоненциального сглаживания и позволяет строить более точные прогнозы. Данный метод фактически замыкает набор линейных методов.
Нейронные сети - это раздел искусственного интеллекта, в котором для обработки сигналов используются явления, аналогичные происходящих в нейронах живых существ. Важнейшая особенность сети, свидетельствующая о ее широких возможностях и огромном потенциале, состоит в параллельной обработке информации всеми звеньями. Другое важное свойство - способность к обучению и обобщения накопленных знаний. Натренированная на ограниченном множестве данных сеть способна обобщать полученную информацию и позывать хорошие результаты на данных, не использовавшихся в процессе обучения.
Для получения более полной информации о методах построения краткосрочных прогнозов смотри Классификация методов по длине истории временного ряда.
- Среднесрочный прогноз. Под среднесрочным прогнозом, как правило, понимают прогноз на 3-5% от объема наблюдений, но не более 7-12 шагов вперед. Также зачастую под этим понятием используют прогноз на один или на половину сезонного цикла. Для данного типа прогнозов применяют модели АРПСС и Экспоненциального сглаживания, которые позволяют отслеживать качество прогноза в зависимости от срока прогноза.
- Долгосрочный прогноз. При построении данного типа прогнозов стандартные статистические методы практически не используются, кроме случаев очень "хороших" рядов, для которых прогноз можно просто "нарисовать".
Поэтому выбор метода прогнозирования следует производить с учетом всех специфических особенностей как целей прогноза, так и анализируемого временного ряда.
В смысле методологий, мы ограничим наше рассмотрение задачами кратко- и среднесрочного прогноза, которые могут решаться (и весьма эффективно) с привлечением только статистических методов. Серьезное решение задач долгосрочного прогноза требует использования комплексных подходов и, в первую очередь, привлечения различных технологий сбора и анализа эксперементальных оценок.
Internet-источник