Грешилов А.А., Стакун В.А., Стакун А.А.
“Математические методы построения прогнозов”
Глава 3. МЕТОДЫ ПОСТРОЕНИЯ ПРОГНОЗОВ
3.1. Особенности процедуры прогнозирования
Рассмотрим приложение стохастических (статистических) моделей, адекватно описывающих поведение систем и их элементов, для целей прогнозирования поведения систем, Другими словами, математические модели будут использованы для получения будущих значений динамических (временных) рядов, характеризующих исследуемые характеристики систем.
Этапу прогнозирования предшествует итеративная процедура построения математической модели, основанная на идентификации, оценивании и диагностической проверке.
Под идентификацией подразумевается использование любой информации о том, как были получены рассматриваемые числовые значении (как был генерирован ряд), с целью отыскания набора экономичных моделей, заслуживающих опробования. Экономичные модели должны обладать максимальной простотой и минимальным числом параметров, но при этом адекватно описывать наблюдения. Методы идентификации определяют класс пробных моделей, для которых применяются более формальные и эффективные методы оценивания.
Под оцениванием подразумевается процедура получения оценок параметров моделей, определяющих адекватность моделей, ибо неадекватность выбранной модели может быть вызвана неэффективностью процедуры оценки параметров; модели, а не тем, что неадекватен вид модели. Процедуры получения оценок рассмотрены в гл. 1 и 2.
Под диагностической проверкой подразумевается проверка согласования подогнанной модели с исходными данными, чтобы вскрыть недостатки модели и улучшить ее. В частности, метод диагностической проверки модели может базироваться на введении избыточного числа параметров, т. е. в оценивании параметров для несколько более обшей модели, чем ожидаемая. Этот подход исходит из того, что мы можем угадать неадекватные свойства модели, и требует исследования остаточных ошибок после подгонки модели. Он позволяет определить, какие необходимы изменения модели.
При проведении прогнозирования необходимо иметь в виду, что все факторы, влияющие на поведение системы в базовом (исследуемом) и прогнозируемом периодах, должны быть неизменны или изменяться по известному закону. Первый случай реализуется в однофакторном прогнозировании, второй - при многофакторном.
Можно выделить дна вида прогнозируемых характеристик системы, зависящих от времени: переменные состояния и переменные интенсивности. Переменная состояния определяется периодически, и ее значение в течение небольшого интервала времени не зависит от времени, прошедшего с момента начала наблюдения. Переменная интенсивности также определяется периодически, но ее значение пропорционально времени, прошедшему с момента предыдущего наблюдения. Если переменная состояния характеризует количество, то переменная интенсивности — скорость его изменения.
Величина промежутков времени между измерениями входных переменных системы с целью проверки и уточнения ранее сделанных прогнозов о выводных переменных зависит главным образом от длительности времени упреждения и наибольшей частоты циклических изменений в системе, которые должна отражать модель. Поэтому временные интервалы пересмотров прогнозов могут изменяться в широких пределах. Однако эти интервалы должны быть достаточно велики, чтобы обеспечивалась вероятность осуществления ожидаемых изменений системы. Когда имеют место какие-то периодические процессы, то частота наблюдений должна быть по крайней мере вдвое больше частоты изучаемого процесса.
Если случайная ошибка при определении входных переменных велика по сравнению с измеряемой величиной, интервал уточнения прогноза для переменной интенсивности целесообразно увеличить, усредняя таким образом случайную ошибку. Однако для переменной состояния в аналогичном случае интервал уточнения прогноза лучше уменьшить, что позволяет для выделения полезного сигнала использовать соответствующие методы фильтрации. Использование доступных к моменту t наблюдений динамического ряда для прогнозирования его значений в некоторый момент (t+l) в будущем является основой для управления и оптимизации промышленных процессов, экономических систем и т.д. Интервал l называют временем упреждения. Функция уt(l), дающая в момент t прогнозы будущих времен упреждения l, называется прогнозирующей функцией в момент t. Прогнозирующая функция определяется заданной априори целью. Например, находится такая прогнозирующая функция уt(l). у которой среднее значение квадрата отклонения (yt+1-yt(l))г истинного уt+1 от прогнозируемого значений является наименьшим для каждого упреждения l.
Вычисление наилучшего прогноза должно сопровождаться указанием его точности, например, чтобы можно было оценить риск, связанный с принятием решения по данному прогнозу. Точность прогноза может быть выражена вероятностными пределами (интервальными оценками).
Динамический ряд рассматривается как сумма детерминированной и случайной компонент. Детерминированная компонента выражается некоторой аппроксимирующей функцией, отражающей закономерность развития исследуемого явления. Появление случайной компоненты определяется сложным переплетением параметров системы, влиянием на их величину большого числа неизвестных факторов, действующих в разных направлениях, что находит свое выражение в отклонении значений показателей системы от основной тенденции развития. Дополнительный вклад вносит и аппроксимирующая модель, которая не в состоянии описать вес особенности системы.
Наиболее часто отклонения от основной тенденции развития рассматриваются как стационарный случайный процесс, к которому применимы методы прогнозирования стационарных случайных процессов. Если случайная компонента не является стационарной, то производят определенные преобразования, чтобы сделать случайную компоненту хотя бы стационарной в определенных условиях.
В прогнозировании важное значение имеет предварительный анализ характера изучаемого явления для определения вида его описания: процесс хорошо описывается основной тенденцией (трендом) или процесс зависит от изменения некоторого набора показателей, отражающих структуру процесса. Выбор вида описания предопределяет точность прогноза на будущее.
Методы прогнозирования могут быть разделены на три большие группы: статистические (описательные), причинно-следственные и их комбинация. Для изучения исследуемого процесса следует задать закон изменения входных переменных во времени. Выходные переменные системы могут быть описаны с помощью некоторой модели, значения коэффициентов которой определяются подбором. При этом различные наблюдения учитываются с различными весовыми множителями. По таким моделям, включающим описание предыстории системы, прогноз можно составить путем расчета состояния системы для некоторого будущего момента времени.
Если удастся построить модель окружающей среды, позволяющую выявить причины изменений в системе (вторая группа методов), то прогноз, полученный с помощью такой модели, объясняет будущее системы. Подобные методы охватывают широкий круг моделей.
Между двумя любыми автокоррелированными временными рядами всегда существует статистическая корреляция. Следовательно, существует опасность бессмысленного использования множественной регрессии в поисках «хорошего» коэффициента корреляции между прогнозируемыми (выходными) переменными и различными потенциально информативными входными переменными. Известная предыстория представляет собой только элемент полного временного ряда и если искать достаточно долго, связь между переменными в любом случае будет найдена. Но если с увеличением объема информации коэффициенты модели становятся равными нулю, то модель не пригодна для принятия правильного решения, так как именно в критический момент основные показатели перестали быть таковыми. Наилучшие результаты получаются при использовании комбинации статистических и причинно-следственных методов прогнозировании. Исходные данные обычно представляют собой результаты выборочных наблюдений либо переменной интенсивности, либо переменной состояния. Результаты наблюдений регистрируются с ошибками, которые возникают как при наблюдениях, так и при регистрации данных. Кроме того, изучаемый процесс может иметь стохастическую природу. Результаты наблюдений могут содержать и аномальные эффекты. Поэтому не каждую совокупность зарегистрированных по мере поступления реальных данных следует считать подходящим рядом, на основании которого можно составлять прогноз. Перед тем как подобрать коэффициенты модели по исходным данным, из последних должны быть исключены выбросы, т. е. результаты наблюдений, которые не характеризуют прогнозируемый процесс.
Для описания стохастических элементов рядов и их прогноза используются три различных понятия — помехи, остатки и ошибки. Понятие помехи сказано с собственной изменчивостью процесса и неопределенностью, вносимой при наблюдении за ним. Следовательно, помеха является составной частью используемых данных. Под остатками понимается разность между результатами наблюдений и соответствующими значениями, вычисленными с помощью прогнозирующей их модели. Таким образом, остатки связаны с прошлыми данными и моделью, которая использовалась для их оценок. Ошибки прогноза представляют собой разницу между прогнозом, сделанным в настоящее время, и тем, что будет наблюдаться позднее в момент времени, для которого составлен прогноз.
Любой процесс, представленный рядом результатов наблюдений, можно описать набором разностных уравнений (когда процесс дискретен) или дифференциальных уравнений (когда он непрерывен). Если в этих уравнениях коэффициенты не зависят от времени, процесс называется стационарным; если же зависит, то нестационарным. Эта зависимость может носить вероятностный или регулярный характер. Известное регулярное изменение коэффициентов во времени может быть описано дополнительными уравнениями.
Для достаточно больших интервалов времени большинство прогнозируемых рядов являются нестационарными. Однако их все же можно считать квазистационарными, если прогноз составлять для какого-то одного момента времени.
Ни в одном из статистических методов прогнозирования не может быть заранее предусмотрено тиснение модели прогнозируемого процесса. Имеется ряд методов быстрого обнаружения изменений в последующих процессах с ней соответствующей реакцией на них. Модель прогноза может все более усложняться, когда это экономически оправдано и позволяет глубже проникнуть в механизм наблюдаемых явлений.
Во многих случаях изменения в изучаемом процессе можно предвидеть заранее, но в модель прогноза они тем не менее не включаются, так как последствия таких изменений не могу: быть точно рассчитаны. Тем не менее на основе тщательного анализа различных вариантов можно предсказать характер изменений. В любой отдельный период времени существует, очевидно, несколько серий прогнозов, отличных от простого описательного прогноза. Это позволяет минимизировать время, затрачиваемое на внесение изменений.