Источник: Информационные управляющие системы и компьютерный мониторинг — 2010 / Материалы I всеукраинской научно-технической конференции студентов, аспирантов и молодых учёных. - Донецк, ДонНТУ - 2010, с. 147-150.
Общая постановка проблемы. Человечество всегда интересовала возможность прогнозирования погоды, но это до сих пор остается довольно сложной задачей. Это обусловлено постоянным изменением климатических показателей, отсутствием универсальных методов прогнозирования. Сегодня вопросы прогнозирования и оценки важнейших показателей погодных условий на некоторый промежуток времени становятся особенно актуальными. Осуществляется прогноз температуры атмосферного воздуха, проводится прогнозирование влажности, атмосферного давления, скорости ветра, количество осадков.
Развитию прогнозирования погодных условий способствовало усовершенствование современных вычислительных машин, что привело к появлению суперкомпьютеров, а также к увеличению числа метеостанций, развитию математических теорий и моделей.
Для осуществления прогнозирования погоды необходимо собрать информацию о состоянии погодных условий (влажности, температуре, атмосферном давлении, направлении ветра). Именно для этих целей используют метеостанции. Одна из таких метеостанций, Vantage Pro 2, расположена в ДонНТУ на факультете компьютерных наук и технологий. Она представляет собой беспроводную метеостанцию, которая измеряет следующие параметры: атмосферное давление, температуру, скорость и направление ветра, температуру точки росы, количество и интенсивность осадков, время захода и восхода солнца и ультрафиолетовое излучение.
Методы решения задачи исследования. Существует ряд методов для прогнозирования погоды, среди которых выделяют:
- синоптический метод – основан на анализе погодных карт. Сущность этого метода состоит в одновременном обзоре состояния атмосферы на обширной территории, позволяющей определить характер развития атмосферных процессов и дальнейшее изменение погодных условий;
- численные методы – основаны на математическом решении систем полных уравнений гидродинамики и получение прогностических полей давления, температуры на определенные промежутки времени. Точность численных прогнозов зависит от скорости расчета вычислительных систем, от количества и качества информации, поступающей с метеостанций;
- ансамблевый метод – предполагает, что всегда существует неопределенность в сведениях о состоянии атмосферы. Она хаотично возрастает во времени с поступлением большого количества новой информации. Скорость роста этой неопределенности трудно оценить, поскольку она зависит от трехмерной структуры атмосферного потока. Решение этой проблемы состоит в использовании группы прогнозов — ансамбля — с рядом незначительно отличающихся начальных условий и/или группы моделей, численное прогнозирование погоды с различными, но равновозможными приближениями. Если ансамбль хорошо построен, то его прогнозы охватят весь диапазон возможных результатов, включая ряд образований, где могут возрастать неопределенности;
- методы нелинейной динамики. Применяется, например, теорема Такенса;
- статистический метод – предполагает прогнозирование погоды на основе некоторой статистики, из которой формируется временной ряд и производится реконструкция (восстановление) уравнений. Простейшие методы восстановления используемые для прогнозирования зависимости исходят из заданного временного ряда, т. е. функции, определённой в конечном числе точек на оси времени. Временной ряд при этом часто рассматривается в рамках той или иной вероятностной модели. Он может быть многомерным. Основные решаемые задачи — интерполяция и экстраполяция. Могут оказаться полезными предварительные преобразования переменных, например, логарифмирование. Наиболее часто используется метод наименьших квадратов при нескольких факторах. Метод наименьших модулей, сплайны и другие методы экстраполяции применяются реже, хотя их статистические свойства зачастую лучше.
Для оценки точности прогноза используются вероятностно-статистические модели восстановления зависимости, например, строят наилучший прогноз по методу максимального правдоподобия. Разработаны параметрические (обычно на основе модели нормальных ошибок) и непараметрические оценки точности прогноза и доверительные границы для прогноза (на основе Центральной Предельной Теоремы теории вероятностей). Применяются также эвристические приемы, не основанные на вероятностно-статистической теории: метод скользящих средних, метод экспоненциального сглаживания.
Многомерная регрессия, в том числе с использованием непараметрических оценок плотности распределения, — основной в настоящее время статистический аппарат прогнозирования. Нереалистичное предположение о нормальности погрешностей измерений и отклонений от линии (поверхности) регрессии использовать не обязательно; однако для отказа от предположения нормальности необходимо опереться на другой математический аппарат, основанный на многомерной центральной предельной теоремы теории вероятностей, технологии линеаризации и наследования сходимости. Данный аппарат позволяет проводить точечное и интервальное оценивание параметров, проверять значимость их отличия от 0 в непараметрической постановке, строить доверительные границы для прогноза.
Временные ряды предпочитают использовать из-за большой размерность задачи прогнозирования. Прогноз по временным рядам предусматривает определение прогнозного значения переменной на основе прошлых и текущих значений этой же переменной. Для решения задачи прогнозирования метеопараметров необходимо построение по значениям временных рядов аппроксимирующих полиномов, отражающих как можно более точную зависимость отклика от других параметров. При этом необходимо выбрать наиболее перспективные функции и на последующих шагах решения данной задачи спрогнозировать изменение отклика, которым может быть один из измеряемых параметров. Основным положением, на котором базируется использование временных рядов для прогнозирования, является то, что факторы, влияющие на отклик изучаемой системы, действовали некоторым образом в прошлом и настоящем, и ожидается, что они будут действовать схожим образом и в недалеком будущем. Поэтому основной целью анализа временных рядов будет оценка и выявление этих влияющих факторов с целью прогноза дальнейшего поведения системы и выработки рациональных управленческих решений.
Исходными данными для решения задачи прогнозирования погодных условий является некоторая информация из базы данных метеостанции ДонНТУ, которую в дальнейшем будем называть исторической, характеризующей изменение измеряемых метеостанцией показателей во времени.
Предлагается в качестве исходных показателей взять измерения за предыдущие периоды. Таким образом, измеряемый и, в дальнейшем, прогнозируемый параметр представляется как некоторая функция времени, другие факторы, влияющие на прогноз, не учитываются. В этой связи оценки, полученные с использованием данного метода, обычно корректируются с учетом некоторой погрешности измерений станцией и машинной погрешностью расчета. Прогнозирование метеорологических параметров по их временным рядам осуществляется в несколько этапов:
Если модель удовлетворяет выбранным критериям эффективности, то она считается работоспособной, иначе происходит возврат ко второму этапу прогнозирования.
В дальнейшем, моделью прогнозирования метеопараметров будет служить метод Эглайса для реконструкции модельных уравнений. Данный метод представляет собой методику синтеза регрессионной модели объекта по табличным данным, ориентированную на использование современных ЭВМ. Пусть информация об объекте задана таблично, где каждой точке в пространстве параметров соответствует определенный отклик. Требуется синтезировать соответствующее уравнение регрессии в виде полинома, с выбором банка элементарных функций. . Причем банк создается таким образом, чтобы элементарные функции, входящие в него, как можно меньше дублировали друг друга. Синтез уравнения из банка элементарных функций включает 2 этапа: отбор из банка наиболее перспективных функций и элиминация (исключение) отобранных функций с целью определения окончательного уравнения регрессии. Оставляется в банке часть действительно необходимых для построения зависимости функций в синтезируемом уравнении регрессии. Остальные же функции из банка исключаются. Строится диаграмма элиминации по среднеквадратичным отклонениям каждой из функций банка Ф. Минимальное количество функций, необходимых для построения уравнения регрессии определяется по точке излома, когда остаются только существенные функции, исключение любой из которых заметно увеличивает среднеквадратичное отклонение. Точность уравнения регрессии определяется коэффициентом корреляции с.
Выводы. Работ по прогнозированию метеопараметров с использованием временных рядов в настоящее время проводится мало в виду трудоемкости данного процесса. Однако такие работы проводятся в ДонНТУ на кафедре компьютерных систем мониторинга факультета компьютерных наук и технологий. Примером является работа Гриценко Анны Вячеславовны по изучению возможности прогнозирования метеопараметров по их временным рядам и формированию на их основе алгоритма расчета краткосрочного прогноза погоды.
1. Б.П. Безручко, Д.А. Смирнов. Реконструкция обыкновенных дифференциальных уравнений по временным рядам. Саратов: ГосУНЦ «Колледж», 2000 – 48с.
2. Из чего делают прогноз погоды: Статья. Электронный ресурс: http://edu.mccme.ru/Project/OL/chelife1.htm (21.04.2010).
3. Прогнозирование метеопараметров по временным рядам. Статья. Электронный ресурс:http://masters.donntu.ru/2009/fvti/gritsenko/library/article5.htm (21.04.2010).