ПОСТРОЕНИЕ ПРОГНОСТИЧЕСКОГО КОМПЛЕКСА И ВНЕДРЕНИЕ ЕГО В ЭЛЕКТРОННУЮ СЕТЬ УНИВЕРСИТЕТА

Беловодский В.Н., Сивяков А.С.
Донецкий национальный технический университет г.Донецк
Кафедра компьютерных систем мониторинга

E-mail: arteom.sivyakov@gmail.com

Источник: Сборник материалов I всеукраинской научно-технической конференции студентов, аспирантов и молодых ученных «Информационные управляющие системы и компьютерный мониторинг (ИУС та КМ-2010)». – Донецк: ДонНТУ, 2010 – 634 с.

Аннотация

Беловодский В.Н., Сивяков А.С. Построение прогностического комплекса и внедрения его в электронную сеть университета. В докладе освещена идея построения прогностического комплекса, позволяющего проводить анализ временных характеристик основных метеопараметров. Изложена концепция его реализации и внедрения  в электронную сеть университета.

Актуальность. Адекватный (правдивый) прогноз погоды – это одна из важных современных проблем, имеющих практическое применение. Очень часто погодные условия становятся для людей бедственными. Однако мировая статистика показывает, что если доверять гидрометеорологической информации и адекватно на неё реагировать, то можно предотвратить от 30 до 40% потерь и полностью избежать человеческих жертв.

За последние десятилетия развитие идей и методов прогнозирования заметно продвинулось вперед, и этому способствовало как развитие математических подходов и усовершенствование методов исследования атмосферы, так и использование современной компьютерной техники.

Обзор предметной области исследования. Построение прогностической модели основано на обработке временных рядов, полученных  с метеостанции Vantage Pro 2, установленной на факультете КНТ ДонНТУ. Данная метеостанция позволяет снимать следующие данные:

  • температура;
  • влажность;
  • давление;
  • скорость ветра.

Все данные сохраняются на сервере кафедры КСМ и «АКИАМ». Интервал замеров составляет 10 минут. Таким образом, в процессе его эксплуатации постоянно формируется и постепенно накапливается совокупность временных рядов. Наличие этой информации делает вполне реальной  задачу разработки   прогностического комплекса.

В последние десятилетия в рамках нелинейной динамики получен ряд фундаментальных теоретических результатов и разработаны методики, обосновывающие принципиальную возможность прогнозирования физических процессов на базе их временных рядов. Теоретическим фундаментом  этих разработок  и методов является теорема Такенса [1]. Одной из его основополагающих идей  является то, что при построении эмпирических моделей по временному ряду в качестве недостающих переменных можно использовать или последовательные значения доступной наблюдаемой величины, или ее последовательные производные. Было доказано, что при реконструкции по скалярной временной реализации динамической системы и метод временных задержек, и метод последовательных производных гарантируют, что в новых переменных будет получено эквивалентное описание исходной динамической системы  при достаточно большой размерности восстановленных векторов D. А именно, должно выполняться условие D>2d, где d – размерность множества M в фазовом пространстве исходной системы, на котором происходит моделируемое движение. Эти утверждения и составляют содержание знаменитых теорем Такенса.

Анализ последних исследований. На данный момент на кафедре КСМ уже разработан прогностический комплекс [2]. Он позволяет на основе рядов, снимаемых с метеостанции ставить краткосрочные прогнозы температуры, влажности, давления и скорости ветра. Алгоритм работы комплекса разбивается на ряд следующих этапов:

- этап №1. Ряды снятые с метеостанции обрабатываются и систематизируются. После чего проводится их анализ с помощью визуального, спектрального и статистического методов, с целью выявления выраженных закономерностей, которые могли бы упростить выбор модельных уравнений;

- этап №2. Установление размерности модели, обеспечивающей однозначность прогноза. Проводится с использованием метода ложных соседей;

- этап №3.  Восстановление модельных уравнений осуществляется с использованием искусственных нейронных сетей, которые являются эффективным инструментом решения разнообразных задач и широко используются в последнее время для анализа временных рядов. Из большого числа существующих конфигураций нейронных сетей, с учетом их ориентации на классы решаемых задач и результатов предварительных экспериментов, в работе для реконструкции модельных уравнений были выбраны три типа сетей: однослойная линейная, двухслойная нелинейная и обобщенная регрессионная. Для расчета значений прогноза применяются различные прогностические схемы, основанные на итерировании базовых, и ансамблевые варианты.

Схематически этот алгоритм можно представить следующей схемой:

Рисунок 1 – Схема построения модели по временному ряду

Постановка задач. В процессе анализа разработанного прогностического комплекса и анализа литературных и интернет источников были сформулированы следующие задачи, которые требуют практического решения:

- работа прогностического комплекса и метеостанции должна быть синхронизированной и непрерывной;

- доступ к программной реализации комплекса должна быть скрыта от пользователя;

- метод ложных соседей необходимо заменить, наиболее популярным и современным методом работы с временными рядами и большими объемами данных;

- расширить инструментарий и обеспечить высокую интерактивность прогностического комплекса;

- доступ и анализ временных рядов должен производиться через электронную сеть университета, что обеспечит использование прогностического комплекса не только преподавателями, но и студентами.

Обоснование и пути решения выделенных задач. В качестве программных средств разработки используется среда Matlab, являющаяся высокоуровневым языком технических расчетов, интерактивной средой разработки алгоритмов и современным инструментом анализа данных. Эффективность Matlab обусловлена прежде всего ее ориентацией на матричные вычисления с программной эмуляцией параллельных вычислений и упрощенными средствами задания циклов. Удачно реализованы средства работы с многомерными массивами, большими и разреженными матрицами и многими типами данных.

Решение первой задачи осуществляется путем размещения на сервере кафедры КСМ базы данных, в которую постоянно бы происходило сохранение данных с метеостанции. Далее просто необходимо осуществить синхронизацию и взаимодействие  комплекса с базой данных. Эти задачи решаются с использованием инструмента Database математического пакета Matlab.

Вторая задача сводится к процессу компиляции проекта и собора необходимых .dll файлов в единую систему, которая в будущем получит название прогностический комплекс.

Идея использования вместо метода ложных соседей, метода главных компонент возникла в связи с тем, что  метод главных компонент (PCA) является  одним из основных способов уменьшить размерность данных, потеряв наименьшее количество информации. PCA применяется во многих областях, таких как распознавание образов, компьютерное зрение, сжатие данных и т.п. Вычисление главных компонент сводится к вычислению собственных векторов и собственных значений ковариационной матрицы исходных данных.

Четвертая задача решается путем внедрения в комплекс метода Эглайса, идея которого заключается в построении многомерного регрессионного уравнения [3]. Интерактивность увеличивается за счет усложнения диалога программы с пользователем.

Решение последней задачи сводится к следующей схеме.

Рисунок 2 – Схема работы прогностического комплекса

Выводы.В качестве основной задачи построения прогностического комплекса была принята задача усовершенствования и синхронизации прогностического комплекса с метеостанцией, а так же интеграция его в электронную сеть университета В результате работы был проведен анализ литературы по методам прогнозирования и оптимизации (сжатия) временных рядов. Был налажен сбор метеопараметров с локальной метеостанции, установленной в ДонНТУ,  показана возможность прогнозирования метеопараметров, с помощью методов реконструкции модельных уравнений, основанных на анализе временных рядов, сформулирована концепция работы прогностического комплекса в электронной сети университета.

Список литературы

1. Takens F. Detecting strange attractors in turbulence // Lec. Notes Math., 1981. V. 898. P. 366-381.

2. Гриценко А.В. Реконструкция уравнений и прогнозирование метеопараметров по их временным рядам. – Донецк, ДонНТУ, 2010. – 149 с.

3. Эглайс В.О. Аппроксимация табличных данных многомерным уравнением регрессии. – Вопросы динамики и прочности: Рига, 1981, Вып. 39. – с. 120-125.



© 2010 Артём Сивяков, ДонНТУ