ДонНТУ  Портал магистров ДонНТУ UKR ENG
Магистр ДонНТУ Дейкун Ольга Валерьевна
Дейкун Ольга Валерьевна
Специальность: Компьютерный эколого-экономический мониторинг
Тема выпускной работы: Исследование процессов загрязнения атмосферного воздуха по данным автоматизированных контрольных постов Донецко-Макеевского региона
Руководитель: профессор, д.т.н. Аверин Геннадий Викторович
Автобиография   Автореферат   Библиотека   Ссылки   Отчет о поиске   Инд. раздел
                     

Автореферат

квалификационной работы магистра

«Исследование процессов загрязнения атмосферного воздуха
по данным автоматизированных контрольных постов
Донецко-Макеевского региона»



Введение

Вся жизнь на планете зависит от состояния воздуха, которым мы дышим каждый день. Атмосферный воздух является жизненно важным компонентом окружающей природной среды, неотъемлемой частью среды обитания человека, растений и животных. Именно поэтому одной из наиболее важных экологических проблем Украины и всего мира является загрязнение атмосферного воздуха.

Донецкая область является крупнейшим промышленным регионом нашей страны. Здесь функционирует более 800 значительных предприятий горнодобывающей, металлургической, химической промышленности, энергетики, тяжелого машиностроения, эксплуатируется около 300 месторождений полезных ископаемых. Высокая концентрация крупных промышленных предприятий, транспортной инфраструктуры в сочетании со значительной плотностью населения региона создали огромнейшую нагрузку на биосферу и повлияли на состояние многих её составляющих, а особенно на состояние воздушного бассейна. Поэтому для Донецкой области особо важными являются задачи контроля концентраций загрязняющих веществ и краткосрочного прогнозирования (на 1 – 7 дней) состояния воздушного бассейна. Их решение позволяет рационально подходить к вопросу размещения новых предприятий в регионе, планировать реконструкции и усовершенствование действующих предприятий, принимать административные решения в области экологической безопасности, разрабатывать эффективные мероприятия по снижению уровня загрязнения атмосферного воздуха [1].

Для прогнозирования состояния атмосферного воздуха применяются различные методы - аналитико-эмпирические, численные, статистические, комбинированные и другие. Все эти методы имеют свои преимущества и недостатки. Например, аналитико-эмпирические имеют большую погрешность, а численные методы требуют использования данных об источниках выбросов, а эта информация чаще всего неизвестна. Поэтому исследование процессов загрязнения атмосферного воздуха и разработка моделей прогнозирования являются актуальными задачами экологического мониторинга [2].



Цели и задачи

Цель магистерской работы – исследование процессов загрязнения атмосферного воздуха по данным автоматизированных постов наблюдения за состоянием атмосферного воздуха.

Задачи магистерской работы:

  • анализ методов и средств краткосрочного прогнозирования распространения примесей в атмосферном воздухе;
  • анализ данных о загрязнении атмосферного воздуха, поступающих от автоматизированных постов наблюдения и сравнение их с данными близлежащих стационарных постов субъектов мониторинга;
  • поиск закономерностей распространения примеси в пространственно-временных координатах;
  • построение модели распространения примеси и анализ ее эффективности путем априорной оценки основных параметров;
  • апробация и внедрение научных результатов.

Методы исследований, используемые в магистерской работе – статистический, искусственных нейронных сетей, спектральный анализ.



Предполагаемая научная новизна

Предполагаемая научная новизна работы заключается в следующем:

  • исследование закономерностей изменения концентрации примеси по данным автоматизированных постов мониторинга Донецко-Макеевского региона;

  • получение математической модели вида АРПСС, оценивающей изменение концентрации примеси для оксида углерода (CO), диоксида серы (SO2) и диоксида азота (NO2);

  • прогнозирование изменения концентраций примесей на близлежащий период и построение априорной оценки качества модели прогноза.

Апробация

Результаты роботы докладывались на V международной конференции студентов, аспирантов и молодых ученых «Компьютерный мониторинг и информационные технологии» (КМИТ-2009) и опубликованы в соответствующем сборнике.



Обзор исследований и разработок по теме

Для решения задачи прогнозирования загрязнения атмосферы в настоящее время существует множество методик.

В Украине, России, Белоруссии действует методика ОНД-86, которая является общепризнанным нормативным документом в большинстве стран СНГ. В ряде западных стран используются официальные программы Агентства защиты ОПС (EPA) [3].

Методика расчета концентраций ОНД-86 ориентирована на расчет максимальной концентрации загрязняющего вещества на максимальном расстоянии от источника выбросов. Данная методика использует эмпирические коэффициенты, полученные для стран СНГ, что не позволяет использовать методику в других странах. Большое количество источников выбросов делает невозможным восстановление целостной картины загрязнения атмосферы региона. Несмотря на указанные недостатки, методика ОНД-86 стала основой большинства отечественных программных продуктов, используемых для расчета загрязнения атмосферного воздуха промышленными предприятиями и получения разрешений на выбросы [4].

В работах М. Е. Берлянда описываются модели прогнозирования загрязнения атмосферы, в основу которых положено общее уравнение диффузии. Наиболее известными зарубежными моделями, использующими этот подход, являются модели Гиффорда, Гиффорда-Ханна. При решении уравнения диффузии для его упрощения и адаптации к конкретным территориально-распределенным объектам используют ряд допущений и гипотез. Достоинство данного подхода – универсальность полученных моделей, а недостатки – высокая неопределенность исходных данных, сложные процедуры оценки достоверности моделей, невозможность учета рельефных особенностей местности [5].

Одна из известных методик расчета загрязнения атмосферного воздуха, использующих данные постов контроля, а не данные об источниках выбросов, использует статистическую основу. На настоящий момент она является официально действующей на территории Украины и опубликована в [1] . Данная методика учитывает влияние не отдельных загрязняющих веществ, а их суммарное негативное воздействие. С помощью механизмов интерполяции и экстраполяции методика позволяет осуществлять расчет поля концентрации. Таким образом, данная методика позволяет решать стационарную задачу прогнозирования.

Анализ программных продуктов в области контроля загрязнения атмосферы показывает, что эффективных специализированных программных средств для прогноза загрязнения атмосферного воздуха практически не существует. Из отечественных программных продуктов сегодня используются “ЭОЛ”, “Пленэр”, УПРЗА “Эколог”, “Кедр” и др., из зарубежных – продукты семейства “CalPuff”, “Plume”, “TAPM”, а также программные продукты, в основе которых лежат модели EPA [6].

Большинство отечественных программных продуктов имеют ряд недостатков. Существенным недостатком является невозможность учета рельефных особенностей местности. Применение зарубежных программных средств невозможно по ряду причин: различия в климатических условиях, системах поставки экологической информации и других [3].

Исходя из этого, можно отметить, что задача поиска новых методов прогнозирования загрязнения атмосферного воздуха и создание на их основе программных продуктов нового поколения является актуальной задачей мониторинга окружающей среды.



Текущие результаты

Сегодня на территории Донецко-Макеевского региона наблюдается установка автоматизированных постов контроля загрязнения атмосферы. Один из таких постов расположен на территории ДонНТУ и функционирует с ноября 2008 года. Данный пост контролирует концентрации оксида углерода (CO), диоксида серы (SO2) и диоксида азота (NO2) в воздухе. Процесс измерения включает анализ атмосферного воздуха с помощью газоанализатора, в состав которого входят электролитические датчики CO, SO2 и NO2. Полученная с датчиков информация усредняется и с периодичностью 10 минут записывается в базу данных, входящую в состав программного комплекса Акиам.

Накопленные данные представляют собой временные ряды наблюдений за концентрациями указанных веществ. На момент написания автореферата количество имеющихся данных составляет приблизительно 20 тысяч наблюдений. Данная информация может быть использована при разработке моделей прогноза загрязнения атмосферы. Для анализа данных могут быть использованы следующие методы: анализ прерванных временных рядов; экспоненциальное сглаживание и прогнозирование; авторегрессии и проинтегрированного скользящего среднего (ARIMA-АРПСС); спектральный анализ (Фурье); прогнозирование с использованием нейронных сетей и другие. В магистерской работе предполагается использование последних трех методов.

Общая структура системы прогнозирования загрязнения атмосферного воздуха представлена на рис. 1.

Рисунок 1 – Структура системы прогнозирования загрязнения атмосферы (анимация: объем - 28,8 КБ; размер - 560x417; количество кадров - 9; задержка между кадрами - 90 мс; задержка между последним и первым кадрами - 150 мс; количество циклов повторения - 7.)


Рисунок 1 – Структура системы прогнозирования загрязнения атмосферы

(анимация: объем - 28,8 КБ; размер - 560x417; количество кадров - 9;
задержка между кадрами - 90 мс; задержка между последним и первым кадрами - 150 мс;
количество циклов повторения - 7.)


На данный момент выполнены следующие задачи магистерской работы: получены данные с автоматизированного поста системы Акиам и выполнена подготовка этих данных к анализу; проведен анализ временных рядов с помощью искусственных нейронных сетей и метода АРПСС и попытка их прогнозирования.

Рассмотрим подробнее каждый из методов, которые планируется использовать, а также результаты проведенного анализа.


1. Спектральный анализ

Цель спектрального анализа - разложить ряд на функции синусов и косинусов различных частот, для определения основных функций, появление которых особенно существенно и значимо. Один из способов заключается в решении задачи линейной множественной регрессии, где зависимая переменная – наблюдаемый временной ряд, а независимые переменные или регрессоры – функции синусов всех возможных (дискретных) частот. Такая модель линейной множественной регрессии может быть записана как:


Формула 1 (1)


где: k=1..q; q – общее количество всех синусов и косинусов; ak – коэффициенты при косинусах; bk – коэффициенты при синусах; лямбда – круговая частота, выраженная в радианах в единицу времени (Расчетная формула для лямбда, где Пи – константа 3.1416 и Ню = k/q).

Коэффициенты ak иbk – это коэффициенты регрессии, показывающие степень, с которой соответствующие функции коррелируют с данными. Различных синусоидальных волн столько же, сколько данных, поэтому всегда возможно полностью воспроизвести ряд по основным функциям.

Методы спектрального анализа имеют важное значение для определения скрытых периодичностей в данных. Также они полезны для проверки адекватности модели АРПСС, а именно для анализа остатков [7].


2. Искусственные нейронные сети

Нейросетевой подход является очень популярным и достаточно эффективным в решении задач прогнозирования. Нейронные сети позволяют моделировать линейные зависимости в случае большого числа переменных.

Задача прогнозирования с помощью искусственных нейронных сетей состоит в построении оптимальной нейронной сети на основе исходных данных, её обучении по различным алгоритмам, дообучении (при необходимости) и построении прогноза.

Известно, что в большинстве случаев для построения качественной сети бывает достаточно несколько сотен или тысяч наблюдений.

Обучение сети представляет собой подгонку модели, которая реализуется сетью, к имеющимся обучающим данным. Для этого используется целый ряд алгоритмов обучения сети, а именно: алгоритм обратного распространения, метод спуска по сопряженным градиентам, метод Левенберга–Маркара, метод Квази-Ньютона и другие [8].

Преимущество нейросетевого подхода – то, что он позволяет воспроизводить сложные нелинейные зависимости и выполнять прогноз на любое число шагов (соизмеримое с количеством начальных данных) [9].

Анализ данных с помощью нейронных сетей осуществлялся с помощью модуля Statistica Neural Networks (SNN) пакета STATISTICA 6.0. Для анализа использовались данные о концентрации оксида углерода (CO). Для построения нейронных сетей была выбрана топология MLP(MultiPlayer Perseptron) – многослойный персептрон. Далее по исходным данным был построен ряд сетей, имеющих указанную топологию. Оценка параметров качества и среднеквадратической ошибки для каждой сети позволила выбрать наилучшую сеть. После этого было проведено дообучение наилучшей сети различными методами (Квази-Ньютона, Левенберга-Маркара). В результате была получена сеть, архитектура которой показана на рис.2.


Рисунок 2 – Общий вид архитектуры наилучшей сети

Рисунок 2 – Общий вид архитектуры наилучшей сети


Данная сеть имеет один выход, один вход, и 20 перцептронов на промежуточном слое. На рис.3 приводятся статистические характеристики наилучшей сети.


Рисунок 3 – Статистические характеристики наилучшей сети

Рисунок 3 – Статистические характеристики наилучшей сети


Анализ статистических характеристик показывает, что коэффициент корреляции (Correlation) достаточно высок (стремится к единице), а отношение стандартного отклонения ошибки прогноза к стандартному отклонению исходных данных равно 0,354611 и ближе к 0, чем к 1. Это позволяет сделать вывод об адекватности модели, описываемой сетью.

После дообучения сети её статистические характеристики улучшились (см. рис. 4), что позволяет сделать вывод об эффективности процесса дообучения.


Рисунок 4 – Статистические характеристики дообученной сети

Рисунок 4 – Статистические характеристики дообученной сети


Попытка построения прогноза при помощи указанного метода не дает ожидаемого результата, что связано со стохастической природой данных.

В дальнейшем можно использовать нейросетевой подход, например, для анализа остатков, полученных при помощи других моделей.


3. Метод авторегрессии и проинтегрированного скользящего среднего (АРПСС)

Метод основан на использовании процессов авторегрессии и скользящего среднего [7]. Имеется три типа параметров модели: параметры авторегрессии (p), порядок разности (d), параметры скользящего среднего (q). В общепринятых обозначениях модель записывается как АРПСС (p, d, q) и может быть представлена уравнением (1):


Формула 2 (2)


где: Yt - текущее значение временного ряда; Yt-i - предшествующие значения временного ряда; a0 - свободный член; a1, a2, a3... (-1<ai<1) - параметры авторегрессии; b0 - свободный член скользящего среднего; b1, b2, b3... (-1<bi<1) - параметры скользящего среднего; Эпсилон - случайная компонента на текущем шаге моделирования; Эпсилон - случайная компонента на предыдущих шагах моделирования.

В общем виде процесс выбора модели [10] показан на рис. 5.


Рисунок 5 – Блок-схема стратегии выбора модели согласно методу Бокса-Дженкинса

Рисунок 5 – Блок-схема стратегии выбора модели согласно методу Бокса-Дженкинса


Определение общего класса моделей начинается с построения диаграмм автокорреляционной и частной автокорреляционной функций. Затем производится попытка идентификации модели исходя из вида построенных диаграмм. Далее производится экспериментальная проверка идентифицированной модели, после чего проводится оценка ее параметров (среднего квадрата остатков, значимости коэффициентов и т.д.). Следующим этапом является проверка адекватности модели, которая осуществляется посредством анализа остатков. Если модель оказывается адекватной, ее используют для краткосрочного прогнозирования, иначе осуществляется поиск альтернативных моделей.

Используя данный подход, был проведен анализ исходных данных в среде STATISTICA 6.0. Для анализа использовались данные о концентрации диоксида азота (NO2 ), полученные путем программной обработки базы данных Акиам. График исходного ряда представлен на рис. 6.


Рисунок 6 – График исходного временного ряда NO2

Рисунок 6 – График исходного временного ряда NO2


Для данного ряда были построены модели АРПСС, параметры которых подбирались в диапазоне 0<=p, q<=2, 0<=d<=1. Результаты построения моделей для исходного ряда концентраций NO2 приведены в табл. 1.


Таблица 1 – Идентификация модели динамики временного ряда NO2

p1p2dq1q2MS residualsMxDx
10,9404-0--0,000250,0024960,000242
20,99878-00,81696-0,000160,0003360,000160
30,52892 0,437680--0,000200,0014090,000198
40,054300,943390-0,14440,792140,000160,0003320,000160
5--0-0,7373-0,000930,0240170,000350
6--0-0,8856-0,56160,000600,0170510,000313
7--10,77300 0,061430,000160,0000310,000160
8--10,82139-0,000160,0000290,000160
9-0,4549-1--0,000200,0000080,000202
100,07519-10,84789-0,000160,0000310,000160
11-0,5941 -0,30601--0,000180,0000090,000184
120,075480,0008410,84823-0,000160,0000310,000160
13-0,90110,060101-0,13140,826040,000160,0000310,000159

В приведенной табл. p1, p2 – параметры авторегрессии, d – порядок разности, q1, q2 – параметры скользящего среднего, MS residuals – средний квадрат остатков, Mx – матожидание остатков, Dx – дисперсия остатков.

Анализ значимости коэффициентов pi, qi, общей ошибки модели (среднего квадрата остатков), вероятностных остатков показал, что наиболее оптимальными являются модели вида АРПСС(0, 1, 2), АРПСС(0, 1, 1), АРПСС(2, 1, 2), АРПСС(1, 1, 1), из которых была выбрана модель АРПСС(1, 1, 1). Частная автокорреляционная функция (ЧАКФ) остатков данной модели приведена на рис.7, а автокорреляционная функция остатков (АКФ) – на рис.8.


Рисунок 7 – ЧАКФ остатков

Рисунок 7 – ЧАКФ остатков


Рисунок 8 – АКФ остатков

Рисунок 8 – АКФ остатков


Из анализа АКФ и ЧАКФ видно, что все лаги не выходят за границу допустимого интервала, обозначенного на рис. 7, 8 пунктирной линией. Это позволяет сделать вывод об адекватности приведенной модели.

Кроме того, для указанной модели был построен график остатков на нормальной вероятностной бумаге (рис. 9).


Рисунок 9 – График остатков на нормальной вероятностной бумаге

Рисунок 9 – График остатков на нормальной вероятностной бумаге


Из рис. 9 следует, что остатки подчиняются нормальному закону распределения, что позволяет сделать вывод об адекватности предложенной модели.

Известно, что модели вида АРПСС(1, 1, 1) описываются уравнениями вида (3).


Формула 3 (3)


откуда получаем (4).

Формула 4 (4)


Окончательное уравнение имеет вид:


Формула 5 (5)


где: C(t) – концентрация NO2 в текущий момент времени, C(t-1) – концентрация в предыдущий момент времени, a(t-1) – значение белого шума в предыдущий момент времени, a(t) – значение белого шума в текущий момент времени. Параметры a(t) приводятся в табл. 1.

Аналогичные исследования были проведены и для других наблюдаемых веществ – оксида углерода (CO) и диоксида серы (SO2).


Планируемые результаты

В дальнейшем в работе планируется реализация следующих этапов:

  • продолжение поиска оптимальной модели прогнозирования с помощью метода АРПСС;
  • проверка адекватности полученной модели с помощью спектрального анализа, нейронных сетей и других методов;
  • разработка программного обеспечения, реализующего прогностическую модель;
  • разработка экологического портала г. Макеевка и размещение на нем модуля прогнозирования загрязнения атмосферного воздуха.

Заключение

Данная магистерская работа посвящена важнейшей проблеме прогнозирования загрязнения атмосферного воздуха. В результате выполнения работы будет получена модель процесса загрязнения атмосферы и разработано соответствующее программное обеспечение. Особенностью работы является то, что данные для исследования снимаются на автоматизированных постах Донецка и Макеевки. Поскольку климатические условия в пространстве изменяются незначительно, модель может быть адаптирована и для других близлежащих городов Украины.

В заключение следует отметить, что проблема загрязнения атмосферного воздуха одна из самых острых экологических проблем. Поэтому прогнозирование загрязнения атмосферы должно использоваться для осуществления снижения выбросов и, как следствия, уменьшения загрязнения атмосферного воздуха.



Литература

1. Впровадження нового механізму видачі дозвільних документів з викидів забруднюючих речовин в атмосферне повітря / Під. ред. С.В.Третьякова. — Донецьк: Державне управління екології та природних ресурсів у Донецькій області, Донецька філія Державного закладу «Державний екологічний інститут Мінприроди України», 2006. — 196 с.

2. Сонькин Л.Р. Синоптико-статистический анализ и краткосрочный прогноз загрязнения атмосферы. – Л.: Гидрометеоиздат.1991. – 250с.

3. Современные подходы к проведению расчетов загрязнения атмосферы [Электронный ресурс] : www.mgo.rssi.ru/l_model/air8.html

4. Методика расчета концентраций в атмосферном воздухе вредных веществ, содержащихся в выбросах предприятий. ОНД-86.: Госкомгидромет. 1986. – 68с.

5. Берлянд М.Е. Прогноз и регулирование загрязнения атмосферы. – СПб.: Гидрометеоиздат. 1985. – 272с.

6. Интеграл – все для экологов [Электронный ресурс]: www.integral.spb.su/index.php

7. Боровиков В.П. Прогнозирование в системе Statistica в среде Windows. / В.П.Боровиков, Г.И.Ивченко – М.: Финансы и статистика. 1999. – 382 с.

8. Хайкин С. Нейронные сети: полный курс, 2-е издание: Пер. с англ. – М.: Вильямс, 2006. – 1104с.

9. Боровиков В. STATISTICA для профессионалов. – СПб.: Питер. 2003. – 688с.

10. Бокс Дж. Анализ временных рядов. Прогноз и управление. / Дж.Бокс, Г.Дженкинс – М.: Мир, 1994. - 402с.



Примечание

При написании данного автореферата магистерская работа еще не завершена. Окончательное завершение - 1 декабря 2009 г. Полный текст работы и материалы по теме могут быть получены у автора или его руководителя после указанной даты.

Автобиография   Библиотека   Ссылки   Отчет о поиске   Индивидуальный раздел
  ДонНТУ  Портал магистров ДонНТУ UKR ENG