Прогнозирование временных рядов по средствам развития нейронных сетей путем использования генетического алгоритма и дифференциальной эволюции

Авторы: Х. Перальта, С.Д. Ли, Г. Гутьеррес, А. Санчис
Источник: Перальта Х. Прогнозирование временных рядов по средствам развития нейронных сетей путем использования генетического алгоритма и дифференциальной эволюции / Перальта Х., Ли С.Д., Гутьеррес Г., Санчис А. // Всемирный конгресс по вычислительному интеллекту 18–23 июля 2010 года – Барселона, Испания.

Введение

Для того чтобы приобрести знания, необходимо знать как будет выглядеть будущее, т.е. необходимо прогнозировать будущее из прошлого. Прогнозирование временных рядов является неотъемлемой частью исследований из-за его эффективности в жизни человека. Эта такая дисциплина, которая с каждым днём все чаще применяется в таких областях, как планирование, управление, производство, техническое обслуживание и контроль производственных процессов, экономика и прогнозирование погоды.

Задача прогнозирования может осуществляться путем использования нескольких технологий, таких как статистические методы [1], и другие методы основанные на вычислительном интеллекте, подобно иммунной системе [2] и искусственным нейронным сетям (ИНС) [3].

ИНС обеспечивают методологию для решения многих типов нелинейных задач, которые трудно решить с помощью традиционных методов. Большинство временных рядов часто демонстрируют процессы временной и пространственной изменчивости, и сталкиваются с проблемой нелинейности физических процессов, проблемой пространственного и противоречивого временного масштаба и неопределенностью оценочных значений параметров. ИНС имеют возможность получить взаимосвязь между входными и выходными процессами, если такая связь физически явно не предусмотрена. Таким образом, эти свойства ИНС хорошо подходят для решения проблемы прогнозирования временных рядов.

В данной статье рассматривается методология проведения автоматического проектирования ИНС и задачи прогнозирования, которые ссылаются на набор временных рядов [4]. Задача будет состоять из прогнозирования нескольких временных рядов, не для всех из них будут использоваться одинаковые ИНС, для выбора разных ИНС по прогнозированию каждого временного ряда будет применяться автоматический метод.

Будут выполнены два разных действия, как было описано в более ранней работе[5], чтобы получить прогноз ИНС для каждого временного ряда. Первый этап будет состоять из установки структуры искусственной нейронной сети, которая будет решать задачи прогнозирования (многослойного Персептрона), и алгоритма обучения, используя (обратное распространение).

На втором этапе конструкция ИНС будет готова, установка значений параметров ИНС, т.е. количество входных узлов, число скрытых узлов, скорость обучения для обратного распространения и, наконец, все соединения весов. Эти параметры установлены путем проведения процесса поиска, выполняемый двумя разными эволюционными алгоритмами, генетическим алгоритмом (ГА) и алгоритмом дифференциальной эволюции (ДЭ).

Статья организована следующим образом. В разделе 2 рассматривается работа связанная с тем, как решить задачу прогнозирования с помощью ИНС и проектирование ИНС с помощью эволюционных вычислений. В разделе 3 объясняется как системное проектирование ИНС с помощью ГА и ДЭ позволит предсказать временной ряд. В 4 разделе демонстрируются экспериментальные настройки и результаты. И наконец, выводы и перспективы на будущее описаны в разделе 5.

2 Работа по теме

2.1 Временной ряд и искусственные нейронные сети

Несколько работ не только информационных исследований, но и статистики были решены прогнозированием временных рядов на основе ИНС.[1] Это показывает полное рассмотрение ИНС (как данных управляемых обучающей машиной) в теории прогнозирования[6].

Перед использованием ИНС для прогнозирования, она должна быть спроектирована, т.е. созданы подходящие значения для каждой степени свободы ИНС [7] (вид сети, количество входных узлов, число выходов нейронов, количество скрытых слоев, число скрытые нейронов, взаимосвязь одного узла с другим, подключение весов, и т.д.). Процесс проектирования это больше чем "искусство" на основе тестов, ошибок и опыта человека-проектировщика, а не просто алгоритм. В работе [6] Чжан, Пэтууо и Ху представляют "состояние искусства" ИНС в задаче прогнозирования, в [8] предложен "обширный модельный подход" для рассмотрения несколько конструкций из ИНС.

Проблема прогнозирования временных рядов с ИНС рассматривается как моделирование взаимосвязи стоимости элемента времени "t"(за счет этого сеть будет иметь только один выходной нейрон) и значений предыдущих элементов временного ряда (t-1, t-2,.., t-k), чтобы получить функцию, как это показано ниже:

2.2 ИНС и эволюционные вычисления

В нескольких работах рассматривается метод получения структуры ИНС автоматическим способом, среди них есть такие работы, в которых используются эволюционные вычисления(ЭВ). Эти вычисления показывают, что процесс поиска осуществляемый с помощью эволюционных методов позволяет получить хорошие результаты[9,10,11,12,13].

Некоторые из них используют прямое кодирование схем (DES) [9,10], другие используют косвенное кодирование схем (IES) [11,12,13]. Для DES хромосома содержит информацию о параметрах топологии, архитектуру, параметры обучения и др. параметры искусственной нейронной сети. В IES хромосома содержит необходимую информацию, чтобы конструктивный метод породил топологию (или архитектуру) искусственной нейронной сети. Авраам [14] показывает автоматическую структуру оптимизации ИНС для получения адаптивного пути, Синь ЯО и др. [15] пытаются сформулировать будущее тенденций в отрасли. Всего в нескольких исследованиях были использованы ИНС и ДЭ для создания гибридной системы прогнозирования временных рядов[16,17].

3 Проектирование ИНС с помощью ГА и ДЭ

3.1 Схема обучения набора

Для того чтобы получить одну ИНС для прогнозирования значений временных рядов, первым делом необходимо правильно составить исходные значения временных рядов, т.е. нормализовать данные. Когда ИНС получает значения, выполняется обратный процесс, чтобы оценить прогноз, который осуществляется с помощью ИНС. Этот шаг важен, так как ИНС работает с реальными данными, которые изменяются от 0 до 1 и представляются как входные значения.

Кроме того, известные значения временного ряда преобразуются в установочный набор, зависящий от kвходных узлов каждой ИНС произведенной в процессе поиска, выполняемый ГА и ДЭ. Следовательно, каждый набор состоит:

к входных значений, которые соответствуют "k" нормализованным предыдущим значениям периода t: a_t-1, a_t-2, …, a_t-k ;
одно выходное значение, которое соответствует нормализованному значению временного ряда периода t.

Этот набор будет использоваться для обучения и проверки каждой ИНС, созданной в период выполнения ГА и ДЭ. Итак, набор данных будет разделен на два подмножества (тренировочное и проверочное). Первые х% из общего набора данных сгенерирует тренировочное подмножество, а проверочное подмножество будет получено из остального полного набора данных.

3.2 Проектирование искусственных нейронных сетей с помощью генетического алгоритма

Проблему проектирования ИНС можно рассматривать как проблему поиска всех возможных ИНС в пространстве. Кроме того, поиск может быть выполнен генетическим алгоритмом [18] используя эксплуатацию и исследования.

пространство решений, какая информация сети будет установлена заранее, и что входит в хромосомы;
как каждое решение закодировано в хромосоме, т.е. схема кодирования;
для чего осуществляется поиск, составление фитнес функции.

При таком подходе был выбран многослойный персептрон (МП) в качестве вычислительной модели, благодаря его приближенным возможностям, полной связью (МП) только в скрытом слое, и алгоритмом обратного распространения в качестве алгоритма обучения.[19] Это связано с тем, что ИНС имеет только один скрытый слой, поэтому быстрее обучаются и легче работает, чем при наличии двух или более скрытых слоев многослойного персептрона.

Как было упомянуто ранее проектирование ИНС выполняется посредствам установки значений параметров ИНС. В случае, когда многослойный персептрон состоит из одного скрытого слоя и в качестве алгоритма обучения использует алгоритм обратного распространения параметрами являются: число входных узлов, число скрытых нейронов, число выходных нейронов(только один, он устанавливается путем прогнозирования проблемы), как соединяются узлы, и целый множество соединительных весов(выполняется путем использования первоисточника для инициализации подключения весов, как это будет объяснено позже).

Для нашего подхода [5], чтобы спроектировать ИНС для прогнозирования временного ряда была рассмотрена прямая схема кодирования для полного соединения многослойного персептрона. Для данной прямой схемы кодирования информация размещенная в хромосоме будет: два десятичных знака, т.е. два гена, для того чтобы зашифровать число входных узлов (i), другие два для количества скрытых узлов (h), ещё два для коэффициента обучения (?), и последние 10 генов для инициализации значимости первоисточника соединительных весов(s). Таким образом, значения «i», «h», «?» и «s» получаются из хромосомы, как указано ниже:

Процесс поиска ГА состоит из следующих шагов:

В процессе обучения будет рассчитываться минимальная ошибка проверки значения фитнес функции для каждой особи.

Параметрами ГА являются: численность популяции – 50; максимальное количество поколений –100; процент элиты(лучшие особи, которые остаются неизменными до следующего поколения) – 10%; кроссинговер(родители делятся в одной случайно выбранной точке, потомство получается путем обмена противоположными частями хромосом родителей); вероятность мутации.

Как только Г.А. достигает последнего поколения, лучшие особи (т.е. ИНС) из последнего поколения используется для прогнозировать будущее (и неизвестные) значения временного ряда. Будущие неизвестные значения (a_t+1) будут прогнозироваться используя kпредыдущих известных значения (a_t, a_t-1, …, a_t-k) k – число входов ИНС, полученных после выполнения ГА. Для прогнозирования несколько последовательных значений (a_t+1, a_t+2,…) всё время прогнозируется новое значение, которое будет включено в предыдущие новые значения, установленного временного ряда и используется для прогнозирования следующего.

4 Экспериментальная настройка и результаты

4.1 Временные ряды

Пять временных рядов будут использоваться для оценки нашего метода. Эти временные ряды названы Пассажиры, температура, индекс Доу-Джонса, Квебек, и Mackey-Glass [23] . Пассажиры – временной ряд содержит информация о количестве пассажиров международной авиакомпании в тысячах, измеряется ежемесячно с января 1949 года по декабрь 1960, источник Box & Jenkins (1976) .Температура – временной ряд показывающий значение среднемесячной температуры воздуха оцениваются по Ноттингемскому замку с 1920 до 1939, в этом случае источником является О.П. Андерсон (1976) . Доу-Джонса – ежемесячные показатели индекса Dow-Jones с августа 1968 года по август 1981 года, источник является Hipel и Маклеод (1994). Квебек представляет число родившихся в день измеренных в Квебеке с 1 Января 1977 года по 31 декабря 1978 года. И последний временной ряд называется Mackey-Glass основан на Mackey-Glass дифференциального уравнения. Эта серия является хаотичным временным рядом генерируется из времени задержки обыкновенных дифференциальных уравнений.

4.2 Экспериментальная установка

Значения временных рядов должны быть масштабированы, в численные значения лежащие в диапазоне [0,1], учитывая не только известные значения, но будущие значения (тех, которые будут прогнозироваться).

Таким образом, верхний и нижний пределы для нормализации не могут быть только максимальными и минимальными значениями временных рядов. Граница от максимума и минимума должна быть установлена, если в будущие значения были выше или ниже, чем значения уже известные. Этот запас будет зависеть от другого параметра (Prct_inc). В таких случаях когда временной ряд является стационарным значение параметра (Prct_inc) = 10% достаточно, но в тех случаях, когда временной ряд увеличивается или уменьшается, значение параметра (Prct_inc) по меньшей мере будет составлять 50%. Поэтому новые значения, полученные в выходе ИНС, могут быть в числовом диапазон [0,1]. Это уравнение (5) показывает, как получаются max4norm и min4norm.

4.3 ГА против ДЭ

Оба способа прогнозирования временных рядов, т.е. обе гибридные системы (одна из которых с использованием ГА, а другая с использованием ДЭ) были выполнены 5 раз (с максимальным числом поколений = 200) для каждого временного ряда. Для каждого временного ряда показан средний результат ( и стандартное отклонение) пяти симуляций.

Прогнозируемые значения (т.е. набор данных для тестирования, а не тренировочный или проверочный набор) сравниваются с реальными значениями для оценки погрешности каждого метода. При этом используются два вида ошибок прогнозируемых значений: MSE(среднеквадратическая ошибка); SMAPE(симметричная средняя абсолютная ошибка в процентах)[4]. SMAPE была использована в конкурсах прогнозирования NN3 и NN5. Результаты приведены в таблицах I и II.

В таблице I, показаны результаты, полученные для временных рядов Пассажиры, Температура, Dow-Jones, Квебек и Mackey-Glass при максимальном числе поколений = 100. В таблице II, показаны результаты, полученные для временных рядов Пассажиры, Температура, Dow-Jones, Квебек и Mackey-Glass при максимальном числе поколений = 200.В столбцах этих таблиц показаны: MSE и SMAPE ошибки прогнозирования для каждого временного ряда. Эти ошибки были получены путем усреднения результатов пяти экспериментов, выбрав из каждого эксперимента в последнем поколении наилучшие значения для алгоритмов ГА и ДЭ.

Как видно из таблицы I, применяя алгоритма ДЭ вместо ГА нельзя добиться высокого результата прогнозирования, сравнивая значение ошибок (MSE/SMAPE) в большинстве временных рядов, когда эксперимент был выполнен для 100 поколений. Только во временных рядах Mackey-Glass и Температуры алгоритм ДЭ получил лучший результат ошибки SMAPE, чем алгоритм ГА. В случае с временным рядом Mackey-Glass результат лучше на 2,6%.

Но если эксперимент выполнять с числом поколений = 200, как показано в таблице II, можно наблюдать значительное улучшение работы алгоритма ДЭ почти во всех временных рядах. Алгоритм ДЭ дает более точные прогнозы, чем ГА в 4 из 5 временных рядов. Только во временном ряде Квебек результат алгоритма ГА все же лучше, чем ДЭ хотя оба результата близки. Следует уделить особое внимание временному ряду Mackey-Glass в котором ошибка SMAPE = -3.774%,из этого следует, что значения, полученные благодаря прогнозу почти идентичны реальным значениям временного ряда.

То, что результаты полученные после выполнения алгоритма ДЭ лучше, чем результаты полученные после ГА, при выполнении эксперимента для 200 поколений можно объяснить тем, что в ДЭ больше вариантов популяций(т.к. решение не сходится заранее). Это приводит к более разнообразному поиску в пространстве решений.

Для того, чтобы получить хорошее представление о прогнозах для каждого временного ряда и как можно ближе ознакомиться с реальными значениями каждого метода прогнозирования, на рисунках будут изображены графики для каждого временного ряда с указанием метода прогнозирования. На рисунке 2 изображен прогноз для временного ряда Пассажиры для двух методов. На 3 рисунке показан временной ряд Температура, на 4 Dow-Jones, на 5 Квебек, на 6 Mackey-Glass.

5 Выводы и перспективы на будущее

По результатам эксперимента можно сделать вывод о том, что при использовании ДЭ вместо ГА можно получить разные результаты, всё зависит от того с каким числом поколений они выполняются. При числе поколений = 100 алгоритм ДЭ не сильно улучшает результаты по сравнению с ГА. А если число поколений достигло 200, то можно наблюдать значительное улучшение результатов на 4,3%, как это происходит с временным рядом Mackey-Glass.

Как было написано выше, результаты полученные после выполнения алгоритма ДЭ лучше, чем результаты полученные после ГА, при выполнении эксперимента для 200 поколений можно объяснить тем, что в ДЭ больше вариантов популяций(т.к. решение не сходится заранее). Это приводит к более разнообразному поиску в пространстве решений.

Итак, это полностью автоматический метод, для него не нужны предварительные знания от пользователя. Поэтому пользователю не обязательно надо быть экспертом во временных рядах, статистике, математике и вычислительном интеллекте. Пользователю просто необходимо задать значения временного ряда, для которого он хочет получить прогноз, количество прогнозируемых значений; и этот метод вернет результат пользователю.

Этот подход был представлен в качестве автоматического метода проектирования ИНС на конкурсе NN5 и получил 6 место с ошибкой SMAPE = 21,9% в нейронных сетях и методах искусственного интеллекта (НСИН). Лучший результат рейтинга НСИН получил Autobox сервис [24] на основе методологии прогнозирования Box-Jenkins, который снизил ошибку до 19,0%.

В будущих работах с дополнительными временными рядами, похожими по характеристикам на Квебек и Mackey-Glassа можно получить более точные выводы о влиянии использования ДЭ вместо ГА.

С другой стороны, было бы действительно интересно попробовать улучшить систему, например: вместо случайных Xr0, использовать лучшее (т.е. те у которых самая лучшая фитнес функция); или вместо одного отличия (т.е. X_r1-X_r2), использовать больше векторов и больше значений, например (X_r1-X_r2+X_r3-X_r4).

В других работах можно использовать перекрестную проверку в ГА, для того, чтобы лучше оценивать особь или использовать ИНС, чтобы попытаться улучшить прогноз для получения точной системы.

100 Поколений		ГА	ДЭ
Пассажиры	SMAPE (%)	3.180	3.358
Пассажиры	MSE	0.00061	0.00065
Температура	SMAPE (%)	4.308	3.907
Температура	MSE	0.00358	0.00294
Dow-Jones	SMAPE (%)	6.662	8.188
Dow-Jones	MSE	0.02150	0.03229
Квебек	SMAPE (%)	12.643	13.739
Квебек	MSE	0.02540	0.02662
Mackey-Glass	SMAPE (%)	8.672	5.988
Mackey-Glass	MSE	0.00363	0.00175

200 Поколений		ГА	ДЭ
Пассажиры	SMAPE (%)	3.148	3.118
Пассажиры	MSE	0.00058	0.00058
Температура	SMAPE (%)	4.239	3.907
Температура	MSE	0.00347	0.00294
Dow-Jones	SMAPE (%)	6.307	5.810
Dow-Jones	MSE	0.01993	0.01735
Квебек	SMAPE (%)	12.121	13.682
Квебек	MSE	0.02149	0.02663
Mackey-Glass	SMAPE (%)	8.042	3.744
Mackey-Glass	MSE	0.00309	0.00064

Прогнозирование временных рядов по средствам развития нейронных сетей путем использования генетического алгоритма и дифференциальной эволюции

Введение

2 Работа по теме

2.1 Временной ряд и искусственные нейронные сети

2.2 ИНС* и эволюционные вычисления*

3 Проектирование ИНС с помощью ГА и ДЭ

3.1 Схема обучения набора

3.2 Проектирование искусственных нейронных сетей с помощью генетического алгоритма

Рисунок 1 – Проетирование ИНС с помощью ГА

4 Экспериментальная настройка и результаты

4.1 Временные ряды

4.2 Экспериментальная установка

4.3 ГА против ДЭ

Таблица I. Значения ошибок при количестве поколений = 100

Таблица II. Значения ошибок при количестве поколений = 200

Рисунок 2 – Прогнозирование временного ряда Пассажиры с помощью ГА и ДЭ

Рисунок 3 – Прогнозирование временного ряда Температура с помощью ГА и ДЭ

Рисунок 4 – Прогнозирование временного ряда Dow-Jones с помощью ГА и ДЭ

Рисунок 5 – Прогнозирование временного ряда Квебек с помощью ГА и ДЭ

Рисунок 6 – Прогнозирование временного ряда Mackey-Glass с помощью ГА и ДЭ

Рисунок 7 – Увеличенный график прогнозирования временного ряда Квебек с помощью ГА и ДЭ

Рисунок 8 – Увеличенный график прогнозирования временного ряда Mackey-Glass с помощью ГА и ДЭ

5 Выводы и перспективы на будущее

Список источников

Прогнозирование временных рядов по средствам развития нейронных сетей путем использования генетического алгоритма и дифференциальной эволюции

Введение

2 Работа по теме

2.1 Временной ряд и искусственные нейронные сети

2.2 ИНС и эволюционные вычисления

3 Проектирование ИНС с помощью ГА и ДЭ

3.1 Схема обучения набора

3.2 Проектирование искусственных нейронных сетей с помощью генетического алгоритма

Рисунок 1 – Проетирование ИНС с помощью ГА

4 Экспериментальная настройка и результаты

4.1 Временные ряды

4.2 Экспериментальная установка

4.3 ГА против ДЭ

Таблица I. Значения ошибок при количестве поколений = 100

Таблица II. Значения ошибок при количестве поколений = 200

Рисунок 2 – Прогнозирование временного ряда Пассажиры с помощью ГА и ДЭ

Рисунок 3 – Прогнозирование временного ряда Температура с помощью ГА и ДЭ

Рисунок 4 – Прогнозирование временного ряда Dow-Jones с помощью ГА и ДЭ

Рисунок 5 – Прогнозирование временного ряда Квебек с помощью ГА и ДЭ

Рисунок 6 – Прогнозирование временного ряда Mackey-Glass с помощью ГА и ДЭ

Рисунок 7 – Увеличенный график прогнозирования временного ряда Квебек с помощью ГА и ДЭ

Рисунок 8 – Увеличенный график прогнозирования временного ряда Mackey-Glass с помощью ГА и ДЭ

5 Выводы и перспективы на будущее

Список источников

2.2 ИНС* и эволюционные вычисления*