Библиотека
URL http://library.mephi.ru/data/scientific-sessions/2006/n2/2-1-1.doc

О.А. АГАПКИН, С.А. ДОЛЕНКО, И.Г. ПЕРСИАНЦЕВ,
С.А. ШАРОВ

НИИ ядерной физики им. Д.В. Скобельцына
московского государственного университета им. М.В. Ломоносова

 

АДАПТИВНАЯ АВТОМАТИЧЕСКАЯ

СИСТЕМА ПРОГНОЗИРОВАНИЯ ПРОДАЖ

 

Рассматривается самообучающаяся нейросетевая система прогнозирования продаж. Обсуждаются преимущества и недостатки нейросетевых алгоритмов для использования при прогнозировании продаж.

 

Введение. Прогнозирование продаж всегда играло важную роль в бизнесе. Чем выше точность прогнозирования, тем более оптимально можно спланировать закупки сырья и комплектующих, загрузку производственных и транспортных линий, аренду складских помещений и другие важные и дорогостоящие для компаний процессы.

В настоящее время для прогнозирования продаж менеджеры используют, как правило, различные статистические методы, реализованные в пакетах Excel, SPSS, Minitab, Eviews и других. Чаще других используются алгоритмы, основанные на регрессии [3], на сглаживании (методы Хольта, Винтерса) [3] и авторегрессионные методики Бокса-Дженкинса (модели ARIMA) [1, 2, 3]. Эти методики осуществляют прогнозирование временного ряда на основании только той информации, которая содержится в его исторических данных. Очевидно, что это является серьезным недостатком этих алгоритмов, т.к. существует много сторонних параметров, влияющих на продажи (например, реклама, цена, экономическая ситуация, активность конкурентов и многое другое). Конечно, есть модели многомерной регрессии и модификации некоторых описанных выше алгоритмов, которые позволяют учитывать внешние факторы, но они недостаточно гибки.

Нейронные сети выгодно отличаются от статистических методов в первую очередь тем, что освобождают от необходимости задавать математическую модель процесса, а также позволяют учитывать произвольное количество внешних факторов.

Описание проблемы. Прогнозирование продаж для современных FMCG (Fast Moving Consumer Goods) компаний имеет огромное значение и сопряжено с большими рисками. Заниженные прогнозы приводят к недополученной прибыли, завышенные оборачиваются либо затратами на использование складских помещений (если продукт имеет длительный срок хранения), либо прямыми потерями и тратами на утилизацию, когда у нереализованного продукта заканчивается срок хранения.

Российское представительство крупной западной FMCG компании продает на российском рынке продукты питания с небольшим сроком хранения. Компания имеет на территории России свое производство. В предлагаемом ассортименте постоянно несколько десятков продуктов, которые распространяются через региональные представительства, которых, в свою очередь, около 100. Для планирования производства компанию интересуют еженедельные прогнозы продаж на срок 4-10 недель вперед от текущей недели для каждого продукта в каждом регионе. Общее количество прогнозов, которые должны автоматически генерироваться каждую неделю, порядка 2000-5000. В компании имеется историческая информация о продажах, заказах и возвратах в виде транзакций с 2001 года. Имеется также информация о всех проведенных рекламных компаниях.

Декомпозиция временных рядов. Хорошо известно, что различные сторонние факторы по-разному влияют на прогнозируемую величину. Например, проведение рекламной промо-акции «на 30 % больше продукта по той же цене», скорее всего, увеличит продажи сразу же, но, как только акция будет закончена, произойдет заметный спад продаж. В то же время обычная телереклама скорее поддерживает узнаваемость продукта, и даже когда она заканчивается, люди все еще «лояльны» этому продукту; спад продаж после длительной телерекламы будет постепенным и очень медленным.

Существуют факторы, имеющие явную сезонную природу. Например, во время праздников резко возрастают продажи некоторой алкогольной продукции; мороженое и пиво лучше продаются летом, чем зимой и т.д. При этом такая сезонность может быть для разных факторов разной по временным масштабам, от нескольких часов до нескольких лет.

Для корректного прогнозирования с учетом различных внешних факторов используют декомпозицию временных рядов [3]. Смысл декомпозиции состоит в том, что прогнозируется не сам временной ряд X, а его составляющие. Обычно выделяют несколько составляющих:

·      Трендовая (T) - это компонента, представляющая основной рост (или спад) во временном ряду.

·      Сезонная (C) - компонента, представляющая вариации временного ряда с выраженной сезонной составляющей.

·      Нерегулярная поправка (W) - представляет труднопредсказуемые, а порой случайные флуктуации в исходном прогнозируемом ряду.

После того, как спрогнозированы отдельные составляющие, они объединяются в общий прогноз временного ряда. В описываемой системе используется по выбору один из двух вариантов декомпозиции:

аддитивный

и мультипликативный

Для выделения компонент временного ряда используется экспоненциальное сглаживание:

где  – текущее значение компоненты временного ряда;  – следующая по времени значение компоненты;  – текущее значение исходного временного ряда;  – постоянная сглаживания .

В описываемой системе выделялась трендовая компонента (T, ); сезонная компонента (S, ) и нерегулярная (W).

Система прогнозирования. После проведения декомпозиции каждая компонента прогнозируется отдельно от других. Схема прогнозирования показана на рис. 1.

 

 

Рис. 1. Блочная система суперкомитета. Каждая временная составляющая ряда

продаж (трендовая, сезонная, недельная) прогнозируются отдельно

Каждая компонента прогнозируется отдельным комитетом, состоящим из произвольного количества предикторов (экспертов). В западной литературе такой метод иногда называют экспертным. Предикторами внутри комитета могут быть не только нейронные сети, но и статистические алгоритмы (ARIMA, методы Винтерса, Хольта, регрессионные и «наивные» модели). На текущий момент в системе реализованы только нейросетевые модели. Система отслеживает качество работы сетей каждого комитета на новых данных. По этой точности определяется вес каждой нейросети в комитете, и в будущем он будет учитываться при построении прогнозов (рис. 2).

 

 

Рис. 2. Качество работы каждой сети определяет вес, с которым эта сеть будет

использоваться в ближайшем будущем

 

Такая разнородность и адаптивность комитета (статистические методы, нейронные сети разных архитектур) позволяет получать устойчивые прогнозы в самых разных условиях.

Каждая сеть для обучения и построения прогнозов использует свой собственный комплект входных переменных, причем входы у сетей одного комитета могут быть различными, что увеличивает устойчивость работы системы.

 

 

 

 

Список литературы

 

1.    Box G.E.P. and Jenkins G.M. “Time series analysis: Forecasting and control”, San Francisco: Holden-Day, 1970.

2.    Makridakis S., Wheelwright S.C., and Hyndman R.J. “Forecasting: methods and applications”, New York: John Wiley & Sons, 1998.

3.    Ханк Д.Е., Райтс А.Д., Уичерн Д.У. “Бизнес-прогнозирование”, Вильямс, 2003.

4.    Specht D.F. “A Generalized Regression Neural Network”, IEEE Transactions on Neural Networks, v.2, N 6, Nov. 1991, 568-576.

5.    Hassoun M.H. “Fundamentals of Artificial Neural Networks”, A Bradford book, The MIT Press Cambridge Massachusetts, 1995.

Вверх