Прогнозирование пассажирских перевозок на основе обработки временных рядов

В.Г.Дубинина

Источник: http://www.cognitive.ru/innovation/sbornic6/index.htm

В библиотеку

Рассматривается проблема прогнозирования пассажиропотоков, анализируется возможность использования для этих целей временных рядов с явно выраженной сезонной составляющей.

Исследование динамики социально-экономических явлений, выявление и характеристика основной тенденции развития и моделей взаимосвязи дают основание для прогнозирования – определения будущих размеров уровня экономического явления.

В отличие от предприятий, для которых величину конечного продукта можно определить, исходя из наличия сырья и материалов, а также норм расхода этих материалов при производстве конкретных изделий, в любой авиакомпании этот процесс несколько затруднен из-за присутствия субъективного фактора – желания пассажира воспользоваться услугами именно авиакомпании (а не каким-либо другим видом транспорта). Кроме того, на рынке авиаперевозок имеется огромное число авиакомпаний, и за пассажиром остается право выбора. Поэтому для определения объема конечного продукта – пассажиропотока авиакомпании – строится прогноз на будущие периоды[1].

Прогнозирование объемов пассажирских перевозок (как долгосрочное, так и краткосрочное) является для современной авиакомпании одним из аспектов управленческой деятельности. При долгосрочном прогнозировании учитываются тенденции мирового рынка авиаперевозок, которые находят отражение в увеличении или уменьшении частот рейсов на различных направлениях при составлении расписания полетов. Краткосрочное прогнозирование позволяет оперативно отреагировать на изменение ситуации на рынке авиаперевозок и выстроить стратегию авиакомпании, исходя из предполагаемого объема пассажиропотока (например, изменить степень «агрессивности» бронирования, подготовить и провести специальные акции по привлечению пассажиров и т.д.).

Одним из вариантов формирования прогноза объемов пассажирских перевозок является прогнозирование на основе обработки временных рядов, которое позволяет получить весьма надежные результаты [2]. Основой прогнозирования при использовании временных рядов является метод перспективной экстраполяции, которую, однако, надо рассматривать только как начальную стадию построения окончательных прогнозов, т.к. чисто механическое использование экстраполяции может стать причиной значительных ошибок и неправильных выводов.

Применение метода экстраполяции для прогнозирования предполагает, что закономерность, действующая в прошлом, сохранится и в прогнозируемом периоде, но при этом ожидается, что общая тенденция развития перевозок в авиакомпании не должна претерпевать серьезных изменений в будущем (например, параметры расписания должны оставаться относительно стабильными), т.к. теоретической основой распространения тенденции на будущее является свойство инерционности, которое позволяет выявлять сложившиеся взаимосвязи между уровнями временного ряда. Но это справедливо только при построении краткосрочных прогнозов, поскольку за короткий период условия развития явления и характер его динамики не успевают сильно измениться. При долгосрочных прогнозах динамичность процессов вступает в противоречие с инерционностью их развития, поэтому в этих случаях метода экстраполяции недостаточно.

Построение прогнозов является самым последним этапом анализа временных рядов. Общая последовательность этапов анализа временных рядов следующая:

графическое представление и описание поведения ряда;

выделение и исключение регулярных составляющих ряда, зависящих от времени;

подбор математической модели для описания регулярной составляющей и проверка ее адекватности;

прогнозирование будущих значений ряда.

При анализе временных рядов принято выделять две составляющие: регулярную и случайную. Регулярная составляющая в свою очередь включает в себя тренд и сезонную компоненты. Тренд характеризует основную тенденцию развития временного ряда, сезонная компонента определяет колебания, периодически повторяющиеся в некоторое определенное время каждого года. Взаимодействие между собой регулярных составляющих может быть представлено как аддитивная или мультипликативная комбинация:

( аддитивная форма)

( мультипликативная форма)

где Y (t) – значение уровня в момент t,

T (t) – тренд, выбираемый из параметрического семейства,

S (t) – периодическая компонента (сезонная волна),

err – ошибка аппроксимации.

Аддитивная модель характеризуется главным образом тем, что характер сезонных колебаний остается постоянным. В мультипликативной модели характер сезонных флуктуаций остается постоянным только по отношению к тренду и их величина зависит от значений временного ряда.

На рис.1 представлены данные об объемах пассажирских перевозок в авиакомпании с 1996 по 2000г. Из графика хорошо видно, что объем пассажиропотока имеет во времени возрастающий тренд и в ряде имеется ежегодно повторяющаяся закономерность – сезонность. Пик перевозок из года в год приходится на август, минимальный пассажиропоток – на февраль. Структура перевозок по месяцам сохраняется каждый год, т.е. период сезонности равен 12.

После того как установлено наличие тенденции, необходимо подобрать уравнение тренда. В нашем случае речь идет о линейном тренде, который описывается следующим уравнением прямой:

,

где – сглаженные (расчетные) уровни исходного временного ряда;

k, b – подлежащие определению зависимые переменные уравнения прямой;

t – независимая переменная ( время ).

Зависимые переменные в уравнении определяются по методу наименьших квадратов из системы уравнений:

,

где Qt – уровни исходного ряда;

t – независимая переменная (время);

n – число уровней ряда.

Решение системы относительно искомых параметров:

и

Упрощенный вариант расчета параметров уравнения заключается в переносе начала координат в середину ряда. При этом упрощаются сами нормальные уравнения, кроме того, уменьшаются абсолютные значения величин, участвующих в расчете. При нечетном числе уровней ряда такое преобразование производится следующим образом: t = …, -3, -2, -1, 0, 1, 2, 3, … При четном – t =…, -5, -3, -1, 1, 3, 5, …

Тогда a t = 0 и система уравнений будет иметь вид:

откуда и .

На рис.1 для исходного временного ряда приведен линейный тренд и его уравнение.

Рис.1 Распределение объемов пассажирских перевозок

Кроме линейного тренда, монотонное возрастание или убывание тренда характеризуют функции: параболическая, степенная, экспоненциальная, логарифмическая линейная, логарифмическая парабола, гиперболическая (для убывающих процессов). Кроме того, для временных рядов, стремящихся к некоторой предельной величине, применяются логистические функции.

Теперь перейдем к определению сезонной волны, которая представляет из себя совокупность сезонных индексов. Наиболее распространенными при определении сезонных индексов методами являются следующие[1]:

Методы, основанные на применении средней арифметической или средней геометрической (метод отношений средних помесячных к средней за период, метод отношений помесячных уровней к средней данного года). При аддитивной форме временного ряда в расчете принимают участие среднее арифметические, при мультипликативной – среднее геометрические.

Методы, основанные на применении аналитического выравнивания (выравнивания по прямой, выравнивание по параболе и экспоненте, выравнивание по ряду Фурье).

Ниже приведены примеры расчетов сезонных волн по методу средней и по методу выравнивания по прямой.

Расчет по методу средней применяется в тех случаях, когда временной ряд не содержит ярко выраженной тенденции в развитии. Сезонные волны вычисляются непосредственно по эмпирическим уровням ряда без их предварительного выравнивания. Рассчитываются по нескольким годам средние значения уровней ряда для каждого месяца ` . Затем по вычисленным помесячным средним уровням определяется общий средний уровень .

Далее рассчитываем по месяцам индексы сезонности:

для аддитивной формы, для мультипликативной формы.

Пример расчета сезонных индексов приведен в табл.1.

Таблица 1

Месяц

Объемы перевозок

Индекс сезонности

1996

1997

1998

1999

2000

Среднее арифм.

Среднее геом.

Аддитивная форма

Мультипли-кативная форма

Январь

272,5

238,0

332,0

324,9

367,1

306,9

303,3

-62,8

0,85

Февраль

224,8

190,0

272,6

277,0

329,5

258,8

254,3

-110,9

0,71

Март

284,0

252,3

339,9

316,4

397,7

318,1

314,3

-51,6

0,88

Апрель

271,9

252,5

319,6

348,9

430,3

324,7

318,8

-45,1

0,89

Май

292,1

289,6

363,4

371,0

471,4

357,5

351,6

-12,2

0,98

Июнь

329,9

346,6

399,1

433,4

547,9

411,4

404,5

41,6

1,13

Июль

385,4

408,8

487,2

541,6

634,1

491,4

483,3

121,7

1,35

Август

441,5

475,8

521,0

563,3

669,2

534,1

528,6

164,4

1,48

Сентябрь

352,5

389,6

402,5

465,0

548,1

431,5

426,4

61,8

1,19

Октябрь

289,4

331,9

351,3

402,3

442,1

363,4

359,5

-6,3

1,01

Ноябрь

237,2

307,9

302,7

350,4

350,3

309,7

306,7

-60,0

0,86

Декабрь

251,4

320,8

329,0

378,6

366,1

329,2

325,9

-40,6

0,91

Средний уровень ряда для аддитивной формы

302,7

317,0

368,4

397,7

462,8

y=369,7

 

0

 

Средний уровень ряда для мультипликативной формы

297,0

307,6

362,2

389,2

450,2

 

y=357,1

 

1

Метод выравнивания по прямой применяется в тех случаях, когда исходный ряд содержит определенную тенденцию в развитии, поэтому перед определением сезонной волны данные должны быть обработаны так, чтобы была выявлена эта тенденция. При использовании метода выравнивания по прямой необходимо выполнить следующие действия:

Вычисляются теоретические уровни ряда в каждый момент времени по соответствующему полиному, характеризующему тренд (в данном примере используется линейный тренд на рис.1, параметры которого определены по методу наименьших квадратов);

Определяется отношение фактических данных ( ) к выравненным данным ( ) для каждого месяца (индекс сезонности по месяцам)

;

Находятся средние из соотношений, рассчитанных по одноименным периодам (индекс сезонности по одноименным периодам)

, где n – число одноименных периодов. Проверка правильности вычисления индексов. Средний индекс сезонности для всех месяцев должен быть равен 1, т.к. сезонные колебания взаимопогашаются в течение года.

В табл. 2 приведены расчеты по методу выравнивания по прямой.

Таблица 2

Месяц

Год

Исх ряд

Теоретич. уровень ряда

Индекс сезонности по месяцам

Индекс сезонности по одноименным периодам

Янв

1996

272,5

266,2

1,02

0,88

Фев

 

224,8

269,7

0,83

0,73

Март

 

284,0

273,2

1,04

0,90

Апр

 

271,9

276,7

0,98

0,90

Май

 

292,1

280,2

1,04

0,98

Июнь

 

329,9

283,7

1,16

1,12

Июль

 

385,4

287,2

1,34

1,32

Авг

 

441,5

290,8

1,52

1,43

Сен

 

352,5

294,3

1,20

1,14

Окть

 

289,4

297,8

0,97

0,95

Нояб

 

237,2

301,3

0,79

0,81

Дек

 

251,4

304,8

0,82

0,85

Янв

1997

238,0

308,3

0,77

 

Фев

 

190,0

311,8

0,61

 

Март

 

252,3

315,3

0,80

 

Апр

 

252,5

318,8

0,79

 

Май

 

289,6

322,3

0,90

 

Июнь

 

346,6

325,9

1,06

Июль

 

408,8

329,4

1,24

 

Авг

 

475,8

332,9

1,43

 

Сен

 

389,6

336,4

1,16

 

Окть

 

331,9

339,9

0,98

 

Нояб

 

307,9

343,4

0,90

 

Дек

 

320,8

346,9

0,92

 

Янв

1998

332,0

350,4

0,95

0,88

Фев

 

272,6

353,9

0,77

0,73

Март

 

339,9

357,4

0,95

0,90

Апр

 

319,6

360,9

0,89

0,90

Май

 

363,4

364,5

1,00

0,98

Июнь

 

399,1

368,0

1,08

1,12

Июль

 

487,2

371,5

1,31

1,32

Авг

 

521,0

375,0

1,39

1,43

Сен

 

402,5

378,5

1,06

1,14

Окть

 

351,3

382,0

0,92

0,95

Нояб

 

302,7

385,5

0,79

0,81

Дек

 

329,0

389,0

0,85

0,85

Янв

1999

324,9

392,5

0,83

 

Фев

 

277,0

396,0

0,70

 

Март

 

316,4

399,6

0,79

 

Апр

 

348,9

403,1

0,87

 

Май

 

371,0

406,6

0,91

 

Июнь

 

433,4

410,1

1,06

Июль

 

541,6

413,6

1,31

 

Авг

 

563,3

417,1

1,35

 

Сен

 

465,0

420,6

1,11

 

Окть

 

402,3

424,1

0,95

 

Нояб

 

350,4

427,6

0,82

 

Дек

 

378,6

431,1

0,88

 

Янв

2000

367,1

434,6

0,84

0,88

Фев

 

329,5

438,2

0,75

0,73

Март

 

397,7

441,7

0,90

0,90

Апр

 

430,3

445,2

0,97

0,90

Май

 

471,4

448,7

1,05

0,98

Июнь

 

547,9

452,2

1,21

1,12

Июль

 

634,1

455,7

1,39

1,32

Авг

 

669,2

459,2

1,46

1,43

Сен

 

548,1

462,7

1,18

1,14

Окть

 

442,1

466,2

0,95

0,95

Нояб

 

350,3

469,7

0,75

0,81

Дек

 

366,1

473,3

0,77

0,85

В табл. 3 приведены окончательные значения мультипликативных сезонных индексов для исходного ряда, полученные после процедуры сглаживания методом скользящих средних.

Таблица 3

 

Индекс

Январь

0,893

Февраль

0,742

Март

0,908

Апрель

0,913

Май

0,998

Июнь

1,137

Июль

1,347

Август

1,460

Сентябрь

1,167

Октябрь

0,976

Ноябрь

0,825

Декабрь

0,869

На рис. 2 приведен исходный ряд и уравнение тренда после выделения сезонной компоненты.

Рис.2 Уравнение тренда без сезонной компоненты

Очевидно, что значения составляющих временного ряда находятся в зависимости от последовательности и методов их выделения.

Если выбранная для прогнозирования кривая не является единственной для описания тенденции, то для каждого уравнения тренда рассчитывается коэффициент детерминации ( R 2), F-критерий Фишера, а также критерий Дарбина-Уотсона. Чем выше R 2, тем выше вероятность того, что временной ряд описывается данным уравнением тренда. Влияние случайного фактора оценивается как (1- R 2). В нашем примере R 2 для линейного уравнения тренда равен 0,9506. Если для описания тенденции исходного ряда использовалась бы парабола, то R 2 равнялся бы 0,9589. Очевидно, что при описании временного ряда предпочтение следует отдавать параболическому тренду.

Критерий Дарбина-Уотсона оценивает автокорреляцию остатков. Если автокорреляция в остатках отсутствует, то уравнение пригодно для прогноза[2].

При выборе уравнения тренда можно использовать среднюю ошибку аппроксимации, которая определяется по формуле:

.

Для нашего примера с линейным трендом средняя ошибка аппроксимации составила 5,5%. Если средняя ошибка не превысила 5-7%, уравнение тренда хорошо подходит для описания тенденции временного ряда.

В приведенном примере при прогнозировании используется сравнительно небольшая глубина исходной статистики. По мере накопления статистической информации вид тренда, используемый для прогнозирования, может изменяться.

Прогнозирование объемов пассажирских перевозок может производиться по различным уровням агрегации данных: как на уровне авиакомпании в целом, так и на уровне отдельных регионов, рейсов и направлений.

Задача прогнозирования объёмов пассажирских перевозок является основой для решения многих задач оптимизации воздушно-транспортной системы по критериям, непосредственно связанным с показателем рентабельности (доходы, затраты, прибыль), поскольку оптимальность планов, получаемых при решении этих задач, зависит прежде всего от точности прогнозов.

Литература:

1. Соколов А.А. “Прогнозирование пассажирских перевозок”. В книге”Наука и техника гражданской авиации”, ВИНИТИ, М, 1975.

2. Правдин Н.Н., Негрей В.Я.” Прогнозирование пассажирских перевозок”, М, Транспорт,1980