УДК 338.24.01
Аннотация. В статье приводится построение уравнения множественной регрессии, по- зволяющего моделировать изменение во времени макроэкономических показателей. При этом учтена особенность коррелирования временных рядов: при однонаправлен- ности трендов возможны высокие значения коэффициента корреляции между их уров- нями даже тогда, когда они независимы.
Полученное уравнение позволяет прогнозировать значения валового внутреннего продукта (ВВП). В качестве примера прогноза получены интервальные оценки ВВП Германии до 2015 г.
Ключевые слова: временной ряд, уравнение множественной регрессии, мультикол- линеарность, автокорреляция, корреляционная матрица, значимость коэффициентов регрессии, прогноз ВВП.
Abstract. This article considers the construction of a multiple regression equation which helps modelling the time variation of macroeconomic indicators. At the same time the peculiarity of correlating time series is taken into account: the unilaterality of the trends makes possible to rich the highest possible values of the coefficient of correlation between their levels, even when they are independent.
The resulting equation makes it possible to predict the value of the gross domestic product (GDP). The forecast of the interval estimates of Germany’s GDP till 2015 are taken as an example.
Key words: time series, equation of multiple regression, multicollinearity, autocorrelation, correlation matrix, significance of regression coefficients, forecast of GDP.
В экономических исследованиях, например, в задачах прогнозирования, приходит- ся изучать динамику нескольких показателей одновременно. Временные ряды, уровни которых могут рассматриваться у одних рядов как результативные, а у других – как фак- торные, называются связанными. Для связанных рядов находят уравнение множествен- ной регрессии, которое можно рассматривать как модель изменения уровней результа- тивного ряда в зависимости от изменения уровней факторных рядов. Чтобы уменьшить или устранить автокорреляцию уровней, в уравнение регрессии вводится в линейной форме фактор времени t [3].
В данном исследовании приводится построение уравнения множественной регрес- сии, моделирующего изменение валового внутреннего продукта (ВВП). В качестве ис-
ходных данных использованы годовые макроэкономические показатели Германии, взя- тые из [5] и приведенные в табл.1.
Таблица 1
Годы | х1, млрд. дол. | х2, % | х3, млн. чел. | х4, млрд. дол. | х5, млрд. дол. | х6, млрд. дол. |
1990 | 1463 | 72,75 | 79,364 | 411 | 341 | 2,964 |
1991 | 1591 | 75,9 | 79,984 | 404 | 385 | 4,742 |
1992 | 1664 | 79,8 | 80,594 | 431 | 403 | -2,113 |
1993 | 1688 | 83,3 | 81,179 | 379 | 338 | 0,352 |
1994 | 1770 | 85,6 | 81,422 | 427 | 376 | 7,171 |
1995 | 1840 | 87,1 | 81,661 | 520 | 456 | 12,01 |
1996 | 1892 | 88,3 | 81,896 | 520 | 451 | 6,479 |
1997 | 1936 | 90 | 82,052 | 508 | 438 | 12,328 |
1998 | 1990 | 90,8 | 82,029 | 538 | 463 | 24,515 |
1999 | 2064 | 91,3 | 82,087 | 539 | 470 | 56,094 |
2000 | 2130 | 92,7 | 82,188 | 546 | 491 | 198,772 |
2001 | 2212 | 94,5 | 82,34 | 566 | 479 | 26,436 |
2002 | 2275 | 95,8 | 82,482 | 612 | 486 | 53,779 |
2003 | 2358 | 96,8 | 82,52 | 748 | 603 | 32,442 |
2004 | 2468 | 98,5 | 82,501 | 908 | 72 | -10,206 |
2005 | 2583 | 100 | 82,464 | 984 | 791 | 47,459 |
2006 | 2709 | 101,6 | 82,366 | 1135 | 937 | 55,676 |
2007 | 2835 | 103,9 | 82,263 | 1348 | 1079 | 76,647 |
2008 | 2927 | 106,6 | 82,131 | 1495 | 1221 | 24,534 |
2009 | 2970 | 107 | 81,875 | 1145 | 958 | 35,749 |
Показатели имеют следующее содержание: х1 – ВВП, млрд. долларов США; х2 – индекс потребительских цен, %; х3 – численность населения, млн. человек; х4 – экспорт, млрд. долларов США; х5 – импорт, млрд. долларов США; х6 – инвестиции в основной капитал, млрд. долларов США.
Для построения уравнения множественной регрессии рассчитана и проанализи- рована матрица парных коэффициентов корреляции уровней факторов. Цель анализа – выяснить, что отобранные в уравнение факторы не мультиколлинеарны, то есть не находятся между собой в линейной связи. При этом учитывалось, что коррелировать уровни временных рядов можно только в случае отсутствия автокорреляция в каждом из них [3]. Поэтому сначала каждый ряд был проверен на автокорреляцию. В табл. 2 представлены результаты расчета коэффициентов автокорреляции ra для каждого вре-
менного ряда и соответствующие им критические значения для числа уровней n=20 и
уровня значимости α=0,05.
Из табл. 2 видно, что автокорреляция наблюдается в рядах параметров х2, х3, х4 и х5, так как соответствующие коэффициенты автокорреляции превосходят по модулю их критические значения. Поэтому для исключения влияния автокорреляции рассчитывались парные коэффи- циенты корреляции не между уровнями, а последовательными разностями уровней каждого временного ряда [3]. Матрица парных коэффициентов корреляции представлена в табл.3.
Таблица 2
ra =-0,380 х 1 | ra =0,640 х 2 | ra =0,730 х 3 | ra =0,810 х 4 | ra =0,570 х 5 | ra =0,210 х 6 |
-0,399 | 0,299 | 0,299 | 0,299 | 0,299 | 0,299 |
Таблица 3
х1 | х2 | х3 | х4 | х5 | х6 | |
х1 | 1 | 0,8576 | 0,3884 | 0,5036 | 0,2434 | 0,0021 |
х2 | 1 | 0,7060 | 0,3777 | 0,1535 | -0,0538 | |
х3 | 1 | 0,0878 | 0,0288 | -0,0233 | ||
х4 | 1 | 0,3178 | -0,0879 | |||
х5 | 1 | 0,2545 | ||||
х6 | 1 |
Анализ первой строки матрицы показывает, что факторы х5 и х6 не следует включать в модель, так как их связь с результативным показателем х1 слабая. Остальные факторы, если нет мультиколлинеарности, могут быть включены в модель. В качестве критерия от- сутствия мультиколлинеарности использовалось выполнение следующих неравенств [2]:
rx1xi rxix j
rx x rx x (1)
1 j i j
Критерию (1) удовлетворяют только факторы х2 и х4, которые и были включены в уравнение множественной регрессии:
xˆ1 b0 b2 x2 b4 x4 bt t (2)
Для определения неизвестных коэффициентов уравнения (2) использовался режим
«Регрессия» надстройки «Анализ данных» табличного редактора MS Excel:
xˆ1 1093,36 2,70x2 0,36x4 54,08t
Проверка значимости коэффициентов регрессии с помощью t – критерия Стьюден- та показала несущественность коэффициента b2, поэтому фактор х2 был исключен из уравнения как неинформативный.
После пересчета коэффициентов получено уравнение:
xˆ1 1297,36 0,36 x4 58,67t (3)
Все коэффициенты этого уравнения статистически значимы, а значение множе- ственного коэффициента детерминации R2=0,995 показывает, что 99,5% общей вариации результативного признака объясняется вариацией факторных признаков, что подтверж- дает правильность их включения в построенную модель.
Достаточно высокую адекватность построенного уравнения подтверждает и пока-
затель средней ошибки аппроксимации 1,04% . Данный показатель рассчитывался по формуле [4]:
1
n
100% ,
x1i xˆ1i x1i
n i1
где xˆ1 – рассчитанные по уравнению (3) значения результативного признака.
После проверки надежности уравнения (3) с его помощью получены интерваль- ные оценки среднего значения результативного показателя до 2015 года с доверительной вероятностью γ=0,95. Результаты расчетов представлены на рис. 1, где квадратами без доверительных интервалов изображены фактические значения ВВП, с доверительными интервалами – прогнозируемые значения.
Как видно из рис. 1, полученные оценки не противоречат прогнозам, приведенным в работе [1].
ВВП, млрд. дол.
время, годы
Рис. 1. Динамика ВВП Германии
ЛИТЕРАТУРА:
Гусев А.Н. Долгосрочное прогнозирование параметров экономик России и Герма- нии // Вестник Московского областного государственного университета. – Серия «Эконо- мика». – 2011. № 1. – С. 5–10.
Ефимова М.Р., Ганченко О.И., Петрова Е.В. Практикум по общей теории стати- стики: Учеб. пособие. – М.: Финансы и статистика, 2004. – 336 с.
Теория статистики: Учебник / Под ред. проф. Л.Г. Громыко. – М.: ИНФРА-М, 2006. – 476 с.
Эконометрика: Учебник / Под ред. И И. Елисеевой. – М.: Финансы и статистика, 2002. – 344 с.
UNECE Statistical Database. http://w3.unece.org/pxweb (дата обращения 12.03.12).