Анализ эффективности различных систем и методов прогнозирования приведен на примере выборки, содержащей данные о общем количестве ЧМТ, происшедших с 1996 по 1999гг., данные представлены поквартально. Прогноз будет осуществляться на 4 квартала 2000г. и сверяться с реальными данными за этот период.
Для проведения регрессионного анализа использован модуль системы "Multiple Regression", в который основным параметром поступает столбец SHMT, содержащий данные о поквартальном количестве ЧМТ.
Анализ полученных данных:
Итоговые результаты регрессии (рисунок 6.3)содержат коэффициенты регрессионного уравнения (в столбце "B"), так при переменной KVARTAL найден коэффициент 17,669 и свободный член - 429. Далее находятся стандартные ошибки коэффициентов, значения статистик t-критерия, коэффициенты риска (p-level). В первых двух столбцах содержится значения стандартизованного коэффициента регрессионного уравнения beta и его стандартизованная ошибка.
Регрессионное уравнение имеет вид: SHMT=17,669*KVART
AL+429.По регрессионной кривой получены такие значения прогнозных чисел и их допустимые границы:
Все истинные значения попадают в соответствующие допустимые интервалы. Таким образом, построенная модель с высокой точностью апроскимирует реальные данные.
Пример 1.
Регрессионный анализ, проведённый для выделения линейной зависимости, дал результаты, расположенные в таблице 6.1.Таблица 6.1 Результаты регрессионного анализа
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 97% |
Верхние 97% |
429 |
29,6108 |
14,48793292 |
8,1E-10 |
365,491 |
492,509 |
357,493 |
500,507 |
17,6691 |
3,06228 |
5,76992014 |
4,9E-05 |
11,1012 |
24,2371 |
10,274 |
25,0642 |
Первый столбец данной таблицы содержит стандартные коэффициенты уравнения прямой (во второй строке находится коэффициент при независимой переменной, в первой - свободный член уравенения), таким образом конечное уравнение имеет вид: y=17,669*x+429;
Остальные столбцы содержат:
Коэффициент детерминации, R
2 = 0,7039 означает, что построенная регресия объясняет более 70% разброса значений выборки данных о числе чмт относительно среднегоПример 2.
Использование встроенных функций MSExelТаблица 6.2 Эффективность прогнозирования функцией ПРЕДСКАЗ
период |
прогноз |
ошибка абсолютная |
ошибка процентная |
I кв 2000г |
729,375 |
42,375 |
6,168 |
II кв 2000г |
747,044 |
53,956 |
6,736 |
III кв 2000г |
764,713 |
10,287 |
1,327 |
IV кв 2000г |
782,382 |
132,382 |
20,367 |
2000г |
3023,51 |
110,515 |
3,794 |
б) РОСТ - проверка на наличие экспоненциального роста. Из таблицы 6.4 видно, что данная функция даёт прогноз с большей погрешностью, чем предыдущие.
Таблица 6.4 Эффективность прогнозирования функцией РОСТ
период |
прогноз |
ошибка абсолютная |
ошибка процентная |
I кв 2000г |
737,610 |
50,610 |
7,367 |
II кв 2000г |
760,177 |
40,823 |
5,097 |
III кв 2000г |
783,434 |
8,434 |
1,088 |
IV кв 2000г |
807,402 |
157,402 |
24,216 |
2000г |
3088,623 |
175,623 |
6,029 |
в) ЛИНЕЙН - построение наилучшей аппроксимирующей кривой. В результате использования данной функции получены такие коэффициенты уравнения прямой: Y=M*X+B, где М=17,6691 и В=429. Прогноз, полученный с помощью построенной кривой, полностью совпадает с результатами функций ПРЕДСКАЗ и ТЕНДЕНЦИЯ.
г) ЛГРФПРИБЛ - построение наилучшей аппроксимирующей экспоненциальной кривой. В уравнении экспоненты - Y=B*M^X коэффициенты равны: М=1,03059 и В=441,914. Прогноз, полученный при помощи данной кривой, полностью совпадает с результатами функции РОСТ.
Таблица 6.5 Прогнозы, полученные с использованием нейросетевых алгоритмов
период |
прогноз |
ошибка абсолютная |
ошибка процентная |
I кв 2000г |
705 |
18 |
2,6 |
II кв 2000г |
722 |
79 |
9,8 |
III кв 2000г |
678 |
97 |
12,5 |
IV кв 2000г |
639 |
147 |
18,7 |
2000г |
2744 |
314 |
10,3 |
Таблица 6.6 Прогнозы, полученные с использованием автоматического подбора алгоритмов прогнозирования в системе
период |
прогноз |
ошибка абсолютная |
ошибка процентная |
I кв 2000г |
688 |
1 |
0,09 |
II кв 2000г |
735 |
66 |
8,3 |
III кв 2000г |
677 |
98 |
12,6 |
IV кв 2000г |
680 |
106 |
13,5 |
2000г |
2780 |
278 |
9 |
Таблица 6.7 Прогнозы, полученные во всех используемых системах прогнозирования
Процентная ошибка прогноза |
||||
период |
Statistika |
Exel |
Нейросеть |
MEDIC-ЧМТ |
I кв 2000г |
6 |
6,168 |
2,6 |
0,09 |
II кв 2000г |
6,7 |
6,736 |
9,8 |
8,3 |
III кв 2000г |
1,29 |
1,327 |
12,5 |
12,6 |
IV кв 2000г |
0,5 |
20,367 |
18,7 |
13,5 |
2000г |
0,853 |
3,794 |
10,3 |
9 |