автобиография

  1. АНАЛИЗ РЕЗУЛЬТАТОВ ПРОГНОЗИРОВАНИЯ
  2. Анализ эффективности различных систем и методов прогнозирования приведен на примере выборки, содержащей данные о общем количестве ЧМТ, происшедших с 1996 по 1999гг., данные представлены поквартально. Прогноз будет осуществляться на 4 квартала 2000г. и сверяться с реальными данными за этот период.

    1. Прогнозирование средствами пакета Statistica

Для проведения регрессионного анализа использован модуль системы "Multiple Regression", в который основным параметром поступает столбец SHMT, содержащий данные о поквартальном количестве ЧМТ.

Анализ полученных данных:

  1. коэффициент детерминации, R2 = 0,7 означает, что построенная регресия объясняет более 70% разброса значений переменной SHMT относительно среднего
  2. значение F-критерия, равное 32,29 и р=0,000049, говорят о том, что построенная регрессионная прямая значима (т.е. зависимость лучше описывается прямой, чем кривой)

Итоговые результаты регрессии (рисунок 6.3)содержат коэффициенты регрессионного уравнения (в столбце "B"), так при переменной KVARTAL найден коэффициент 17,669 и свободный член - 429. Далее находятся стандартные ошибки коэффициентов, значения статистик t-критерия, коэффициенты риска (p-level). В первых двух столбцах содержится значения стандартизованного коэффициента регрессионного уравнения beta и его стандартизованная ошибка.

Регрессионное уравнение имеет вид: SHMT=17,669*KVARTAL+429.

По регрессионной кривой получены такие значения прогнозных чисел и их допустимые границы:

  1. 1 квартал 2000г - 729,375 (665,866; 792,884) истинное значение - 687
  2. 2 квартал 2000г - 747,044 (677,690; 816,397) истинное значение - 801
  3. 3 квартал 2000г - 764,713 (689,396; 840,030) истинное значение - 775
  4. 4 квартал 2000г - 782,382 (701,009; 863,756) истинное значение - 786

Все истинные значения попадают в соответствующие допустимые интервалы. Таким образом, построенная модель с высокой точностью апроскимирует реальные данные.

    1. Прогнозы, полученные средствами MSExel

Пример 1. Регрессионный анализ, проведённый для выделения линейной зависимости, дал результаты, расположенные в таблице 6.1.

Таблица 6.1 Результаты регрессионного анализа

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 97%

Верхние 97%

429

29,6108

14,48793292

8,1E-10

365,491

492,509

357,493

500,507

17,6691

3,06228

5,76992014

4,9E-05

11,1012

24,2371

10,274

25,0642

Первый столбец данной таблицы содержит стандартные коэффициенты уравнения прямой (во второй строке находится коэффициент при независимой переменной, в первой - свободный член уравенения), таким образом конечное уравнение имеет вид: y=17,669*x+429;

Остальные столбцы содержат:

  1. стандартные ошибки коэффициентов регрессии
  2. значения t-критерия для оценки значимости построенной регрессии
  3. P-значения или фактор риска полученной зависимости
  4. Верхние и нижние оценки коэффициентов при данном уровне надёжности (95% и 97%)

Коэффициент детерминации, R2 = 0,7039 означает, что построенная регресия объясняет более 70% разброса значений выборки данных о числе чмт относительно среднего

Пример 2. Использование встроенных функций MSExel

  1. ПРЕДСКАЗ - проверка на наличие линейного роста. Результаты представлены в таблице 6.2

Таблица 6.2 Эффективность прогнозирования функцией ПРЕДСКАЗ

период

прогноз

ошибка абсолютная

ошибка процентная

I кв 2000г

729,375

42,375

6,168

II кв 2000г

747,044

53,956

6,736

III кв 2000г

764,713

10,287

1,327

IV кв 2000г

782,382

132,382

20,367

2000г

3023,51

110,515

3,794

б) РОСТ - проверка на наличие экспоненциального роста. Из таблицы 6.4 видно, что данная функция даёт прогноз с большей погрешностью, чем предыдущие.

Таблица 6.4 Эффективность прогнозирования функцией РОСТ

период

прогноз

ошибка абсолютная

ошибка процентная

I кв 2000г

737,610

50,610

7,367

II кв 2000г

760,177

40,823

5,097

III кв 2000г

783,434

8,434

1,088

IV кв 2000г

807,402

157,402

24,216

2000г

3088,623

175,623

6,029

в) ЛИНЕЙН - построение наилучшей аппроксимирующей кривой. В результате использования данной функции получены такие коэффициенты уравнения прямой: Y=M*X+B, где М=17,6691 и В=429. Прогноз, полученный с помощью построенной кривой, полностью совпадает с результатами функций ПРЕДСКАЗ и ТЕНДЕНЦИЯ.

г) ЛГРФПРИБЛ - построение наилучшей аппроксимирующей экспоненциальной кривой. В уравнении экспоненты - Y=B*M^X коэффициенты равны: М=1,03059 и В=441,914. Прогноз, полученный при помощи данной кривой, полностью совпадает с результатами функции РОСТ.

    1. Нейросетевые решения
    2. Таблица 6.5 Прогнозы, полученные с использованием нейросетевых алгоритмов

      период

      прогноз

      ошибка абсолютная

      ошибка процентная

      I кв 2000г

      705

      18

      2,6

      II кв 2000г

      722

      79

      9,8

      III кв 2000г

      678

      97

      12,5

      IV кв 2000г

      639

      147

      18,7

      2000г

      2744

      314

      10,3

    3. Прогнозирование в системе MEDIC-ЧМТ
    4. Таблица 6.6 Прогнозы, полученные с использованием автоматического подбора алгоритмов прогнозирования в системе

      период

      прогноз

      ошибка абсолютная

      ошибка процентная

      I кв 2000г

      688

      1

      0,09

      II кв 2000г

      735

      66

      8,3

      III кв 2000г

      677

      98

      12,6

      IV кв 2000г

      680

      106

      13,5

      2000г

      2780

      278

      9

    5. Сравнительные характеристики результатов

Таблица 6.7 Прогнозы, полученные во всех используемых системах прогнозирования

Процентная ошибка прогноза

период

Statistika

Exel

Нейросеть

MEDIC-ЧМТ

I кв 2000г

6

6,168

2,6

0,09

II кв 2000г

6,7

6,736

9,8

8,3

III кв 2000г

1,29

1,327

12,5

12,6

IV кв 2000г

0,5

20,367

18,7

13,5

2000г

0,853

3,794

10,3

9