Источник: Материалы научного семинара “Инженерный бизнес и менеджмент” МГТУ им. Н.Э. Баумана 24 апреля 2007г. Cсылка на ресурс

Применение взвешенного метода наименьших квадратов в социально-экономических моделях.

Автор: Злобин Д.И.

Метод наименьших квадратов (МНК) – широко известный в науке метод сглаживания наблюдаемых данных. Он заключается в том, что по n парам чисел (tk, xk), k= 1, 2, …, n, где tk – значения независимой переменной (например, времени), xk – значения зависимой переменной (например, численности населения определенного государства, реального ВВП, индекса потребительских цен, уровня безработицы и т.д.), оценивают теоретическую зависимость между переменными. Рассмотрим простейший случай линейной зависимости
.
Во взвешенном методе наименьших квадратов критерий близости теоретической функции к опытным данным имеет вид:
,
где положительные числа wk – некоторые веса невязок. Оценки неизвестных параметров a и b линейной зависимости находят из условия
.
Зачем нужны веса невязок? Естественно принять, что события, которые произошли совсем недавно, должны оказывать на прогноз гораздо большее влияние, чем “дела давно минувших дней”. Например, присвоим k-ой невязке вес k/n (в предположении, что tkвозрастает с ростомk). Тогда последняя невязка будет иметь вес, в n раз больший, чем первая, и, как следствие, тренд будет проходить ближе к точкам, которые зафиксированы недавно.
Как и в классическом случае единичных весов, оценки параметров нетрудно найти, приравняв 0 частные производные f(a,b) по a и b. Введем обозначения:
.
Нетрудно показать, что минимум f(a,b) достигается при
.
Применение взвешенного метода наименьших квадратов продемонстрируем на примере прогнозирования численности населения России. Используя данные (табл.1 и рис.1) по численности населения с 1917 по 2005 год (в современных границах РФ), дадим прогноз на 2006 год.
Численность населения с начала века до его девяностых годов быстро возрастала, а с 1996 года резко пошла на убыль. Взвешенный МНК как раз и позволяет отразить эту тенденцию, поскольку в большей степени учитывает данные из недавнего прошлого, чем из “глубокой древности”.

Таблица 1. Динамика численности населения России

Год

Население, млн. чел.

Год

Население, млн. чел.

1917

91,0

1991

148,3

1926

92,7

1996

148,3

1939

108,4

2001

146,3

1959

117,2

2002

145,2

1970

129,9

2003

145,0

1979

137,4

2004

144,2

1989

147,0

2005

143,5

Рис.1. Изменение численности населения России в ХХ в.

В следующей табл.2 отразим фактическую численность населения и результаты двух прогнозов на 2006 год, сделанных с помощью простого и взвешенного МНК (в обоих случаях использовалась линейная регрессия). Из табл.2 видно, что взвешенный МНК дает более точный прогноз, т.к. ошибка прогноза составляет 0,4% против 5,6% у простого МНК.

Таблица 2. Сравнение методов восстановления зависимости

Фактически

Классический МНК

Взвешенный МНК

142,8

150,8

142,2

Ошибка, %

5,6

0,4

В приведенном примере с численностью населения можно добиться более точного прогноза с помощью классического МНК (с единичными весами), если просто отбросить данные за двадцатый век. Видно, что начиная с нового века численность населения убывает почти линейно, а возрастающие тенденции двадцатого века только ухудшают точность прогноза. Однако не всегда изменение динамики так очевидно.

Литература:

1. Харман Г. Современный факторный анализ. – М.: Статистика, 1972. – 486 с.
2. Орлов А.И. Теория принятия решений. – М.: Экзамен, 2006. - 576 с.
http://orlovs.pp.ru/stat.php#k5