Источник: Материалы
научного семинара “Инженерный бизнес и менеджмент” МГТУ им. Н.Э. Баумана 24
апреля 2007г. Cсылка на ресурс
Применение взвешенного метода
наименьших квадратов в социально-экономических моделях.
Автор: Злобин Д.И.
Метод наименьших квадратов (МНК) – широко
известный в науке метод сглаживания наблюдаемых данных. Он заключается в том,
что по n парам чисел (tk,
xk), k= 1, 2,
…, n, где tk
– значения независимой переменной (например, времени), xk
– значения зависимой переменной (например, численности населения определенного
государства, реального ВВП, индекса потребительских цен, уровня безработицы и
т.д.), оценивают теоретическую зависимость между переменными. Рассмотрим
простейший случай линейной зависимости
.
Во взвешенном методе наименьших квадратов критерий близости
теоретической функции к опытным данным имеет вид:
,
где положительные числа wk – некоторые веса
невязок. Оценки неизвестных параметров a и b линейной зависимости находят из условия
.
Зачем нужны веса невязок? Естественно принять, что события, которые произошли
совсем недавно, должны оказывать на прогноз гораздо большее влияние, чем “дела
давно минувших дней”. Например, присвоим k-ой невязке вес k/n (в
предположении, что tkвозрастает с ростомk). Тогда последняя невязка будет иметь вес,
в n раз больший, чем первая, и, как
следствие, тренд будет проходить ближе к точкам, которые зафиксированы недавно.
Как и в классическом случае единичных весов, оценки параметров нетрудно найти,
приравняв 0 частные производные f(a,b) по a и b. Введем обозначения:
.
Нетрудно показать, что минимум f(a,b) достигается при
.
Применение взвешенного метода наименьших квадратов продемонстрируем на примере
прогнозирования численности населения России. Используя данные (табл.1 и рис.1)
по численности населения с 1917 по 2005 год (в современных границах РФ), дадим
прогноз на 2006 год.
Численность населения с начала века до его девяностых годов быстро возрастала,
а с 1996 года резко пошла на убыль. Взвешенный МНК как раз и позволяет отразить
эту тенденцию, поскольку в большей степени учитывает данные из недавнего
прошлого, чем из “глубокой древности”.
Таблица
1. Динамика численности населения России
Год |
Население, млн. чел. |
Год |
Население, млн. чел. |
1917 |
91,0 |
1991 |
148,3 |
1926 |
92,7 |
1996 |
148,3 |
1939 |
108,4 |
2001 |
146,3 |
1959 |
117,2 |
2002 |
145,2 |
1970 |
129,9 |
2003 |
145,0 |
1979 |
137,4 |
2004 |
144,2 |
1989 |
147,0 |
2005 |
143,5 |
Рис.1.
Изменение численности населения России в ХХ в.
В следующей табл.2 отразим фактическую
численность населения и результаты двух прогнозов на 2006 год, сделанных с
помощью простого и взвешенного МНК (в обоих случаях использовалась линейная
регрессия). Из табл.2 видно, что взвешенный МНК дает более точный прогноз, т.к.
ошибка прогноза составляет 0,4% против 5,6% у простого МНК.
Таблица
2. Сравнение методов восстановления зависимости
Фактически |
Классический МНК |
Взвешенный МНК |
142,8 |
150,8 |
142,2 |
Ошибка, % |
5,6 |
0,4 |
В приведенном примере с численностью
населения можно добиться более точного прогноза с помощью классического МНК (с
единичными весами), если просто отбросить данные за двадцатый век. Видно, что
начиная с нового века численность населения убывает почти линейно, а
возрастающие тенденции двадцатого века только ухудшают точность прогноза.
Однако не всегда изменение динамики так очевидно.
Литература:
1. Харман
Г. Современный факторный анализ. – М.: Статистика, 1972. – 486 с.
2. Орлов А.И. Теория принятия решений. – М.: Экзамен, 2006. - 576 с.
http://orlovs.pp.ru/stat.php#k5