АЛЬТЕРНАТИВНЫЕ МЕТОДЫ ОЦЕНКИ КОЭФФИЦИЕНТОВ ПРОГНОЗНЫХ МОДЕЛЕЙ
В результате освоения данной главы студент должен:
знать
- • границы области применения методов регрессионно-корреляционного анализа выборочного метода и границы области применения альтернативных методов оценки коэффициентов прогнозных моделей;
- • современные подходы и методы оценки коэффициентов прогнозных моделей;
- • о многообразии способов решения задачи оценки коэффициентов прогнозных моделей;
уметь
- • применять системный подход к выбору метода оценки коэффициентов прогнозных моделей;
- • применять ситуационный подход для выбора адекватного метода оценки коэффициентов прогнозных моделей;
- • выбирать метод построения интервальной оценки прогноза эволюционных социально-экономических процессов;
- • формулировать гипотезы, проводить эмпирические и прикладные исследования с целью выбора адекватного метода оценивания коэффициентов прогнозных моделей;
владеть
- • методикой использования МНК для оценки коэффициентов моделей прогнозирования эволюционных социально-экономических процессов;
- • методом 2-множителей для выбора лучшего способа задания этих множителей;
- • навыками самостоятельной научной и исследовательской работы в части выбора лучшего метода оценивания коэффициентов прогнозной модели.
Метод наименьших квадратов с дисконтированием
Если задачей краткосрочного прогнозирования эволюционных процессов является приспособление модели к краткосрочно действующим отклонениям от общей тенденции, то задача среднесрочного прогнозирования эволюционной динамики заключается в том, чтобы, уловив наметившиеся отклонения от общей тенденции, вызванные адаптацией социально-экономического объекта к изменившимся внешним и внутренним условиям, оценить будущую динамику с учетом этих отклонений.
Как мы обсуждали ранее, главный принцип выборочного метода (чем больше собрано информации о прошлом состоянии объекта, тем лучше) для необратимых эволюционных процессов абсолютно непригоден. В этом случае необходимо собрать информацию о динамике объекта только за тот период, когда сам объект не успел изменить свои основные свойства, когда наблюдаемые количественные наблюдения не привели объект к новому качеству. Необходимо предварительно определить период инерционности объекта социально-экономического прогнозирования, а затем, ориентируясь на продолжительность этого периода, сформировать базу данных. К сожалению, формальных процедур, решающих эту задачу, пока не разработано. Приходится предварять сбор статистики серьезным экономическим анализом (фундаментальным анализом), опираясь на опыт и интуицию экспертов.
Поскольку построенную в такой ситуации модель нельзя воспринимать как приближение к "истинной модели, лежащей в основе процесса", а следует понимать только как некоторое описание тенденции, действовавшей в определенный промежуток времени, то требования к оценкам таких моделей существенно смягчаются.
Экономические системы, которые являются объектом прогнозирования, развиваются во времени. И это развитие носит в том числе и эволюционный характер. Это означает, что все сложившиеся к какому-либо отрезку времени отношения, пропорции и взаимосвязи постепенно изменяются – система адаптируется к внешним и внутренним воздействиям. Если для такого отрезка времени удастся построить адекватную модель этой системы, то она будет хорошо работать только в этот промежуток времени и некоторый промежуток времени в будущем, пока по инерции сохраняются отдельные пропорции и взаимосвязи. Но на среднюю и дальнюю перспективы эта модель не дает прогнозы необходимой точности – экономическая система изменится, а модель останется неизменной. Поскольку экономическая система меняется, адаптируясь к новым состояниям внешней и внутренней среды, то и модель, которую хотелось бы использовать для прогнозирования, необходимо адаптировать вслед за объектом прогнозирования. Сделать это можно несколькими способами, каждый из которых имеет свои преимущества и недостатки. Выбор лучшего из них – за прогнозистом.
Исторически первым возник метод адаптации прогнозных моделей, ориентированный на корректировку оценок МНК – дисконтированный МНК. Как уже отмечалось, для прогнозиста в случае прогнозирования эволюционно протекающих процессов важнее построить такую прогнозную модель, которая более точно описывает последние наблюдения, нежели те, которые убывают в прошлое. Ведь тем самым учитываются изменения в тенденциях, сложившиеся в последнее время. Тогда модель вслед за прогнозируемым объектом будет адаптироваться к этим новым тенденциям. Поэтому ошибки аппроксимации ε последних наблюдений должны учитываться в большей степени, чем ошибки аппроксимации предыдущих наблюдений. Важно, чтобы ошибки аппроксимации в последние моменты наблюдений были как можно меньшими, а что касается тех наблюдений, которые оказались в далеком прошлом, их значимость для прогнозирования весьма мала. Действительно, для того чтобы спрогнозировать цену за 1 т зерна на будущий год, менее всего важно знать, какой была эта цена, например, в 1950 г. и уж совсем бессмысленно ориентироваться на цены 1700 г.
Логично поэтому задать квадратам ошибок аппроксимации (как положительным значениям, характеризующим меру отклонения) прогнозной моделью фактических данных некоторые веса ν, так, чтобы их значения уменьшались с убыванием наблюдений в прошлое:
(10.1)
Для удобства вводят дополнительное условие:
(10.2)
но его выполнение не является обязательным.
Тогда ряд квадратов ошибок аппроксимации с учетом весов (10.1) можно представить, как некоторый взвешенный ряд:
(10.3)
Необходимо подобрать такие значения коэффициентов модели, чтобы сумма этого ряда была минимально возможной. Этот критерий формулируется так:
(10.4)
Использование такого критерия, например, для линейной однофакторной модели
(10.5)
приведет к необходимости решения системы двух таких уравнений:
(10.6)
Из этой системы можно вывести формулы для расчета коэффициентов модели:
(10.7)
Чтобы вычислить значения коэффициентов в (10.7), необходимо задать характер взвешивания, т.е. ответить на вопрос, как задавать веса vt. Очевидно, что способов задания весов для квадратов ошибок аппроксимации таких, чтобы выполнялись условия (10.1) и (10.2), очень много. Из этого множества следует выбрать некий универсальный способ, который он мог бы быть использован в самых различных случаях прогнозирования. А таким универсальным способом задания весов является тот, который использовался для случая краткосрочного прогнозирования Брауном, т.е.
(10.8)
Обратим внимание на то, что в случае задания α = 1, расчет коэффициентов но формуле (10.7) невозможен из-за того, что в таком случае мы пытаемся оценить коэффициенты парной регрессии но одной точке, что в принципе невозможно. В частности, в знаменателе угла наклона в таком случае будет использоваться лишь хT и в результате сокращений знаменатель становится равным пулю.
Кроме того, при расчете константы в знаменателе представлена сумма весов , по поводу которой есть соблазн допустить, что она в соответствии с (10.2) будет равна единице. Однако делать этого нельзя, так как, как мы уже выяснили в параграфе 7.2, на практике в ряде случаев сумма весов (10.2) к 1 не сходится. В частности, она не будет сходиться к 1 при малых значениях а, а в случае с МНК с дисконтированием нас могут интересовать эти значения для того, чтобы более равномерно распределить веса между наблюдениями.
Как видим, МНК с дисконтированием требует априорного задания постоянной сглаживания – в данном случае выбор значения а остается целиком и полностью на совести прогнозиста. В этом заключается одновременно как преимущество, так и недостаток метода.
Очевидно, что МПК с дисконтированием может использоваться и при расчете коэффициентов трендов. Для этого .г, нужно всего лишь заменить на t.
Рассмотрим, как можно построить модель линейного тренда МНК с дисконтированием с различными значениями постоянной сглаживания, на примере ряда № 42 из базы М3. На рис. 10.1–10.3 представлены ряды данных и их прогнозы моделью линейного тренда, коэффициенты которой рассчитаны МПК с дисконтированием с различными значениями постоянной сглаживания. Последние шесть значений при построении модели были исключены.
Рис. 10.1. Ряд данных № 42 и его прогноз моделью линейного тренда, рассчитанного МНК с дисконтированием:
слева – α = 0,01; справа – α = 0,25
Рис. 10.2. Ряд данных № 42 и его прогноз моделью линейного тренда, рассчитанного МНК с дисконтированием:
слева – α = 0,5; справа – α = 0,75
Рис. 10.3. Ряд данных № 42 и его прогноз моделью линейного тренда, рассчитанного МНК с дисконтированием:
слева – α = 0,99; справа – α = 1,25
Как видим, при малых значениях постоянной сглаживания (рис. 10.1, слева) в расчете тренда используются практически все значения с более-менее одинаковыми весами (которые тем не менее медленно убывают). Из-за этого те значения, которые были получены в период с 1975 по 1979 г., оказывают достаточно сильное влияние на окончательную сумму квадратов отклонений, в результате чего и тренд на периоде прогноза оказывается с систематическим занижением. При увеличении постоянной сглаживания в расчете коэффициентов используется все меньше и меньше старых значений, веса перераспределяются между более новыми значениями (рис. 10.1, справа, и рис. 10.2). Наиболее точный прогноз, как видим, получается при а, лежащей в районе 0,25.
Когда постоянная сглаживания близка к единице (рис. 10.3), в расчете используется последнее значение и в очень малой мере – предпоследнее. Все остальные наблюдения фактически не учитываются. Именно поэтому тренд в таком случае очень сильно задирается и представляет собой линию, проведенную через последние две имеющиеся точки (на 1987-1988 гг.).
Использование значений постоянной сглаживания из запредельного множества не имеет особого смысла, так как в этом случае угол наклона модели продолжает расти, в связи с чем она перестает прогнозировать что бы то ни было (рис. 10.3, справа).
Как видим, прогноз зависит от постоянной сглаживания. Возникает вопрос: как же выбрать оптимальную постоянную сглаживания? Казалось бы, ответ очевиден: рассчитать сумму квадратов отклонений и минимизировать ее, подбирая значение а. Но в данном решении есть серьезный изъян. Сам МПК с дисконтированием подразумевает, что каждому наблюдению исследователь задает разный вес. Применение в таком случае критерия минимума квадратов отклонений противоречит этой идее: мы подбираем веса из предположения о том, что веса одинаковы.
К сожалению, универсального решения в данном случае нет. Однако мы предлагаем воспользоваться процедурой ретропрогноза, которую можно автоматизировать следующим образом. На основе большей части данных по формулам (10.7) рассчитываются значения коэффициентов с заранее заданной величиной постоянной сглаживания. По полученной модели дастся прогноз на участок ретропрогноза, оценивается его точность. В качестве коэффициента оценки точности можно использовать любой из рассмотренных нами в параграфе 2.5. Для простоты можно рассчитать RSS. Далее численными методами подбирается такое значение а, которое минимизировало бы значение RSS. Используя полученное значение, исследователь может на его основе пересчитать коэффициенты модели с учетом новых данных и дать прогноз на наблюдения вне выборки.
Как видим, такой подход не очень удобен и не позволяет модели адаптироваться при поступлении новых данных – коэффициенты модели при этом придется вновь пересчитать. Однако на основе МНК с дисконтированием можно предложить адаптивный метод, свободный от этого недостатка.
Обратим внимание на то, что левая часть первого уравнения в (10.6) представляет собой не что иное, как взвешенную среднюю переменной уе:
(10.9)
Первое слагаемое правой части уравнения представляет собой произведение коэффициента а0 на сумму весов S. В случае выполнения (10.2) это слагаемое становится просто неизвестным значением коэффициента модели а0. Однако это условие не всегда выполняется на практике.
Второе слагаемое правой части первого уравнения в (10.6) представляет собой сумму произведений весов на переменную, и как следствие этого – взвешенную среднюю переменной xt:
(10.10)
Первое уравнение системы (10.6) можно представить так:
(10.11)
Второе уравнение системы (10.6) также можно рассмотреть через средние взвешенные значения:
где
С учетом этого система уравнений МНК с дисконтом для линейной однофакторной модели может быть представлена в виде
(10.12)
Применяя этот способ задания весов квадратов ошибок аппроксимации, получаем необходимость вычисления таких адаптивных средних, которые одновременно являются прогнозом на последующее (Т + 1)-е наблюдение:
; (10.13)
: (10.14)
; (10.15)
(10.16)
Такой способ более интересен и удобен не только тем, что позволяет построить адаптированную к последним наблюдениям модель, но и тем, что при появлении новых наблюдений t = Т + 1 легко пересчитывать коэффициенты модели. Однако подбор оптимальной постоянной сглаживания все так же сопряжен с обозначенными выше сложностями. Единственным адекватным решением на данный момент является использование процедуры ретропрогноза при подборе оптимальной а.
Чтобы обобщить МНК с дисконтированием для множественных регрессий, рассмотрим его в матричном виде для модели вида
(10.17)
Здесь Y (фактические значения зависимой переменной), А (коэффициенты модели) и ε (ошибки модели) – это векторы, а X (независимые переменные) – матрица, такие, что
Чтобы применить МНК с дисконтированием, вводится квадратная матрица весов, на диагонали которой стоят веса, соответствующие наблюдениям, а в остальных ячейках – нули:
Итоговый вектор коэффициентов в матричном виде рассчитывается по формуле
(10.18)
Таким образом, задавая различные значения постоянной сглаживания, можно получать такие оценки множественной регрессии, которые позволяли бы в разных ситуациях учитывать имеющиеся в распоряжении наблюдения в разной степени.
Заметим, что МНК с дисконтированием фактически является одной из разновидностей взвешенного МНК. Главной особенностью МНК с дисконтированием является то, что в нем веса распределяются в соответствии с принципом обесценивания данных во времени: новые наблюдения имеют бо́льшую ценность, чем старые.
Рассмотрим пример с построением модели множественной регрессии. В табл. 10.1 приведены данные условного примера.
Таблица 10.1
Данные условного примера
Месяц |
Объем выпуска, уt |
Стоимость материалов, x1,t |
Затраты труда, x2,t |
Затраты капитала, х3,t |
Январь 2009 |
147 |
22 |
63 |
1002 |
Февраль 2009 |
175 |
22 |
64 |
1035 |
Март 2009 |
175 |
20 |
65 |
1027 |
Апрель 2009 |
151 |
24 |
65 |
994 |
Май 2009 |
170 |
23 |
66 |
995 |
Июнь 2009 |
167 |
24 |
67 |
992 |
Июль 2009 |
172 |
24 |
67 |
1016 |
Август 2009 |
151 |
23 |
68 |
1048 |
Сентябрь 2009 |
156 |
23 |
68 |
1030 |
Октябрь 2009 |
160 |
24 |
69 |
1065 |
Ноябрь 2009 |
173 |
26 |
70 |
1054 |
Декабрь 2009 |
165 |
27 |
70 |
1060 |
Январь 2010 |
158 |
28 |
71 |
1077 |
Февраль 2010 |
168 |
30 |
71 |
1083 |
Март 2010 |
161 |
31 |
72 |
1063 |
Апрель 2010 |
141 |
29 |
72 |
1051 |
Май 2010 |
156 |
30 |
73 |
1179 |
Июнь 2010 |
177 |
31 |
74 |
1277 |
Июль 2010 |
190 |
30 |
74 |
1298 |
Август 2010 |
187 |
31 |
75 |
1268 |
Сентябрь 2010 |
201 |
31 |
76 |
1302 |
Октябрь 2010 |
189 |
31 |
76 |
1302 |
Ноябрь 2010 |
199 |
33 |
77 |
1290 |
Декабрь 2010 |
203 |
34 |
77 |
1313 |
Январь 2011 |
199 |
36 |
78 |
1287 |
Февраль 2011 |
194 |
38 |
78 |
1274 |
Март 2011 |
206 |
37 |
79 |
1321 |
Апрель 2011 |
205 |
38 |
80 |
1323 |
Май 2011 |
204 |
38 |
80 |
1273 |
Июнь 2011 |
194 |
38 |
81 |
1280 |
Июль 2011 |
230 |
37 |
82 |
1336 |
Август 2011 |
219 |
37 |
82 |
1347 |
Сентябрь 2011 |
230 |
37 |
83 |
1341 |
Октябрь 2011 |
208 |
39 |
83 |
1275 |
Ноябрь 2011 |
232 |
40 |
84 |
1334 |
Декабрь 2011 |
251 |
40 |
84 |
1459 |
Для построения модели воспользуемся предложенным нами принципом минимизации ошибки ретропрогноза. Для этого из всех наблюдений уберем последние 12: по наблюдениям с января по июнь 2011 г. мы будем оценивать значение а (подставляя в модель имеющиеся значения X), по последним шести наблюдениям мы будем сравнивать прогнозы по полученной модели с прогнозами по модели, оцененной обычным МПК.
В результате оценки коэффициентов МНК с дисконтированием была получена следующая модель:
(10.19)
По значению постоянной сглаживания видно, что для минимизации ошибки ретропрогноза в расчете коэффициентов использовалось такое значение постоянной сглаживания, которое гарантирует медленное убывание весов. Это значит, что в формировании значений коэффициентов первые наблюдения используются в меньшей степени, чем последние имеющиеся, однако некоторую роль они все равно играют: вес самого первого наблюдения оказался равен примерно 0,001028. В случае с обычным МПК его вес был бы равен 0,041667, это значение играло было более существенную роль в формировании оценок коэффициентов.
sMAPE (для наблюдений с июля по декабрь 2011 г.) по полученной модели (10.19) оказалась равной 6,26%. Графически расчетные значения и прогноз по модели представлены на рис. 10.4 (жирная сплошная линия).
Рис. 10.4. Объем выпуска, расчетные и прогнозные значения по моделям (10.19), (10.20)
Как видим, значения оказались систематически заниженными, что может быть вызвано малой выборкой, по которой рассчитывалась ошибка ретропрогноза. Однако сами значения оказались достаточно близки к фактическим.
В качестве альтернативы рассчитаем коэффициенты той же модели МНК по ряду наблюдений с января 2009 г. но июнь 2011 г. Получим следующую регрессионную модель:
(10.20)
Как видим, коэффициенты моделей (10.19) и (10.20) различаются значительно: некоторые из факторов в одной модели влияют на результат положительно, а в модели (10.20) – уже отрицательно. Это указывает на то, что в исследуемом объекте произошли качественные, необратимые изменения. В связи с тем что модель (10.20) усредняет значения по всем наблюдениям, эти качественные изменения были так же усреднены. В результате этого точность прогноза по модели, оцененной МНК, оказалась ниже: sMAPE составила 12,26%. Графически модель (10.20) и прогноз по ней изображены на рис. 10.4 пунктирной линией. Видно, что из-за задания одинаковых весов модель дала прогноз с бо́льшим занижением, чем модель (10.19).
Заметим, что в нашем условном примере мы специально сформировали ряд данных таким образом, чтобы зависимость после июня 2010 г. изменилась. По объективным причинам результирующая модель (10.19) по своим оценкам оказалась ближе к модели "лежащей в основе" нашего ряда, чем модель (10.20).
Одной из проблем МНК с дисконтированием, как мы уже отметили, является невозможность автоматической оценки модели по исходному ряду данных (в связи с чем и приходится прибегать к процедуре ретропрогноза). С ней связана и проблема построения прогнозных интервалов. Действительно, обычно при расчете прогнозных интервалов требуется оценить дисперсию ошибок, но в случае МНК с дисконтированием ошибки в начале ряда не имеют смысла из-за того, что учитываются с малыми весами, а ошибки в конце ряда оказываются крайне малыми из-за больших весов при расчете коэффициентов. Единственной оценкой дисперсии ошибок может выступать дисперсия ошибок ретропрогноза. Статистически обосновать методы построения интервальных прогнозов в таких условиях оказывается крайне затруднительно. Простым выходом из этой ситуации может быть построение прогнозного интервала на основе неравенства Чебышева (пример метода построения таких интервалов был рассмотрен нами в параграфе 9.2) с использованием дисперсии ошибок ретропрогноза:
, (10.21)
где – дисперсия ошибки ретропрогноза.
Интервалы, построенные таким образом для модели (10.19), показаны на рис. 10.4. Видно, что в связи с небольшим значением дисперсии ошибки интервалы получились не слишком широкими, однако в них попала бо́льшая часть прогнозируемых значений.
Результат предложенного в данном параграфе метода автоматической оценки значения постоянной сглаживания при использовании этого подхода в МПК с дисконтированием сильно зависит от числа наблюдений, включенных в часть для ретропрогноза, и от того, какие именно наблюдения включаются в нее. Тем не менее метод имеет право на существование и в ряде случаев позволяет достаточно быстро получить точные прогнозы.