АЛЬТЕРНАТИВНЫЕ МЕТОДЫ ОЦЕНКИ КОЭФФИЦИЕНТОВ ПРОГНОЗНЫХ МОДЕЛЕЙ

В результате освоения данной главы студент должен:

знать

  • • границы области применения методов регрессионно-корреляционного анализа выборочного метода и границы области применения альтернативных методов оценки коэффициентов прогнозных моделей;
  • • современные подходы и методы оценки коэффициентов прогнозных моделей;
  • • о многообразии способов решения задачи оценки коэффициентов прогнозных моделей;

уметь

  • • применять системный подход к выбору метода оценки коэффициентов прогнозных моделей;
  • • применять ситуационный подход для выбора адекватного метода оценки коэффициентов прогнозных моделей;
  • • выбирать метод построения интервальной оценки прогноза эволюционных социально-экономических процессов;
  • • формулировать гипотезы, проводить эмпирические и прикладные исследования с целью выбора адекватного метода оценивания коэффициентов прогнозных моделей;

владеть

  • • методикой использования МНК для оценки коэффициентов моделей прогнозирования эволюционных социально-экономических процессов;
  • • методом 2-множителей для выбора лучшего способа задания этих множителей;
  • • навыками самостоятельной научной и исследовательской работы в части выбора лучшего метода оценивания коэффициентов прогнозной модели.

Метод наименьших квадратов с дисконтированием

Если задачей краткосрочного прогнозирования эволюционных процессов является приспособление модели к краткосрочно действующим отклонениям от общей тенденции, то задача среднесрочного прогнозирования эволюционной динамики заключается в том, чтобы, уловив наметившиеся отклонения от общей тенденции, вызванные адаптацией социально-экономического объекта к изменившимся внешним и внутренним условиям, оценить будущую динамику с учетом этих отклонений.

Как мы обсуждали ранее, главный принцип выборочного метода (чем больше собрано информации о прошлом состоянии объекта, тем лучше) для необратимых эволюционных процессов абсолютно непригоден. В этом случае необходимо собрать информацию о динамике объекта только за тот период, когда сам объект не успел изменить свои основные свойства, когда наблюдаемые количественные наблюдения не привели объект к новому качеству. Необходимо предварительно определить период инерционности объекта социально-экономического прогнозирования, а затем, ориентируясь на продолжительность этого периода, сформировать базу данных. К сожалению, формальных процедур, решающих эту задачу, пока не разработано. Приходится предварять сбор статистики серьезным экономическим анализом (фундаментальным анализом), опираясь на опыт и интуицию экспертов.

Поскольку построенную в такой ситуации модель нельзя воспринимать как приближение к "истинной модели, лежащей в основе процесса", а следует понимать только как некоторое описание тенденции, действовавшей в определенный промежуток времени, то требования к оценкам таких моделей существенно смягчаются.

Экономические системы, которые являются объектом прогнозирования, развиваются во времени. И это развитие носит в том числе и эволюционный характер. Это означает, что все сложившиеся к какому-либо отрезку времени отношения, пропорции и взаимосвязи постепенно изменяются – система адаптируется к внешним и внутренним воздействиям. Если для такого отрезка времени удастся построить адекватную модель этой системы, то она будет хорошо работать только в этот промежуток времени и некоторый промежуток времени в будущем, пока по инерции сохраняются отдельные пропорции и взаимосвязи. Но на среднюю и дальнюю перспективы эта модель не дает прогнозы необходимой точности – экономическая система изменится, а модель останется неизменной. Поскольку экономическая система меняется, адаптируясь к новым состояниям внешней и внутренней среды, то и модель, которую хотелось бы использовать для прогнозирования, необходимо адаптировать вслед за объектом прогнозирования. Сделать это можно несколькими способами, каждый из которых имеет свои преимущества и недостатки. Выбор лучшего из них – за прогнозистом.

Исторически первым возник метод адаптации прогнозных моделей, ориентированный на корректировку оценок МНК – дисконтированный МНК. Как уже отмечалось, для прогнозиста в случае прогнозирования эволюционно протекающих процессов важнее построить такую прогнозную модель, которая более точно описывает последние наблюдения, нежели те, которые убывают в прошлое. Ведь тем самым учитываются изменения в тенденциях, сложившиеся в последнее время. Тогда модель вслед за прогнозируемым объектом будет адаптироваться к этим новым тенденциям. Поэтому ошибки аппроксимации ε последних наблюдений должны учитываться в большей степени, чем ошибки аппроксимации предыдущих наблюдений. Важно, чтобы ошибки аппроксимации в последние моменты наблюдений были как можно меньшими, а что касается тех наблюдений, которые оказались в далеком прошлом, их значимость для прогнозирования весьма мала. Действительно, для того чтобы спрогнозировать цену за 1 т зерна на будущий год, менее всего важно знать, какой была эта цена, например, в 1950 г. и уж совсем бессмысленно ориентироваться на цены 1700 г.

Логично поэтому задать квадратам ошибок аппроксимации (как положительным значениям, характеризующим меру отклонения) прогнозной моделью фактических данных некоторые веса ν, так, чтобы их значения уменьшались с убыванием наблюдений в прошлое:

(10.1)

Для удобства вводят дополнительное условие:

(10.2)

но его выполнение не является обязательным.

Тогда ряд квадратов ошибок аппроксимации с учетом весов (10.1) можно представить, как некоторый взвешенный ряд:

(10.3)

Необходимо подобрать такие значения коэффициентов модели, чтобы сумма этого ряда была минимально возможной. Этот критерий формулируется так:

(10.4)

Использование такого критерия, например, для линейной однофакторной модели

(10.5)

приведет к необходимости решения системы двух таких уравнений:

(10.6)

Из этой системы можно вывести формулы для расчета коэффициентов модели:

(10.7)

Чтобы вычислить значения коэффициентов в (10.7), необходимо задать характер взвешивания, т.е. ответить на вопрос, как задавать веса vt. Очевидно, что способов задания весов для квадратов ошибок аппроксимации таких, чтобы выполнялись условия (10.1) и (10.2), очень много. Из этого множества следует выбрать некий универсальный способ, который он мог бы быть использован в самых различных случаях прогнозирования. А таким универсальным способом задания весов является тот, который использовался для случая краткосрочного прогнозирования Брауном, т.е.

(10.8)

Обратим внимание на то, что в случае задания α = 1, расчет коэффициентов но формуле (10.7) невозможен из-за того, что в таком случае мы пытаемся оценить коэффициенты парной регрессии но одной точке, что в принципе невозможно. В частности, в знаменателе угла наклона в таком случае будет использоваться лишь хT и в результате сокращений знаменатель становится равным пулю.

Кроме того, при расчете константы в знаменателе представлена сумма весов , по поводу которой есть соблазн допустить, что она в соответствии с (10.2) будет равна единице. Однако делать этого нельзя, так как, как мы уже выяснили в параграфе 7.2, на практике в ряде случаев сумма весов (10.2) к 1 не сходится. В частности, она не будет сходиться к 1 при малых значениях а, а в случае с МНК с дисконтированием нас могут интересовать эти значения для того, чтобы более равномерно распределить веса между наблюдениями.

Как видим, МНК с дисконтированием требует априорного задания постоянной сглаживания – в данном случае выбор значения а остается целиком и полностью на совести прогнозиста. В этом заключается одновременно как преимущество, так и недостаток метода.

Очевидно, что МПК с дисконтированием может использоваться и при расчете коэффициентов трендов. Для этого .г, нужно всего лишь заменить на t.

Рассмотрим, как можно построить модель линейного тренда МНК с дисконтированием с различными значениями постоянной сглаживания, на примере ряда № 42 из базы М3. На рис. 10.1–10.3 представлены ряды данных и их прогнозы моделью линейного тренда, коэффициенты которой рассчитаны МПК с дисконтированием с различными значениями постоянной сглаживания. Последние шесть значений при построении модели были исключены.

Ряд данных № 42 и его прогноз моделью линейного тренда, рассчитанного МНК с дисконтированием

Рис. 10.1. Ряд данных № 42 и его прогноз моделью линейного тренда, рассчитанного МНК с дисконтированием:

слеваα = 0,01; справа – α = 0,25

Ряд данных № 42 и его прогноз моделью линейного тренда, рассчитанного МНК с дисконтированием

Рис. 10.2. Ряд данных № 42 и его прогноз моделью линейного тренда, рассчитанного МНК с дисконтированием:

слева – α = 0,5; справа – α = 0,75

Ряд данных № 42 и его прогноз моделью линейного тренда, рассчитанного МНК с дисконтированием

Рис. 10.3. Ряд данных № 42 и его прогноз моделью линейного тренда, рассчитанного МНК с дисконтированием:

слева – α = 0,99; справа – α = 1,25

Как видим, при малых значениях постоянной сглаживания (рис. 10.1, слева) в расчете тренда используются практически все значения с более-менее одинаковыми весами (которые тем не менее медленно убывают). Из-за этого те значения, которые были получены в период с 1975 по 1979 г., оказывают достаточно сильное влияние на окончательную сумму квадратов отклонений, в результате чего и тренд на периоде прогноза оказывается с систематическим занижением. При увеличении постоянной сглаживания в расчете коэффициентов используется все меньше и меньше старых значений, веса перераспределяются между более новыми значениями (рис. 10.1, справа, и рис. 10.2). Наиболее точный прогноз, как видим, получается при а, лежащей в районе 0,25.

Когда постоянная сглаживания близка к единице (рис. 10.3), в расчете используется последнее значение и в очень малой мере – предпоследнее. Все остальные наблюдения фактически не учитываются. Именно поэтому тренд в таком случае очень сильно задирается и представляет собой линию, проведенную через последние две имеющиеся точки (на 1987-1988 гг.).

Использование значений постоянной сглаживания из запредельного множества не имеет особого смысла, так как в этом случае угол наклона модели продолжает расти, в связи с чем она перестает прогнозировать что бы то ни было (рис. 10.3, справа).

Как видим, прогноз зависит от постоянной сглаживания. Возникает вопрос: как же выбрать оптимальную постоянную сглаживания? Казалось бы, ответ очевиден: рассчитать сумму квадратов отклонений и минимизировать ее, подбирая значение а. Но в данном решении есть серьезный изъян. Сам МПК с дисконтированием подразумевает, что каждому наблюдению исследователь задает разный вес. Применение в таком случае критерия минимума квадратов отклонений противоречит этой идее: мы подбираем веса из предположения о том, что веса одинаковы.

К сожалению, универсального решения в данном случае нет. Однако мы предлагаем воспользоваться процедурой ретропрогноза, которую можно автоматизировать следующим образом. На основе большей части данных по формулам (10.7) рассчитываются значения коэффициентов с заранее заданной величиной постоянной сглаживания. По полученной модели дастся прогноз на участок ретропрогноза, оценивается его точность. В качестве коэффициента оценки точности можно использовать любой из рассмотренных нами в параграфе 2.5. Для простоты можно рассчитать RSS. Далее численными методами подбирается такое значение а, которое минимизировало бы значение RSS. Используя полученное значение, исследователь может на его основе пересчитать коэффициенты модели с учетом новых данных и дать прогноз на наблюдения вне выборки.

Как видим, такой подход не очень удобен и не позволяет модели адаптироваться при поступлении новых данных – коэффициенты модели при этом придется вновь пересчитать. Однако на основе МНК с дисконтированием можно предложить адаптивный метод, свободный от этого недостатка.

Обратим внимание на то, что левая часть первого уравнения в (10.6) представляет собой не что иное, как взвешенную среднюю переменной уе:

(10.9)

Первое слагаемое правой части уравнения представляет собой произведение коэффициента а0 на сумму весов S. В случае выполнения (10.2) это слагаемое становится просто неизвестным значением коэффициента модели а0. Однако это условие не всегда выполняется на практике.

Второе слагаемое правой части первого уравнения в (10.6) представляет собой сумму произведений весов на переменную, и как следствие этого – взвешенную среднюю переменной xt:

(10.10)

Первое уравнение системы (10.6) можно представить так:

(10.11)

Второе уравнение системы (10.6) также можно рассмотреть через средние взвешенные значения:

где

С учетом этого система уравнений МНК с дисконтом для линейной однофакторной модели может быть представлена в виде

(10.12)

Применяя этот способ задания весов квадратов ошибок аппроксимации, получаем необходимость вычисления таких адаптивных средних, которые одновременно являются прогнозом на последующее (Т + 1)-е наблюдение:

; (10.13)

: (10.14)

; (10.15)

(10.16)

Такой способ более интересен и удобен не только тем, что позволяет построить адаптированную к последним наблюдениям модель, но и тем, что при появлении новых наблюдений t = Т + 1 легко пересчитывать коэффициенты модели. Однако подбор оптимальной постоянной сглаживания все так же сопряжен с обозначенными выше сложностями. Единственным адекватным решением на данный момент является использование процедуры ретропрогноза при подборе оптимальной а.

Чтобы обобщить МНК с дисконтированием для множественных регрессий, рассмотрим его в матричном виде для модели вида

(10.17)

Здесь Y (фактические значения зависимой переменной), А (коэффициенты модели) и ε (ошибки модели) – это векторы, а X (независимые переменные) – матрица, такие, что

Чтобы применить МНК с дисконтированием, вводится квадратная матрица весов, на диагонали которой стоят веса, соответствующие наблюдениям, а в остальных ячейках – нули:

Итоговый вектор коэффициентов в матричном виде рассчитывается по формуле

(10.18)

Таким образом, задавая различные значения постоянной сглаживания, можно получать такие оценки множественной регрессии, которые позволяли бы в разных ситуациях учитывать имеющиеся в распоряжении наблюдения в разной степени.

Заметим, что МНК с дисконтированием фактически является одной из разновидностей взвешенного МНК. Главной особенностью МНК с дисконтированием является то, что в нем веса распределяются в соответствии с принципом обесценивания данных во времени: новые наблюдения имеют бо́льшую ценность, чем старые.

Рассмотрим пример с построением модели множественной регрессии. В табл. 10.1 приведены данные условного примера.

Таблица 10.1

Данные условного примера

Месяц

Объем выпуска, уt

Стоимость материалов, x1,t

Затраты

труда, x2,t

Затраты капитала, х3,t

Январь 2009

147

22

63

1002

Февраль 2009

175

22

64

1035

Март 2009

175

20

65

1027

Апрель 2009

151

24

65

994

Май 2009

170

23

66

995

Июнь 2009

167

24

67

992

Июль 2009

172

24

67

1016

Август 2009

151

23

68

1048

Сентябрь 2009

156

23

68

1030

Октябрь 2009

160

24

69

1065

Ноябрь 2009

173

26

70

1054

Декабрь 2009

165

27

70

1060

Январь 2010

158

28

71

1077

Февраль 2010

168

30

71

1083

Март 2010

161

31

72

1063

Апрель 2010

141

29

72

1051

Май 2010

156

30

73

1179

Июнь 2010

177

31

74

1277

Июль 2010

190

30

74

1298

Август 2010

187

31

75

1268

Сентябрь 2010

201

31

76

1302

Октябрь 2010

189

31

76

1302

Ноябрь 2010

199

33

77

1290

Декабрь 2010

203

34

77

1313

Январь 2011

199

36

78

1287

Февраль 2011

194

38

78

1274

Март 2011

206

37

79

1321

Апрель 2011

205

38

80

1323

Май 2011

204

38

80

1273

Июнь 2011

194

38

81

1280

Июль 2011

230

37

82

1336

Август 2011

219

37

82

1347

Сентябрь 2011

230

37

83

1341

Октябрь 2011

208

39

83

1275

Ноябрь 2011

232

40

84

1334

Декабрь 2011

251

40

84

1459

Для построения модели воспользуемся предложенным нами принципом минимизации ошибки ретропрогноза. Для этого из всех наблюдений уберем последние 12: по наблюдениям с января по июнь 2011 г. мы будем оценивать значение а (подставляя в модель имеющиеся значения X), по последним шести наблюдениям мы будем сравнивать прогнозы по полученной модели с прогнозами по модели, оцененной обычным МПК.

В результате оценки коэффициентов МНК с дисконтированием была получена следующая модель:

(10.19)

По значению постоянной сглаживания видно, что для минимизации ошибки ретропрогноза в расчете коэффициентов использовалось такое значение постоянной сглаживания, которое гарантирует медленное убывание весов. Это значит, что в формировании значений коэффициентов первые наблюдения используются в меньшей степени, чем последние имеющиеся, однако некоторую роль они все равно играют: вес самого первого наблюдения оказался равен примерно 0,001028. В случае с обычным МПК его вес был бы равен 0,041667, это значение играло было более существенную роль в формировании оценок коэффициентов.

sMAPE (для наблюдений с июля по декабрь 2011 г.) по полученной модели (10.19) оказалась равной 6,26%. Графически расчетные значения и прогноз по модели представлены на рис. 10.4 (жирная сплошная линия).

Объем выпуска, расчетные и прогнозные значения по моделям (10.19), (10.20)

Рис. 10.4. Объем выпуска, расчетные и прогнозные значения по моделям (10.19), (10.20)

Как видим, значения оказались систематически заниженными, что может быть вызвано малой выборкой, по которой рассчитывалась ошибка ретропрогноза. Однако сами значения оказались достаточно близки к фактическим.

В качестве альтернативы рассчитаем коэффициенты той же модели МНК по ряду наблюдений с января 2009 г. но июнь 2011 г. Получим следующую регрессионную модель:

(10.20)

Как видим, коэффициенты моделей (10.19) и (10.20) различаются значительно: некоторые из факторов в одной модели влияют на результат положительно, а в модели (10.20) – уже отрицательно. Это указывает на то, что в исследуемом объекте произошли качественные, необратимые изменения. В связи с тем что модель (10.20) усредняет значения по всем наблюдениям, эти качественные изменения были так же усреднены. В результате этого точность прогноза по модели, оцененной МНК, оказалась ниже: sMAPE составила 12,26%. Графически модель (10.20) и прогноз по ней изображены на рис. 10.4 пунктирной линией. Видно, что из-за задания одинаковых весов модель дала прогноз с бо́льшим занижением, чем модель (10.19).

Заметим, что в нашем условном примере мы специально сформировали ряд данных таким образом, чтобы зависимость после июня 2010 г. изменилась. По объективным причинам результирующая модель (10.19) по своим оценкам оказалась ближе к модели "лежащей в основе" нашего ряда, чем модель (10.20).

Одной из проблем МНК с дисконтированием, как мы уже отметили, является невозможность автоматической оценки модели по исходному ряду данных (в связи с чем и приходится прибегать к процедуре ретропрогноза). С ней связана и проблема построения прогнозных интервалов. Действительно, обычно при расчете прогнозных интервалов требуется оценить дисперсию ошибок, но в случае МНК с дисконтированием ошибки в начале ряда не имеют смысла из-за того, что учитываются с малыми весами, а ошибки в конце ряда оказываются крайне малыми из-за больших весов при расчете коэффициентов. Единственной оценкой дисперсии ошибок может выступать дисперсия ошибок ретропрогноза. Статистически обосновать методы построения интервальных прогнозов в таких условиях оказывается крайне затруднительно. Простым выходом из этой ситуации может быть построение прогнозного интервала на основе неравенства Чебышева (пример метода построения таких интервалов был рассмотрен нами в параграфе 9.2) с использованием дисперсии ошибок ретропрогноза:

, (10.21)

где – дисперсия ошибки ретропрогноза.

Интервалы, построенные таким образом для модели (10.19), показаны на рис. 10.4. Видно, что в связи с небольшим значением дисперсии ошибки интервалы получились не слишком широкими, однако в них попала бо́льшая часть прогнозируемых значений.

Результат предложенного в данном параграфе метода автоматической оценки значения постоянной сглаживания при использовании этого подхода в МПК с дисконтированием сильно зависит от числа наблюдений, включенных в часть для ретропрогноза, и от того, какие именно наблюдения включаются в нее. Тем не менее метод имеет право на существование и в ряде случаев позволяет достаточно быстро получить точные прогнозы.

 
< Пред   СОДЕРЖАНИЕ     След >