Прогнозирование с помощью тренд-сезонных моделей

Обратимся теперь к тому, как именно можно дать прогноз по сезонному ряду данных с использованием упомянутых методов декомпозиции и метода фиктивных переменных.

Для примера возьмем все тот же ряд данных № 1683 из базы рядов М3. Мы уже проводили его декомпозицию методами классической декомпозиции, Х-12 и STL. Во всех трех случаях мы сталкивались с тем, что трендовая компонента изменяется во времени. Это означает, что вместо того, чтобы строить модель тренда по всему ряду данных, возможно, имело бы смысл выбрать какую-то его последнюю часть.

В случае с классической декомпозицией ситуация усложняется потерей последних шести наблюдений. Рассмотрим отдельно трендовую компоненту, полученную нами после декомпозиции в параграфе 6.3 (рис. 6.21).

Трендовая компонента ряда № 1683 после проведения процедуры классической декомпозиции и модель тренда, построенная по всему имеющемуся ряду

Рис. 6.21. Трендовая компонента ряда № 1683 после проведения процедуры классической декомпозиции и модель тренда, построенная по всему имеющемуся ряду[1]

Стандартный метод построения тренд-сезонных моделей подразумевает использование всех наблюдений в одинаковой мере, поэтому мы построим модель линейного тренда по всему ряду данных. Кроме того, в среднем по ряду наблюдается медленный рост, который может быть описан такой моделью. В результате получим следующее уравнение тренда:

(6.30)

То, как данная модель описывает трендовую компоненту и какой дает по ней прогноз, отражено на рис. 6.21. Как видим, модель линейного тренда сильно усредняет тенденцию, имеющуюся в ряде данных. По рисунку так же виден промежуток с отсутствующими значениями трендовой компоненты (часть ряда до вертикальной сплошной линии). Прогноз по построенной модели тренда отображен после вертикальной сплошной линии.

Чтобы дать прогноз по самому ряду, полученные значения тренда нужно умножить на соответствующие значения сезонных коэффициентов (напоминаем, мы строили мультипликативную модель). Тогда будет получена тренд-сезон пая модель, на основе которой можно дать точечный прогноз (рис. 6.22).

Ряд № 1683 (сплошная линия с точками до вертикальной линии и пунктирная линия с незакрашенными кружками после вертикальной линии), тренд-сезонная модель (сплошная линия до вертикальной линии и сплошная линия с точками после вертикальной линии), построенная на основе классического метода сезонной декомпозиции, и тренд (6.30) (прерывистая линия, проходящая но графику слева направо)

Рис. 6.22. Ряд № 1683 (сплошная линия с точками до вертикальной линии и пунктирная линия с незакрашенными кружками после вертикальной линии), тренд-сезонная модель (сплошная линия до вертикальной линии и сплошная линия с точками после вертикальной линии), построенная на основе классического метода сезонной декомпозиции, и тренд (6.30) (прерывистая линия, проходящая но графику слева направо)

Как видим, в среднем тренд-сезонная модель, построенная на основе классической декомпозиции спрогнозировала ряд данных неплохо, отразив все сезонные колебания. Единственная проблема в полученном прогнозе заключается в недооценке пика, произошедшего в июле 1994 г.

Для оценки точности прогноза, мы рассчитали sMAPE. По полученной нами модели для прогнозируемого участка sMAPE = 5,61%.

Рассмотрим теперь динамику трендовой составляющей в декомпозиции Х-12 (рис. 6.23).

Трендовая компонента ряда № 1683 после проведения процедуры декомпозиции Х-12

Рис. 6.23. Трендовая компонента ряда № 1683 после проведения процедуры декомпозиции Х-12

Динамика трендовой составляющей здесь более гладкая, чем в классической декомпозиции, однако менее монотонная. Начиная с июля 1991 г. наблюдается тенденция к более сильному росту показателя, а ближе к концу ряда трендовой компоненты – нелинейный рост, однако эти черты мы в расчет брать не будем и построим линейную модель по всему ряду (как это и предполагает стандартный подход). Получим следующее уравнение тренда:

(6.31)

Как видим, тренд (6.31) несущественно отличается от тренда (6.30): угол наклона оказался выше на 1,1 единицы, что, возможно, вызвано наличием последних шести точек, которые выпали из рассмотрения в классической декомпозиции. Для построения финальной тренд-сезонной модели допустим, что в будущем мы можем ожидать такие же значения сезонных коэффициентов, какие мы получили в последнем году. Регрессионную составляющую мы убираем из рассмотрения, так как в ходе проведения декомпозиции Х-12 мы убедились в ее незначимости. Перемножив сезонные коэффициенты на тренд (6.31), получим модель, показанную на рис. 6.24.

Ряд № 1683 (сплошная линия с точками до вертикальной линии и пунктирная линия с незакрашенными кружками после вертикальной линии) и тренд-сезонная модель (сплошная линия до вертикальной линии и сплошная линия с точками после вертикальной линии), построенная на основе метода Х-12

Рис. 6.24. Ряд № 1683 (сплошная линия с точками до вертикальной линии и пунктирная линия с незакрашенными кружками после вертикальной линии) и тренд-сезонная модель (сплошная линия до вертикальной линии и сплошная линия с точками после вертикальной линии), построенная на основе метода Х-12

Первое, что обращает на себя внимание, – это то, что полученный прогноз очень похож на прогноз по методу классической декомпозиции: он так же повторяет сезонные флуктуации и так же несколько недооценивает пик в июле 1994 г. Симметричная ошибка аппроксимации, рассчитываемая но формуле (2.21), для данного прогноза оказалась немного меньше, чем в случае с классической декомпозицией: sMAPE = 5,41%.

Обратимся к трендовой составляющей, полученной в результате STL (рис. 6.25).

Трендовая компонента ряда № 1683 после проведения процедуры декомпозиции STL

Рис. 6.25. Трендовая компонента ряда № 1683 после проведения процедуры декомпозиции STL

Можно заметить, что трендовая составляющая, полученная в данном случае, оказалась значительно более гладкой, чем трендовые составляющие в классической декомпозиции и Х-12. Начиная с октября 1991 г., наблюдается ровная линейная тенденция. Однако для того, чтобы создать более или менее одинаковые условия для всех моделей, мы построим линейный тренд так же, как делали до того – по всему ряду. Получим следующее уравнение:

(6.32)

Теперь так же, как мы это сделали с Х-12, предположим, что на периоде прогнозирования сезонная компонента будет идентична полученной в последнем году, умножим ее на прогнозные значения по тренду. В результате получим прогноз, представленный на рис. 6.26.

Как видим, точечный прогноз по такой тренд-сезонной модели лучше спрогнозировал пик и падения, однако в нескольких точках оказался дальше, чем прогнозы но предыдущим двум моделям. Вызвано это в первую очередь тем, какими получились сезонные компоненты в результате декомпозиции и как мы их спрогнозировали.

Симметричная ошибка аппроксимации для данного прогноза оказалась выше предыдущих двух: sMAPE = 6,86%. Более точная регулировка коэффициента сглаживания во время декомпозиции могла бы повысить точность прогноза. Однако знать заранее, какую именно величину надо взять для получения точного прогноза, невозможно.

Ряд № 1683 (сплошная линия с точками до вертикальной линии и пунктирная линия с незакрашенными кружками после вертикальной линии) и тренд-сезонная модель (сплошная линия до вертикальной линии и сплошная линия с точками после вертикальной линии), построенная на основе метода STL

Рис. 6.26. Ряд № 1683 (сплошная линия с точками до вертикальной линии и пунктирная линия с незакрашенными кружками после вертикальной линии) и тренд-сезонная модель (сплошная линия до вертикальной линии и сплошная линия с точками после вертикальной линии), построенная на основе метода STL

Рассмотрим модель тренда с сезонностью, учтенной через фиктивные переменные. Строим мы ее так же по всему ряду данных, что создает более или менее одинаковые условия для всех моделей.

В качестве основы мы будем использовать все ту же модель линейного тренда, а для того, чтобы учесть сезонность мультипликативно, включим фиктивные переменные в угол наклона, как это было сделано в (6.29). Чтобы получить отдельные значения коэффициентов для каждой из фиктивных переменных, мы уберем из рассмотрения коэффициент угла наклона при t и включим все 12 фиктивных переменных. Оценим уравнение такого вида с помощью МНК, в результате чего получим следующую модель:

(6.33)

где jan, feb, mar и т.п. – фиктивные переменные, отвечающие соответственно за январь, февраль, март и т.д.

Обращает на себя внимание тот факт, что коэффициенты при фиктивных переменных за май – июнь оказались значительно выше остальных коэффициентов. Это говорит о том, что увеличение показателя происходит в большей степени в обозначенные месяцы. Пик в среднем приходится на сентябрь. Прогноз по модели (6.33) представлен на рис. 6.27.

Ряд № 1683 (сплошная линия с точками до вертикальной линии и пунктирная линия с незакрашенными кружками после нее – ряд, использовавшийся при построении модели) и прогноз по модели тренда с фиктивными переменными (сплошная линия до вертикальной линии и сплошная линия с точками – после нее)

Рис. 6.27. Ряд № 1683 (сплошная линия с точками до вертикальной линии и пунктирная линия с незакрашенными кружками после нее – ряд, использовавшийся при построении модели) и прогноз по модели тренда с фиктивными переменными (сплошная линия до вертикальной линии и сплошная линия с точками – после нее)

Сразу же можно отметить, что прогноз по модели с фиктивными переменными оказался самым точным: за счет усреднения модель спрогнозировала как пик, так и отдельные отклонения от тренда. Симметричная ошибка здесь: sMAPE = 4.24%.

Что любопытно, исходный ряд данных модель аппроксимировала незначительно лучше, чем тренд-сезонная модель на основе классической декомпозиции; Х-12 и STL в нашем примере лучше справились с аппроксимацией.

В заключение стоит заметить, что данный пример ни в коем случае не говорит о превосходстве одного метода над другими. То, что линейный тренд с фиктивными переменными дал самый точный прогноз, может быть чистой случайностью. Поэтому однозначное предпочтение какому-то одному из методов отдавать нельзя. Кроме того, помимо выбора метода сезонной декомпозиции, на прогнозисте лежит ответственность за выбор модели тренда. Возможно, если бы мы выбрали другую модель или же построили ее не по всему ряду данных, а по его части, ситуация изменилась бы и на первое место вышла какая-то другая тренд-сезонная модель.

В любом случае выбор тренда и метода декомпозиции, на основе которого будет построен прогноз, должен осуществляться, исходя из поставленных перед прогнозистом задач, а также с учетом всех преимуществ и недостатков рассмотренных нами в этом параграфе методов.

  • [1] Вертикальной линией обозначено последнее имевшееся в распоряжении исследователя наблюдение.
 
< Пред   СОДЕРЖАНИЕ     След >