Простейшие модификации модели Брауна
Используя принцип адаптации, заложенный в модель простого экспоненциального сглаживания, можно предложить несколько простых модификаций модели для различных рядов данных.
Простое экспоненциальное сглаживание с дрейфом
Название данная модель получила по аналогии с моделью дрейфа, рассмотренной нами в параграфе 5.2. Сама исходная модель, по которой осуществляется прогноз, имеет следующий вид:
(7.37)
где b – это коэффициент угла наклона, который рассчитывается по всему ряду данных.
Прогноз по этой модели осуществляется на основе формулы
(7.38)
Как можно заметить, прогноз по формуле (7.38) представляет собой простую прямую линию с углом наклона b. Отличительной особенностью в данном случае является то, что в модели адаптируется только уровень ряда. Угол наклона считается неизменным. Очевидно, что такая модель будет давать точные прогнозы в ситуациях, когда в ряде данных наблюдается более-менее постоянный рост либо снижение. В самой модели (7.37) можно заметить, что b, скорее, играет роль показателя прироста, нежели угла наклона.
Стоит так же отметить, что в ситуации, когда α = 0, исследователь получает простую модель тренда, которая никак не адаптируется к значениям ряда данных.
Постоянная сглаживания в модели (7.37) лежит в тех же пределах, что и постоянная сглаживания в модели простого экспоненциального сглаживания.
Для старта модели можно использовать те же методы, что и рассмотренные нами в параграфе 7.2.
Р. Хайндман показал, что модель (7.37) эквивалентна модели "Theta" в случае, когда коэффициент b равен половине коэффициента угла наклона, рассчитанного по всему ряду данных[1]. Модель "Theta" была предложена в 2000 г.[2] и во время исследования М3 – Competition[3] дала очень точные прогнозы по многим рядам данных.
Построим прогноз по ряду № 41, используя модель простого экспоненциального сглаживания с дрейфом, принимая b равным половине коэффициента угла наклона (построим модель, эквивалентную модели "Theta"). Фактические значения по ряду и расчетные значения по модели, а также полученный прогноз показаны на рис. 7.9.
Рис. 7.9. Аппроксимация ряда данных № 41 из базы М3 и его прогноз на шесть наблюдений вперед (на период с 1989 по 1994 г.) моделью простого экспоненциального сглаживания с дрейфом:
линия с точками – фактические значения; линия без точек – расчетные значения
Как видим, модель (7.37) дата прогноз из предположения о том, что сложившиеся во время аппроксимации тенденции сохранятся на периоде прогнозирования, которое в данном конкретном случае не выполнилось. В результате этого прогноз оказался несколько завышенным: sMAPE = 22,58%. Постоянная сглаживания оказалась лежащей в запредельном множестве: α = 1,86, что указывает на то, что в ряде данных изменяется не только уровень, но и угол наклона: из-за того, что он никак не адаптируется, всю адаптацию берет на себя константа.
Модель адаптации к приростам
Еще одна простая модификация модели Брауна представляет собой ситуацию адаптации уже не уровня ряда, а угла наклона. Получить такую модель достаточно просто: достаточно перейти к первым разностям в исходном ряде данных и по ним построить модель Брауна. Итоговая модель адаптации приростов будет иметь вид
(7.39)
(7.40)
Первые разности по исходному ряду данных представляют собой прирост показателя. Если исходный ряд данных имел какую-то стабильную тенденцию к росту, то разности этого ряда будут иметь примерно один уровень. Отметим, что переход к разностям сокращает имеющийся ряд данных на одно наблюдение.
Чтобы получить прогноз по модели (7.39) после расчета оптимальной постоянной сглаживания, нужно перейти к исходному ряду, что легко делается путем элементарных перестановок в (7.40) для расчетных значений:
(7.41)
Однако из-за рекуррентного характера формулы (7.41) требуется задать самое первое расчетное значение, которого, конечно же, нет в распоряжении. Его можно заменить фактическим значением на этом наблюдении или же использовать иные процедуры, которые были описаны выше.
В модели Брауна на периоде прогнозирования вводится предположение о том, что уровень ряда изменяться не будет, что в разностях может быть записано как
(7.42)
Сочетая (7.41) и (7.42), можно получить итоговую формулу для получения прогноза на h шагов вперед:
(7.43)
Стоит отдельно заметить, что, раз мы адаптируем расчетные разности к фактическим, то и критерий для оптимизации стоит использовать но разностям. Например, минимизируемая сумма квадратов отклонений в данном случае будет иметь вид
Очевидно, что постоянная сглаживания в данном случае все так же лежит в пределах от 0 до 2. Получение оптимальной постоянной сглаживания в запредельном множестве указывает на то, что ряд в разностях носит нестационарный характер, что возможно, например, в случае с нелинейными тенденциями в исходном ряде (например, если исходный ряд данных описывается параболой, то ряд в разностях будет описываться линейной функцией).
В качестве стартовых значений применимы все рассмотренные нами в параграфе 7.2 методы.
Рассмотрим прогноз по этому методу на том же примере ряда № 41 (рис. 7.10).
Рис. 7.10. Аппроксимация ряда данных № 41 из базы М3 и его прогнозы на шесть наблюдений вперед моделью адаптации к приростам:
сплошная линия – фактические значения;
прерывистая – расчетные значения
На данном рисунке представлены модели, построенные по тем же шести методам задания стартовых значений, что и в примере в параграфе 7.2. Как видим, во многих случаях итоговые расчетные значения сильно отклонились от фактических из-за того, что в ряде данных тенденция к росту меняется, а оптимальная постоянная сглаживания по ряду разностей во всех случаях оказалась небольшой (а в двух из них – одинаковой, близкой к нулю). В табл. 7.4 приведены значения а и sMAPE для каждого из методов.
Таблица 7.4
Разные методы задания стартовых значений и соответствующие им постоянные сглаживания и ошибки прогноза по ряду № 41
Метод (№) |
Значения оптимальной а |
sMAPE но прогнозу на шесть наблюдений, % |
1 |
0,363 |
26,17 |
2 |
0,151 |
23,73 |
3 |
0,363 |
25,79 |
4 |
0,223 |
24,70 |
5 |
0,000 |
25,21 |
6 |
0,000 |
25,21 |
Если взглянуть на график по разностям ряда № 41 (рис. 7.11), то мы увидим, что в них действительно не наблюдается каких-либо существенных изменений. Поэтому, например, по методу 6 (с подбором начальной точки) оптимальная постоянная сглаживания оказалась фактически равной нулю: программа подобрала некоторую среднюю
Рис. 7.11. График первых разностей ряда № 41
величину по ряду, отклонения от которой минимальны, адаптировать которую не имеет смысла. В результате этого график модели с этим значением (рис. 7.10) представляет собой прямую возрастающую линию.
- [1] Hyndman R.J., Billah В. Unniasking the Theta method // International Journal of Forecasting. 2003. Vol. 19(2). P. 287-290.
- [2] Assimakopoulos V., Nikolopoulos K. The theta model: a decomposition approach to forecasting // International Journal of Forecasting, 2000. Vol. 16. P. 521-530.
- [3] Makridakis S., Hibon M. The М3 – competition: Results, conclusions and implications // International Journal of Forecasting. 2000. Vol. 16. P. 451–476.