Применение адаптивных моделей, основанных на экспоненциальном сглаживании, для краткосрочного прогнозирования
Традиционные подходы к прогнозированию экономических процессов и явлений опираются на предположение об инерционности их развития, неизменности ранее наблюдавшихся тенденций, устойчивом характере воздействия факторов. Это позволяет осуществлять экстраполяцию при прогнозировании, продлевая ранее выявленные закономерности в будущее.
Однако в условиях возросшей неустойчивости внешней среды, при изменчивой конъюнктуре внешнего и внутреннего рынков, происходящих изменениях в финансовой сфере, социально-экономической области возрастает подвижность исследуемых систем, нарушается инерционность их развития. В связи с этим для моделирования и прогнозирования сложных экономических процессов требуется гибкий аналитический инструментарий, способный оперативно учитывать происходящие изменения.
Адаптивные методы прогнозирования, опирающиеся на экспоненциальное сглаживание, имеют в этих условиях ряд серьезных преимуществ перед традиционными подходами при оперативном и краткосрочном прогнозировании.
Следует выделить ключевые особенности адаптивных моделей, вызывающие к ним большой практический интерес.
Очевидно, что при построении моделей прогнозирования трудно считать все уровни временного ряда "равнозначными", так как наиболее ценными представляются последние уровни, в большей степени отражающие происходящие изменения. Различная информационная значимость имеющихся уровней учитывается в адаптивных моделях с помощью гибкой системы весовых коэффициентов. Самые "свежие" данные будут оказывать более существенное воздействие на формирование оценок коэффициентов адаптивных моделей, весомость более ранних (старых) наблюдений будет снижаться.
Адаптивные методы позволяют строить модели с обратной связью, обладающие способностью осуществлять корректировку своих параметров в зависимости от полученных результатов прогнозирования. Предположим. что на текущем шаге определены коэффициенты модели, опираясь на которые, мы осуществляем расчет прогноза. Значение ошибки, представляющей разницу между фактическим значением и ранее рассчитанным прогнозным, учитывается в модели с целью корректировки значений ее коэффициентов. На основе рекуррентных формул осуществляется пересчет коэффициентов модели, причем чем больше ошибка, тем значительнее компенсирующие воздействия. Скорректированные значения коэффициентов используются при расчете прогнозного значения на следующем шаге, и вся процедура их адаптации повторяется вновь. Такая схема функционирования позволяет говорить о построении самонастраивающихся, самокорректирующихся моделей.
Процесс адаптации происходит итеративно, модель постоянно приспосабливается к происходящим изменениям, причем имеется возможность регулировать быстроту реакции модели с помощью так называемых параметров адаптации (их в модели может быть несколько).
Указанные свойства адаптивных моделей позволяют рассматривать их в качестве эффективного инструментария при оперативном и краткосрочном прогнозировании сложных экономических процессов.
Основой этого класса моделей служит процедура экспоненциального сглаживания. Пусть уровни временного ряда представлены в виде
где– случайные неавтокоррелированныс отклонения с нулевым математическим ожиданием и постоянной дисперсией
.
Модель экспоненциального сглаживания описывается рекуррентной формулой
(8.17)
гдеи
– значения экспоненциальной средней (соответственно в моменты времени
и
);
– параметр сглаживания,
;
Можно преобразовать выражение (8.17) таким образом, чтобы показать зависимость S, не только от текущего уровня (), но и от предшествующих:
В результате можно представить экспоненциальную среднюю в следующем виде:
(8.18)
где и – длина ряда;– начальное значение экспоненциальной средней.
Так как при вычислении экспоненциальной средней на текущем шаге требуется учитывать ее значение на предыдущем, то для расчетапредварительно необходимо определить некоторую величину
. Как правило, на практике в качестве значения
используется среднее арифметическое значение, рассчитанное на основе всех уровней временного ряда или какой-то их части.
Как следует из выражения (8.18), при, следовательно,
(8.19)
Таким образом, величинаоказывается взвешенной суммой уровней временного ряда. Причем веса возрастают для более "свежих" наблюдений по экспоненциальной функции, чем объясняется название модели. В табл. 8.16 показано изменение весов уровней временного ряда при использовании экспоненциального сглаживания при различных значениях параметра сглаживания а.
Таблица 8.16
Изменение весов уровней временного ряда при экспоненциальном сглаживании
Уровни временного ряда |
Расчет весовых коэффициентов |
Значения весовых коэффициентов |
|
|
|
||
|
|
0,2000 |
0,4000 |
|
|
0.1600 |
0,2400 |
|
|
0,1280 |
0,1440 |
|
|
0,1024 |
0,0864 |
|
|
0.0819 |
0,0518 |
Остальные уровни и "90 |
0.3277 |
0,0778 |
Данные табл. 8.16 иллюстрируют скорость, с которой убывают веса по мере удаления соответствующих наблюдений в прошлое, причем вес текущего наблюдения () превышает вес остальных уровней, вес предыдущего уровня (
) превосходит вес прошлых уровней, но уступает весомости более позднего наблюдения (
) и т.д.
Р. Браун, автор рассматриваемой модели, показал, что дисперсия экспоненциальной средней, зависящая от значения параметра сглаживания а, будет меньше дисперсии временного ряда (
) [16, 25].
Преобразуем выражение (8.19) следующим образом:
Из последнего выражения очевидно, что математическое ожидание , так же как и математическое ожидание самого временного ряда.
В свою очередь дисперсияможет быть представлена в виде
С учетом ранее отмеченных свойствможно записать
Таким образом,
(8.20)
Так как диапазон изменения параметра сглаживания определяется неравенством, то
меньше
(дисперсии временного ряда).
Из формулы (8.20) следует, что при снижении значенияпроисходит уменьшение дисперсии экспоненциальной средней, приводящее к получению более гладкого временного ряда с менее существенными колебаниями уровней, что позволяет рассматривать экспоненциальную среднюю в роли фильтра.
В то же время повышение значения а способствует увеличению веса более поздних наблюдений, при этом уменьшается различие дисперсий сглаженного и исходного рядов. Значение параметра сглаживания а определяется с учетом специфики решаемой задачи.
Пример 8.8
В табл. 8.17 представлен 1,1 значения индекса ММВБ с 04.06.2013 по 28.06.2013, на основе которых требуется рассчитать экспоненциальные средние, применив следующие значения параметров сглаживания: а)б)
; в)
. При проведении расчетов следует использовать среднюю арифметическую из пяти первых уровней в качестве начального значения (
).
Таблица 8.17
Временной ряд индекса ММВБ для примера 8.8
Дата |
Порядковый номер уровня t |
Индекс ММВБ |
04.06.2013 |
1 |
1337,52 |
05.06.2013 |
2 |
1341,33 |
06.06.2013 |
3 |
1326,73 |
07.06.2013 |
4 |
1316,32 |
10.06.2013 |
5 |
1343,90 |
11.06.2013 |
6 |
1335,25 |
13.06.2013 |
7 |
1302,52 |
14.06.2013 |
8 |
1282,46 |
17.06.2013 |
9 |
1300,02 |
18.06.2013 |
10 |
1325,09 |
19.06.2013 |
11 |
1334,66 |
20.06.2013 |
12 |
1323,55 |
21.06.2013 |
13 |
1297,01 |
24.06.2013 |
14 |
1298,41 |
25.06.2013 |
15 |
1289,76 |
26.06.2013 |
16 |
1297,59 |
27.06.2013 |
17 |
1320,39 |
28.06.2013 |
18 |
1314,68 |
Требуется провести сравнительный графический анализ динамики исходных данных и временных рядов, полученных после экспоненциального сглаживания. Решение
Поясним расчеты на примере экспоненциальной средней при а = 0,2, так как при других значениях параметра сглаживания они носят аналогичный характер. Имеем
Далее в соответствии с формулой (8.17):
Результаты расчетов представлены в табл. 8.18.
Таблица 8.18
Экспоненциальные средние для временного ряда индекса ММВБ
Порядковый номер уровня t |
Экспоненциальная средняя |
||
|
|
|
|
1 |
1334,03 |
1335,34 |
1336,65 |
2 |
1335,49 |
1338,34 |
1340,39 |
3 |
1333,74 |
1332,53 |
1329,46 |
4 |
1330,26 |
1324,43 |
1318,95 |
5 |
1332,98 |
1334,16 |
1338,91 |
6 |
1333,44 |
1334,71 |
1335,98 |
7 |
1327,25 |
1318,61 |
1309,21 |
8 |
1318,30 |
1300,54 |
1287,81 |
9 |
1314,64 |
1300,28 |
1297,58 |
10 |
1316,73 |
1312.68 |
1319,59 |
11 |
1320,32 |
1323.67 |
1331,65 |
12 |
1320,96 |
1323,61 |
1325.17 |
13 |
1316,17 |
1310,31 |
1302.64 |
14 |
1312,62 |
1304,36 |
1299,26 |
15 |
1308,05 |
1297.06 |
1291,66 |
16 |
1305,96 |
1297,33 |
1296,40 |
17 |
1308,84 |
1308.86 |
1315.59 |
18 |
1310,01 |
1311.77 |
1314,86 |
Как показывает рис. 8.14, в наибольшей степени случайные колебания поглощены при значении параметра сглаживания, равном 0,2, что отразилось на более гладком характере динамики соответствующей экспоненциальной средней.
Рис. 8.14. Экспоненциальное сглаживание временного ряда индекса ММВБ при различных значениях параметра адаптации:
– фактические уровни;
– экспоненциальная средняя при α = 0,2;
– экспоненциальная средняя при α = 0,5;
– экспоненциальная средняя при α = 0,8
Рассмотрим, как модель экспоненциального сглаживания может быть использована для краткосрочного прогнозирования. Предположим, что уровни временного ряда представлены в виде
где– варьирующий во времени средний уровень ряда;
– случайные неавтокоррелированные отклонения с нулевым математическим ожиданием и постоянной дисперсией
Тогда прогноз определяется следующим образом:
(8.21)
где– прогноз, сделанный в момент времени
на
"шагов", тактов времени вперед;
– оценка
С помощью экспоненциальной средней определяется единственный параметр модели
Преобразуем выражение (8.17) к следующему виду;
В полученном выражении () рассматривается в качестве допущенной ошибки, поэтому учет с весом а этого слагаемого отражает процесс корректировки, адаптации модели.
Таким образом, экспоненциальное сглаживание можно рассматривать в качестве примера самообучающейся модели, к достоинствам которой следует отнести простоту ее реализации.
Пример 8.9
Рассмотрим ежедневную динамику объема продаж интернет-магазина в течение четырех месяцев (п = 122). Визуальный анализ динамики (рис. 8.15) показывает отсутствие периодических колебаний и детерминированного тренда, при этом для уровнен исследуемого временного ряда характерны колебания около среднего значения, равного 98,1 тыс. руб. Для моделирования и прогнозирования динамики этого временного ряда применим модель (8.21) при значении параметра адаптации α = 0.7.
Рис. 8.15. Ежедневная динамика объема продаж интернет-магазина
В табл. 8.19 показан фрагмент вычислений, поясняющий работу описанного алгоритма.
Для начала было задано значение, равное значению первого уровня исходного временного ряда, при этом
. Значения экспоненциальной средней
(гр. 3 табл. 8.19) определяются согласно выражению (8.17), значения в гр. 4 табл. 8.19 – исходя из равенства
Таблица 8.19
Результаты моделирования и прогнозирования объема продаж интернет-магазина
t |
Объем продаж |
Экспоненциальная средняя S, |
|
Расчетные уровни |
1 |
2 |
3 |
4 |
5 |
0 |
98,0 |
98,0 |
||
1 |
98,0 |
98,0 |
98,0 |
98,0 |
2 |
98,4 |
98,3 |
98,3 |
98,0 |
3 |
99,5 |
99,1 |
99,1 |
98.3 |
4 |
99,1 |
99,1 |
99,1 |
99,1 |
5 |
98.5 |
98,7 |
98,7 |
99,1 |
120 |
97,9 |
97,8 |
97,8 |
97,8 |
121 |
99.0 |
98,7 |
98,7 |
97,8 |
122 |
98.0 |
98.2 |
98.2 |
98,7 |
123 |
98,2 |
Расчетные уровни (прогнозные значения) по згой модели определялись в соответствии с моделью (8.21) при т = 1, т.е. на один день вперед. Таким образом, прогноз объема продаж интернет-магазина на следующий 123-й день составил 98,2 тыс. руб., что соответствует значению экспоненциальной средней в предыдущий день (при t = 122). Результаты прогнозирования, представленные на рис. 8.16, свидетельствуют о близости фактических и расчетных уровней и высокой точности модели.
Рис. 8.16. Результаты прогнозирования объема продаж интернет-магазина:
– фактические уровни;
– расчетные уровни
Средняя относительная ошибка по модулю (МАРЕ) составила менее 0,74%, средняя абсолютная ошибка по модулю (МАЕ) – 0,7 тыс. руб., при этом анализ остатков указал на отсутствие значимой автокорреляции.
Несмотря на высокое качество построенной модели, следует учитывать, что область ее применения ограничена оперативными прогнозами. При прогнозировании на 2, 3, 4, 5,... дней вперед прогнозные значения будут совпадать с прогнозом в 123-й точке, т.е. с имеющимся самым "свежим" значением экспоненциальной средней. Эти прогнозные значения на рис. 8.16 были бы представлены прямой, параллельной оси абсцисс. Поэтому по мере поступления новых фактических значений целесообразно пересчитывать, корректировать прогнозные оценки, используя при этом небольшие значения периода упреждения т.
Примеры практики
Для расчета прогнозов с помощью экспоненциального сглаживания можно использовать статистическую надстройку MS Excel "Пакет анализа". Выбрав в диалоговом окне "Анализ данных" в качестве инструмента анализа "Экспоненциальное сглаживание", следует в открывшемся окне задать соответствующие входные данные (рис. 8.17).
На рис. 8.17, а указаны: входной интервал (В2: В124), содержащий значения дневных объемов продаж (из примера 8.9); значение параметра β = 1 – α = 0,3 в качестве фактора затухания; начало выходного интервала с результатами расчетов (ячейка С2). На рис. 8.17, б представлены результаты применения экспоненциального сглаживания, причем полученные в столбце С расчетные значения совпадают с результатами гр. 5 табл. 8.19, при этом в MS Excel расчетные значения начинаются со второго уровня.
Рис. 8.17. Экспоненциальное сглаживание в MS Excel:
а – диалоговое окно "Экспоненциальное сглаживание"; б – результаты экспоненциального сглаживания (фрагмент)
Модель (8.21) будет давать смещенные прогнозы в случае применения к временным рядам, в динамике которых выражена линейная тенденция, пусть даже с неустойчивым характером развития. Для таких временных данных часто используются модели линейного роста, в которых прогноз определяется следующим образом:
где и
– текущие оценки коэффициентов;
– время упреждения прогноза.
Чаще всего из моделей этого типа в аналитических пакетах представлена двухпараметрическая модель Ч. Хольта, разработанная им в 1957 г. [13, 16, 25]. На каждом шаге рассчитываются новые оценки коэффициентов модели в соответствии со следующими выражениями:
(8.22)
где
Таким образом, по мере поступления новых фактических значений оценки коэффициентов модели будут претерпевать изменения, причем уточнение будет касаться как оценок текущего уровня, так и коэффициента наклона
. При пересчете оценок коэффициентов по рекуррентным выражениям (8.22) будут использоваться различные значения параметров адаптации
для коэффициентов
и
Программные реализации модели, как правило, предусматривают возможность определения значений параметров адаптациипо критерию минимизации средней квадратической ошибки или других характеристик точности. При этом часто пользователю предлагается сформировать сетку возможных значений параметров адаптации (определить границы допустимого изменения значений, а также шаг изменения значений при поиске) с целью последующего выбора требуемой комбинации значений
Можно преобразовать формулы для расчета коэффициентов модели Хольта таким образом, чтобы в явном виде показать зависимостьи
от величины полученной ошибки прогноза:
где – ошибка прогноза.
Также большой практический интерес представляют адаптивные тренд- сезонные модели, которые, в отличие от традиционных подходов, отказываются от предположения об устойчивости, неизменности сезонных эффектов во времени.
Так, широко применяется модель Хольта – Уинтерса, представляющая собой объединение двухпараметрической модели линейного роста Хольта и модели Уинтерса для мультипликативного характера сезонности. Прогноз на т шагов вперед по этой модели определяется следующим образом:
(8.23)
где и
– текущие оценки коэффициентов в модели линейного роста;
– время упреждения прогноза;
– оценки мультипликативной сезонной составляющей;
– количество фаз в полном сезонном цикле (для ежемесячных наблюдений
, для квартальных –
).
В выражении (8.23) используется самая "свежая" оценка коэффициента сезонности, рассчитанная для аналогичной фазы цикла. Например, если при работе с данными ежемесячной динамики рассчитывается прогнозное значение для мая текущего года, то используется оценка сезонности для того же месяца, но рассчитанная (скорректированная) период (год) назад.
Оценки коэффициентов модели (8.23) пересчитываются (модифицируются) по формулам, представленным в табл. 8.20 (модель IV). Значения параметров адаптации можно находить экспериментальным путем, например из условия минимизации суммы квадратов ошибок.
Представленная в табл. 8.20 адаптивная модель II также опирается на модель линейного роста Хольта, но в сочетании с аддитивной сезонностью, что позволяет рассчитывать прогноз на т шагов вперед с помощью выражения
(8.24)
где и
– так же как в формуле(8.23) текущие оценки коэффициентов модели линейного роста;
– оценки аддитивной сезонной составляющей;
– количество фаз в полном сезонном цикле.
В табл. 8.20 представлены наиболее часто используемые на практике адаптивные модели, учитывающие сезонность в аддитивной или мультипликативной форме [25]. Причем две из представленных моделей наряду с сезонностью предполагают наличие тенденции линейного роста (модели II и IV), а другие две модели опираются на предположение об отсутствии детерминированного тренда (модели I и III).
Таблица 8.20
Адаптивные модели сезонных явлений
Характер сезонности |
Номер модели |
Модель прогноза |
Оценка текущих коэффициентов я,, и я2, |
Оценка сезонности |
Аддитивный |
I |
|
|
|
II |
|
|
|
|
Мультиплика тивный |
III |
|
|
|
IV |
|
|
|
Анализ формул (8.23) и (8.24) показывает, что прогнозные оценки получаются в результате экстраполяции тенденции линейного роста (с использованием последних имеющихся значений коэффициентови
), а также включения в модель самой "свежей" оценки сезонности. Очевидно, что в зависимости от характера сезонности ее оценка будет учитываться в модели в виде слагаемого или сомножителя.
Для реализации алгоритма получения расчетных (прогнозных) значений с помощью этих моделей необходимо определить начальные значения как коэффициентов, так и сезонной составляющей.
Для этого, как правило, сначала с помощью метода наименьших квадратов оценивают коэффициенты линейного тренда (на основе всего исходного временного ряда либо его части). Полученные коэффициенты линейной модели рассматриваются в качестве и
.
Далее для случая аддитивной сезонности производят усреднение для каждой фазы сезонного цикла отклонений расчетных значений, полученных на основе линейной модели (), от фактических уровней. Очевидно, что для мультипликативной модели происходит усреднение для каждой фазы цикла результатов деления фактических уровней на расчетные.
Примеры практики
В современных аналитических пакетах также имеются и другие виды адаптивных сезонных моделей, полученные в результате сочетания различных трендов с сезонными эффектами аддитивного или мультипликативного типа.
Как показано на рис. 8.18, а, в системе STATISTICA представлены 12 моделей, основанных на экспоненциальном сглаживании.
Рис. 8.18. Выбор адаптивных моделей, основанных на экспоненциальном сглаживании, в современных статистических пакетах:
а – меню системы STATISTICA; б – меню системы IBM SPSS Statistics
Первый столбец включает модели, позволяющие учитывать различный характер тенденции. В случае линейного тренда будет использована ранее рассмотренная модель Ч. Хольта. В двух других столбцах представлены сезонные модели, в которых сезонная составляющая в аддитивной или мультипликативной форме сочетается с различными типами тренда.
Близкий набор моделей представлен в IBM SPSS Statistics, в частности пользователю предлагаются модели с тенденцией линейного роста (модели Хольта и Брауна), также возможен учет сезонности как с аддитивным, так и с мультипликативным характером (рис. 8.18, б).
Таким образом, рассмотренные адаптивные модели отказываются от предположений об инерционном развитии показателей, устойчивости во времени как трендовых, так и сезонных составляющих, позволяют в большей степени опираться на последние наблюдения, а также осуществляют корректировку своих коэффициентов с учетом происходящих изменений. Эго определяет их высокую значимость при краткосрочном прогнозировании развития экономики.