Методы задания параметра демпфирования колебаний
Из всевозможных методов задания параметра демпфирования колебаний мы пока рассмотрели только один:
(11.44)
При задании коэффициента но формуле (11.44) модель адаптируется к данным в разной степени в зависимости от удаленности фактических значений от расчетных. Преимущество данного метода заключается в том, что он не требует определения величины коэффициента со стороны исследователя. Все, что требуется для адаптации модели в гаком случае, – это распределить веса между наблюдениями и задать ширину границ η. Правда, адаптация в соответствии с (11.44) происходит таким образом, что модель подтягивает свою ближайшую границу к фактическому значению. Такой метод адаптации имеет смысл использовать в тех случаях, когда изучаемый процесс имеет высокую инерционность, тенденции и связи в котором меняются медленно.
По аналогии с этим методом задания γ можно предложить еще несколько, которые так же были бы автоматизированы:
(11.45)
При использовании формулы (11.45) модель будет подтягиваться к значениям, вышедшим за рамки интервала, противоположной границей. Такой метод задания обладает теми же преимуществами, что и метод (11.44) и может быть использован при адаптации моделей в более динамичных условиях (когда нужно более резко и быстро реагировать на происходящие изменения).
Следующий метод задания по своей идее близок к моделям экспоненциального сглаживания
(11.46)
В данном случае при любых выходах значений за границы интервала модель будет адаптироваться на фиксированную величину α, которая распределяется между коэффициентами с заданными весами. Выбор коэффициента а, однако, связан с рядом сложностей. Во-первых, экспертно его выбрать достаточно сложно, хотя по аналогии с моделями экспоненциального сглаживания понятно, что значения, близкие к нулю, будут приводить к более медленной адаптации, а близкие к единице – к более быстрой. Ну, а во-вторых, границы, в которых лежит значение α определить достаточно сложно. Можно, конечно, наложить искусственное ограничение от 0 до 1, но в таком случае прогнозные свойства модели будут существенно снижены. В этих условиях даже автоматический выбор коэффициента не гарантирует, что будет найдено оптимальное для прогноза значение. Преимуществом данного метода является то, что модель может адаптироваться и так, чтобы фактические значения попадали в интервал, в то время как ее недостатком является негибкость такого коэффициента демпфирования колебаний: какими бы ни были отклонения, модель будет все время адаптироваться в одной и той же степени.
Несколько более гибкий метод задания заключается в выборе постоянных αо для каждого коэффициента:
(11.47)
Здесь задание коэффициентов αо оказывается еще более сложным, и исследователь неминуемо столкнется с проблемой большого числа локальных минимумов, которая может приводить к значительным сложностям при выборе оптимальных значений коэффициентов модели. При этом сохраняются все те же преимущества и недостатки, что и в случае с (11.46). Единственное, что появляется, – возможность задать степень адаптации индивидуально для каждого коэффициента, что в принципе может регулироваться за счет задания разных весов в (11.46).
Исследователь также вправе скомбинировать любые из методов (11.44) – (11.47) для того, чтобы получить более гибкую модель, однако в таком случае может "всплыть" проблема с выбором оптимальных значений коэффициентов, вызванная большим числом локальных минимумов.
Рассмотрим на примере разные методы задания коэффициента демпфирования колебаний. Возьмем все тот же ряд № 25 и построим по нему модель линейного тренда. В качестве коэффициента фильтрации возьмем МеAD.
Для простоты во всех случаях, требующих задание весов, примем веса одинаковыми и равными 1/k.
В результате расчетов были получены значения, представленные в табл. 11.6.
Таблица 11.6
Результаты адаптации модели линейного тренда методом неравномерного сглаживания при разных значениях коэффициента демпфирования колебаний
№ |
Метод задания уj.t |
Финальное уравнение |
sMAPE по ряду, % |
sMAPE по прогнозу, % |
1 |
(11.44) |
Yt = 1289,86 + 249,82с |
3,76 |
8,37 |
2 |
(11.45) |
Yt = 1371,54 + 254,90с |
3,81 |
5,40 |
3 |
(11.46), α =1,62 |
Yt = 1427,60 + 258,88с |
3,44 |
2,74 |
4 |
(11.47), α0= 0,60, α1 = 0,69 |
Yt = 1365,15 + 256,55с |
3,09 |
5,02 |
В связи с тем что исходный ряд данных имеет тенденцию к росту, метод задания с подтягиванием к противоположной границе (11.45) дал более точный прогноз, нежели метод (11.44), хотя последний и аппроксимировал исходный ряд данных лучше.
Подобрать оптимальные значения коэффициентов в методах (11.46) и (11.47) было непросто, так как задача имеет локальные минимумы. Тем не менее, как видим, метод (11.47) позволил наилучшим образом аппроксимировать исходный ряд данных, а метод (11.46) – получить наиболее точный прогноз на шесть наблюдений вперед.
Графически процесс адаптации и прогнозы по полученным моделям (табл. 11.6) представлены на рис. 11.7.
Преимущество метода 3 (он же (11.46)) но сравнению с другими методам здесь, как видим, оказалось очевидным.
Чтобы упростить процесс автоматического выбора коэффициента демпфирования колебаний, нужно попытаться вывести если не границы, в которых он лежит, то хотя бы условие, которое гарантировало бы устойчивость модели. Для этого представим весь метод неравномерного сглаживания для произвольной многофакторной модели в матричном
Рис. 11.7. Адаптация модели линейного тренда но ряду № 25 и прогнозы по ней с использованием разных методов задания коэффициента демпфирования колебаний
виде. Многофакторная регрессионная модель на наблюдении t + 1 в соответствии с (11.37) может быть записана в виде
(11.48)
где– вектор k факторов (единица здесь нужна для учета константы), имеющихся в распоряжении на наблюдении t; X', – транспонированный вектор Xt (т.е. вектор- строка);
– вектор-столбец расчетных значений коэффициентов при соответствующих факторах на наблюдении t; yt+1 – фактическое значение зависимой переменной на наблюдении t + 1; εt+1 – ошибка модели на наблюдении t + 1, такая, что
В тех случаях, когда фактическое значение на наблюдении t лежит в пределах границ фильтра, коэффициенты модели остаются прежними:
(11.49)
Если же ошибка по модулю превысила значение η, коэффициенты должны адаптироваться по формуле
(11.50)
где – обратная диагональная матрица, составленная из элементов вектора Xt:
: (11.51)
– вектор коэффициентов демпфирования колебаний, задаваемых исследователем по одному из условий (11.44) – (11.47).
Так, если мы хотим построить модель у от х1 и х2, мы будем иметь следующие матрицы и вектора:
.
При перемножении вектора Xt на Аt получим
,
что полностью соответствует первому уравнению в (11.37). При этом при адаптации коэффициентов перемножение матриц будет давать
что, в свою очередь, соответствует формулам адаптации в (11.37).
Как видим, использование матриц позволяет более компактно записать всю схему адаптации методом неравномерного сглаживания через три формулы:
В дальнейших рассуждениях нас будут интересовать только случаи выхода фактических значений за границы, поэтому рассмотрим отдельно механизм адаптации коэффициентов. Очевидно, что в реальности коэффициенты будут адаптироваться не на каждом наблюдении, но пока для простоты мы сделаем допущение о том, что они адаптируются на каждом.
Из формулы (11.48) можно вывести значение ошибки на наблюдении t + 1. По аналогии с ней запишем формулу для расчета ошибки на наблюдении t:
(11.52)
Теперь подставим формулу ошибки (11.52) в формулу адаптации (11.50) и раскроем скобки:
(11.53)
В формуле (11.53) за скобки можно вынести общий множитель At-1 тогда в первом слагаемом правой части формулы (11.53) на его месте образуется единичная матрица Iк, состоящая из k элементов:
(11.54)
Формула (11.54) уже дает нам некоторые представления о том, что собой представляет механизм адаптации в методе неравномерного сглаживания. Он напоминает механизм, заложенный в модели экспоненциального сглаживания, в котором постоянная сглаживания регулирует распределение весов между фактическими и расчетными значениями.
Чтобы далее не путаться в матрицах, перемножающихся друг на друга, произведем замену:
(11.55)
С учетом (10.39) формулу (11.54) можно записать в компактном виде:
(11.56)
Очевидно, что в случае постоянной адаптации коэффициенты, найденные на наблюдении t – 1, будут адаптироваться к фактическим значениям на наблюдении ¢ – 1 по той же формуле (11.56). Заменим At-1 в (11.56) на расчетное значение па предыдущем наблюдении:
Если снова провести такую же замену с использованием уже расчетного значения на наблюдении t-2, получим
откуда следует, что
Если продолжить заменять предшествующие значения At расчетными, мы получим последовательность слагаемых, через которые определяется текущее значение коэффициентов At:
(11.57)
Устремляя последовательность (11.57) в бесконечность, увидим, что в компактном виде (11.57) может быть записана так:
(11.58)
Если теперь подставить (11.58) в формулу (11.48), то поймем, что прогнозное значение на шаге t + 1 зависит от предыдущих фактических значений:
(11.59)
Формула (11.59) показывает, что будущее прогнозное значение определяется через взвешенную сумму предыдущих фактических значений, что в принципе похоже па механизм адаптации в модели экспоненциального сглаживания. Существенное отличие данного механизма от экспоненциального сглаживания заключается в делении значений коэффициентов демпфирования колебаний на фактические значения факторов. Если по каким-то причинам факторы и коэффициенты демпфирования колебаний оказались бы одинаковыми вне зависимости от сдвига τ, то мы бы пришли к матричной записи формулы экспоненциального сглаживания:
Это показывает, что метод простого экспоненциального сглаживания (и любая его модификация) является частным случаем метода неравномерного сглаживания, базирующегося на модификации метода стохастической аппроксимации.
Логичным требованием к методу неравномерного сглаживания будет требование сходимости суммы модулей весов в (11.58):
(11.60)
В таком случае веса будут распределяться так, чтобы более новые значения yt сильнее влияли на прогнозное значение , нежели старые значения yt-i.
Заметим, что в ряде случаев веса между наблюдениями (11.59) могут распределяться неравномерно: для каких-то наблюдений они будут по модулю больше 1, а для других – меньше. В данном случае в весах нет никакого четкого убывающего закона, однако за счет умножения прошлых значений на матрицу Dt-τ-1 со временем влияние устаревших значений будет уменьшаться.
Смысл условия (11.60) в случае, если адаптация происходит не на каждом наблюдении, не меняется. Единственное, что при этом изменится, – лаги между значениями, входящими в сумму (11.60). Модель при этом все так же будет в большей степени учитывать текущую информацию, нежели прошлую. В принципе для пропущенных значений можно задать γj,t = 0, что не изменит смысла МНС, но при этом будет легче представимо в виде суммы (11.60).
К сожалению, в связи с тем, что коэффициенты демпфирования колебаний могут задаваться разными на каждом наблюдении (например, по формуле (11.44)), а факторы в модели постоянно меняются, вывести ограничения на коэффициенты демпфирования колебаний, исходя из условия (11.60), не представляется возможным. Однако условие (11.60) можно использовать для проверки стабильности модели. Ведь, если оно нарушается (т.е. по мере отдаления в прошлое сумма растет), значит, старые значения в модели с каждой адаптацией будут учитываться в большей степени, чем новые.
Для примера, рассмотренного нами ранее при задании коэффициента демпфирования колебаний по формуле с подтягиванием к противоположной границе (11.45), получились следующие значения коэффициентов в тех случаях, в которых коэффициенты адаптировались к новым значениям (табл. 11.7).
Таблица 11.7
Ряд коэффициентов демпфирования колебаний, полученных при адаптации модели тренда к ряду № 25 из базы М3
t |
γt |
4 |
1,94 |
5 |
1,32 |
7 |
1,78 |
8 |
1,22 |
11 |
1,63 |
12 |
1,51 |
14 |
1,22 |
Попробуем рассчитать по этим значениям сумму (11.60). Для этого запишем наши данные в матричном виде:
Покажем, как можно рассчитать сумму (11.60) по данным 14 и 12 наблюдений:
В целом сумма (11.60) для всех данных табл. 11.7 будет представлять собой вектор:
Заметим, в связи с округлением до сотых суммы, представленные в расчетах выше, не совпадают с реальными. Для наглядности представим полученные веса на графике (рис. 11.8).
Рис. 11.8. Динамика весов в методе неравномерного сглаживания на основе данных табл. 11.7:
по оси абсцисс откладывается время наблюдений
На рисунке 11.8 график слева показывает, как дисконтируются веса для наблюдений с 1-го по 14-е при адаптации константы на 14-м наблюдении, а график справа показывает распределение весов для тех же наблюдений только уже для коэффициента угла наклона. На себя обращает внимание то, как распределяются веса: веса при t – 14 оказываются наибольшими, а далее при уменьшении t они начинают убывать, причем убывание это носит сложный нелинейный характер. Также на себя обращают внимание малые значения весов для коэффициента угла наклона. Получить такие значения было вполне ожидаемо, так как при адаптации коэффициентов при факторах в соответствии с методом неравномерного сглаживания происходит деление назначение фактора.