Адаптация нелинейных моделей методом неравномерного сглаживания
Адаптацию прогнозных эконометрических моделей с помощью метода неравномерного сглаживания можно проводить и для нелинейных моделей. Сами нелинейные модели, как известно, могут быть двух видов – линейные по параметрам и нелинейные по параметрам. Адаптация первого типа (линейных по параметрам) моделей осуществляется довольно просто. Для этого следует линеаризовать модель и применить к ней алгоритм (11.17).
Пусть, например, необходимо адаптировать прогнозную модель в виде экспоненциального тренда, стартовые значения коэффициентов которой найдены с помощью какого- либо метода:
(11-61)
Линеаризуем эту модель с помощью логарифмирования:
(11.62)
Применим к этой линеаризованной модели метод неравномерного сглаживания.
Сначала необходимо вычислить ошибки аппроксимации линеаризованной модели: , после чего следует задать допустимые границы изменения этой ошибки аппроксимации η, превышение которой является сигналом для адаптации модели.
Выразим каждый коэффициент линеаризованной модели через другой коэффициент и через переменные модели.
Свободный член для линеаризованной модели будет вычисляться так:
Коэффициент пропорциональности также легко выразить из (11.62):
Если теперь вместо расчетных значений в эти формулы подставить реальные yt, получим те самые фактические коэффициенты, которые меняются во времени, отражая процесс эволюционирования прогнозируемого объекта:
Задача адаптации заключается в корректировке расчетных коэффициентов прогнозной модели с помощью метода неравномерного сглаживания так, как это следует из (11.17). Формулы такой процедуры получаются довольно легко:
(11.63)
(11.64)
Поскольку выражения в скобках в правых частях этих формул содержат в себе ошибку аппроксимации линеаризованной модели, их можно представить еще проще:
(11.65)
(11.66)
Как видно, никаких затруднений не возникает, и модели, линейные по параметрам, легко адаптируются с помощью метода неравномерного сглаживания.
Пример. Построить нелинейный тренд изменения цены одного барреля сырой нефти по данным, приведенным в табл. 11.8, и адаптировать тренд методом неравномерного сглаживания.
Таблица 11.8
Динамика мировых цен на нефть, 1986 2005 гг. (долл. СШАза 1 баррель)[1]
Год |
уt |
1 п уt |
1986 |
19,900 |
2,991 |
1987 |
24,900 |
3,215 |
1988 |
19,500 |
2,970 |
1989 |
22,800 |
3,127 |
1990 |
28,200 |
3,340 |
1991 |
22,900 |
3,131 |
1992 |
22,000 |
3,091 |
1993 |
19,000 |
2,944 |
1994 |
17,700 |
2,874 |
1995 |
18,700 |
2,929 |
1996 |
21,700 |
3,077 |
1997 |
20,200 |
3,006 |
1998 |
13,600 |
2,610 |
1999 |
18,400 |
2,912 |
2000 |
28,200 |
3,339 |
2001 |
23,800 |
3,170 |
2002 |
24,000 |
3,178 |
2003 |
27,300 |
3,307 |
2004 |
34,600 |
3,544 |
Методом наименьших квадратов были оценены значения коэффициентов тренда, описывающего этот ряд значений:
или
. (11.67)
Средняя абсолютная ошибка аппроксимации логарифмов прогнозируемого показателя за данный период составила 0,151. Примем это значение как граничное: η = 0,151.
Результаты адаптации коэффициентов линеаризованного тренда приведены в табл. 11.9.
Таблица 11.9
Адаптация линеаризованной модели
Год |
Текущее отклонение, εt |
Коэффициент демпфирования колебаний, γj,t |
Коэффициенты модели |
|
|
|
|||
1986 |
-0,016 |
- |
2,997 |
0,010 |
1987 |
0,199 |
0,121 |
3,021 |
0,022 |
1988 |
-0,115 |
- |
3,021 |
0,022 |
1989 |
0,020 |
- |
3,021 |
0,022 |
1990 |
0.211 |
0,142 |
3,051 |
0,028 |
1991 |
-0,085 |
3,051 |
0,028 |
|
1992 |
-0,153 |
0,006 |
3,050 |
0,027 |
1993 |
-0,325 |
0,268 |
2,963 |
0,017 |
1994 |
-0,238 |
0,184 |
2,919 |
0,012 |
1995 |
-0,107 |
2,919 |
0,012 |
|
1996 |
0.030 |
- |
2,919 |
0,012 |
1997 |
-0,054 |
- |
2,919 |
0,012 |
1998 |
-0,461 |
0,336 |
2,764 |
0,000 |
1999 |
0.152 |
0,004 |
2,765 |
0,000 |
2000 |
0,578 |
0,370 |
2,978 |
0,014 |
2001 |
-0,033 |
- |
2,978 |
0,014 |
2002 |
-0,039 |
- |
2,978 |
0,014 |
2003 |
0.076 |
2,978 |
0,014 |
|
2004 |
0.299 |
0,248 |
3,053 |
0,018 |
Таким образом, к последнему наблюдению линеаризованный тренд имеет вид:
(11.68)
Этот же тренд в исходной форме нелинейной зависимости будет таким:
(11.69)
Можно решить эту же задачу и не прибегая к линеаризации модели. Для этого выразим каждый из коэффициентов модели (11.61) через другой коэффициент и значения переменных:
(11.70)
Если теперь вместо расчетных значений прогнозной величины подставить ее реальные значения, получим фактические коэффициенты. Адаптацию с помощью метода неравномерного сглаживания в таком случае можно осуществлять по таким формулам:
(11.71)
(11.72)
Чтобы провести адаптацию модели, используя формулы (11.71) и (11.72), необходимо определить допустимую величину погрешности модели. В данном случае также будем использовать среднюю абсолютную ошибку аппроксимации, которая для модели с оценками МНК (11.67) в исходных величинах равна 3,366. Это значение и принимаем для границы фильтра – η = 3,366. Результаты адаптации нелинейной модели с помощью формул (11.71) и (11.72) приведены в табл. 11.10.
Таблица 11.10
Адаптация нелинейной модели
Год |
Текущее отклонение, εt |
Коэффициент демпфирования колебаний, γj,t |
Коэффициенты модели |
|
|
|
|||
1986 |
-0,317 |
- |
20,025 |
0,010 |
1987 |
4,489 |
0.125 |
20,576 |
0,022 |
1988 |
-2,479 |
- |
20,576 |
0,022 |
1989 |
0,333 |
- |
20,576 |
0,022 |
1990 |
5,234 |
0,178 |
21,413 |
0,029 |
1991 |
-2,630 |
- |
21,413 |
0,029 |
1992 |
-4,289 |
0,108 |
21,037 |
0,027 |
1993 |
-7,019 |
0,260 |
19,561 |
0,016 |
1994 |
-4,959 |
0,161 |
18,873 |
0,012 |
1995 |
-2,564 |
- |
18,873 |
0,012 |
1996 |
0,181 |
- |
18,873 |
0,012 |
1997 |
-1,577 |
- |
18,873 |
0,012 |
1998 |
-8,439 |
0,301 |
16,701 |
0,001 |
1999 |
1,519 |
- |
16,701 |
0,001 |
2000 |
11,306 |
0,351 |
20,625 |
0,013 |
2001 |
-1,498 |
- |
20,625 |
0,013 |
2002 |
-1,623 |
- |
20,625 |
0,013 |
2003 |
1,348 |
- |
20,625 |
0,013 |
2004 |
8,315 |
0,298 |
22,567 |
0,017 |
Таким образом, адаптированная модель экспоненциального тренда имеет вид
(11.73)
Сведем результаты прогноза по модели тренда с оценками МНК (11.67), адаптированной линеаризованной модели тренда (11.69) и адаптированной нелинейной модели тренда (11.73) на последующие три года в табл. 11.11.
Таблица 11.11
Сравнительный анализ точности ретропрогноза неадаптированной и адаптированных моделей экспоненциального тренда
Год |
t |
Фактическое значение цены, долл. США за 1 баррель нефти (на 1 июля) |
Прогноз по модели (11.67) |
Прогноз по модели (11.69) |
Прогноз по модели (11.73) |
2005 |
20 |
57,07 |
24,231 |
30,297 |
31,749 |
2006 |
21 |
73,28 |
24,463 |
30,845 |
32,295 |
2007 |
22 |
71,09 |
24,698 |
31,403 |
32,851 |
sMAPE ретропрогноза |
92,51 |
73,41 |
69,41 |
Адаптированные модели "уловили" общую тенденцию роста цен на нефть в последние годы наблюдения в большей степени, чем это сделала модель с оценками МНК. Поэтому они и более точно спрогнозировали рост цен на нефть, который к тому времени принял не столько эволюционный, сколько хаотический характер. То, что ошибки ретропрогноза оказались такими высокими, вызвано резким скачком цен на нефть в последние три года, не прогнозируемым техническими средствами.
Графически полученный прогноз по моделям (11.69) и (11.73) представлен на рис. 11.9.
Рис. 11.9. Ряд цен на нефть (сплошная линия с точками), его аппроксимация моделями (11.69) (пунктирная линия с крестиками) и (11.73) (сплошная линия без точек) и прогноз по ним
Как видим, модель в исходных данных отличается от линеаризованной модели незначительно, однако эти мелкие изменения приводят в итоге к тому, что итоговый прогноз оказывается несколько выше. Поэтому и sMAPE по прогнозу модели (11.73) оказалась минимальной из трех моделей.
Модели, линейные по параметрам, адаптируются достаточно просто. Сложнее адаптировать нелинейные по параметрам модели, поскольку их невозможно привести к линейной форме. Но, как было показано на примере модели экспоненциально тренда, в случае с адаптацией методом неравномерного сглаживания можно обойтись и без линеаризации – необходимо выразить каждый из коэффициентов модели через другие коэффициенты и через переменные самой модели. Подставляя в полученное выражение реальные значения переменных, получим в результате вычислений фактические значения коэффициентов модели, ориентируясь на которые, можно провести пересчет коэффициентов модели, адаптируя ее к изменениям в тенденциях, седи такие изменения наблюдаются.
Покажем, как можно использовать метод неравномерного сглаживания применительно к моделям такого типа для целей адаптации прогнозных моделей. В качестве примера используем логистическую кривую:
(11.74)
Чтобы осуществить адаптацию этой модели, следует, прежде всего, вывести из (11.74) каждый коэффициент модели, выраженный через переменные и остальные коэффициенты.
Для коэффициента а0 сделать это довольно просто:
Немного сложнее, но вовсе не затруднительно сделать это для второго коэффициента а1:
Также без особых затруднений можно вывести и третий коэффициент:
Теперь, подставляя вместо расчетных значений показателя уt его фактические значения, получим коэффициенты, отражающие этот реальный уровень ряда:
(11.75)
(11.76)
(11.77)
В соответствии с (11.17) применительно к каждому из коэффициентов алгоритм адаптации будет записан так:
(11.78)
(11.79)
(11.80)
Используя формулы (11.78) – (11.80), можно адаптировать коэффициенты модели логистического тренда.
Построим на статистических данных табл. 11.12 логистическую кривую, после чего адаптируем ее.
Таблица 11.12
Исходные данные для построения логистической кривой
Номер наблюдения, t |
Электропотребление промышленностью, млрд кВт•ч, уt |
Номер наблюдения, t |
Электропотребление промышленностью, млрд кВт•ч, уt |
1 |
5,57 |
13 |
17,10 |
2 |
6,36 |
14 |
17,49 |
3 |
7,50 |
15 |
17,90 |
4 |
8,28 |
16 |
18,48 |
5 |
9,06 |
17 |
19,22 |
6 |
9,74 |
18 |
19,91 |
7 |
10,36 |
19 |
21,10 |
8 |
11,60 |
20 |
22,10 |
9 |
12,79 |
21 |
23,40 |
10 |
13,92 |
22 |
24,30 |
11 |
14,95 |
23 |
25,05 |
12 |
16,12 |
Используем для оценки коэффициентов логистического тренда первые 19 наблюдений. Это будет база прогноза. Оставшиеся значения статистических данных табл. 11.12 будем использовать как проверочную выборку.
Используя "Поиск решения" MS Excel для подбора параметров, получим модель логистического тренда следующего вида:
(11.81)
Средняя абсолютная ошибка по этой модели составила 2,179. Будем использовать ее в качестве границы фильтра. Адаптация логистической модели с помощью приведенных выше расчетных формул (11.78) – (11.80) с параметрами демпфирования колебаний (11.44) привела ее к виду
(11.82)
Как видим, коэффициенты неадаптированной и адаптированной моделей различаются несущественно. Это вызвано тем, что в исходном ряде данных на периоде построения модели не происходило никаких значительных изменений. Сама исходная модель этот ряд данных уже описывает достаточно точно. Графически исходный ряд данных, модели (11.81) и (11.82), а также прогнозы по ним показаны на рис. 11.10.
Рис. 11.10. Ряд данных (сплошная линия с точками), его аппроксимация и прогнозы по моделям (11.81) (пунктир с крестиками) и (11.82) (сплошная линия без точек)
Как видим, логистические тренды практически сливаются, различия в них слабо различимы. Вызвано это тем, что сама изучаемая тенденция во времени менялась несущественно.
Теперь сравним прогнозные свойства адаптированной и неадаптированной моделей логистической кривой на проверочном множестве. Результаты ретропрогноза приведены в табл. 11.13.
Таблица 11.13
Сравнительный анализ точности ретропрогноза неадаптированной и адаптированной моделей логистической кривой
Номер наблюдения, t |
Электропотребление промышленностью, млрд кВт•ч, уt |
Прогноз по модели (11.81) |
Прогноз по модели (11.82) |
20 |
22,100 |
21,078 |
21,382 |
21 |
23,400 |
21,485 |
21,393 |
22 |
24,300 |
21,843 |
21,754 |
23 |
25,050 |
22,156 |
22,070 |
sMAPE регропрогноза |
9,04% |
8,99% |
Как видим, различия в точности моделей несущественны. sMAPE ретропрогноза модели (11.82) оказалась ниже sMAPE модели (11.81) лишь за счет прогноза на 20-м наблюдении, оказавшегося более близ-
ким к фактическому значению, нежели прогноз по модели (11.81). Как видим, метод неравномерного сглаживания успешно справляется с нелинейными моделями, позволяя получать решения, сопоставимые с результатами численных методов.
Итак, метод неравномерного сглаживания, полученный из модификации метода стохастической аппроксимации, позволяет успешно адаптировать не только простые линейные модели, но и сложные нелинейные по параметрам прогнозные модели, что является его очевидным преимуществом.
Подводя итог данной главе, выделим основные преимущества и недостатки метода неравномерного сглаживания.
К преимуществам метода можно отнести следующие:
- 1. Метод позволяет адаптировать практически любую модель. Он справляется даже с моделями, к которым другими методами просто невозможно подступиться.
- 2. Метод гибок и позволяет достаточно тонко настраивать механизм адаптации.
- 3. Фильтр шумов и степень адаптации в методе разделены, что позволяет более динамично адаптироваться к существенным ошибкам, игнорируя мелкие ошибки.
В качестве недостатков стоит отметить:
- 1. На данный момент рекомендации относительно того, как лучше задавать коэффициенты фильтрации и демпфирования колебаний, не разработаны. Поэтому для получения более точных прогнозов исследователю в обязательном порядке надо прибегать к процедуре ретропрогноза (что на малых рядах не всегда осуществимо).
- 2. Автоматизировать подбор как коэффициента фильтрации, так и коэффициента демпфирования колебаний очень сложно из-за большого числа локальных минимумов в целевой функции.
- 3. Вывести точные границы, в которых должен лежать коэффициент демпфирования колебаний из-за динамичности модели нс представляется возможным. Можно лишь протестировать модель на сходимость весов уже после ее построения.
- 4. Коэффициенты, рассчитанные методом неравномерного сглаживания, интерпретировать бессмысленно, так как они не учитывают влияние отдельных факторов на результат, а лишь отражают в себе степень и направление адаптации к новым данным.
- [1] International Financial Statistics 2005. IMF.