Непараметрические и полупараметрические методы построения интервальных прогнозов

Непараметрические и полупараметрические методы построения интервалов обычно используются в одном из следующих случаев:

  • 1) в распоряжении прогнозиста имеется слишком мало данных, из-за чего вводить какие-либо предположения о законе распределения случайной величины неразумно либо параметры предполагаемого распределения не удается адекватно оценить;
  • 2) прогнозист имеет дело со сложной нелинейной моделью, в которой корректно рассчитать такие характеристики, как условное математическое ожидание или условная дисперсия, не представляется возможным;
  • 3) прогнозист просто не хочет вводить какие-либо дополнительные предположения об изучаемом процессе.

Если часть вычислений основывается на вводимых исследователем предположениях, можно говорить об использовании "полупараметрического" метода построения интервального прогноза. Если же в вычислениях не вводится вообще никаких предположений, то говорят об использовании "непараметрических" методов.

Например, прогнозисту требуется построить интервальный прогноз на основе предположения о распределении случайной величины, но при этом он хочет получить непараметрическую оценку дисперсии. В такой ситуации можно говорить об использовании "полупараметрического" метода построения интервального прогноза.

Рассмотрим наиболее простые непараметрические и полупараметрические методы построения интервальных прогнозов.

Метод Монте-Карло

В тех случаях, когда вычислить статистические характеристики, использующиеся при построении прогнозных интервалов, оказывается сложно, можно использовать метод

Монте-Карло, который фактически подразумевает генерацию большого числа случайных величин на основе заданного закона распределения вероятностей и построенной модели, на основе которых далее получаются желаемые характеристики.

Так, построив ту или иную прогнозную модель, мы можем предположить, что далее ряд данных будет описываться этой же моделью с некоторой ошибкой:

(9.42)

в которой обычно считается:

(9.43)

Впрочем, ничто не мешает вместо нормального распределения использовать какое-то другое (например, равномерное распределение случайных величин) – все зависит от предположений, вводимых прогнозистом.

Соответственно для получения прогнозных интервалов нужно на основе (9.43) сгенерировать большое число ошибок и подставить их в формулу (9.42). Тогда будет получено множество различных теоретических траекторий уτ, по которым можно построить интервальный прогноз. Чтобы получить более адекватные оценки, имеет смысл сгенерировать хотя бы по 1000 наблюдений на каждый шаг τ. На основе полученных таким образом искусственных выборок можно, например, выбрать 2,5%-ный квантиль справа и 97,5%-ный квантиль слева для того, чтобы получить 95%-ный прогнозный интервал.

Например, мы можем все так же предположить, что ряд № 41 в будущем будет описываться моделью Брауна, в соответствии с которой новые фактические значения получаются на основе формулы, взятой из табл. 7.6:

(9.44)

Для того чтобы получить в MS Excel стандартно нормально распределенную случайную величину, можно воспользоваться следующей непростой формулой: = SQRT(-2 * LN(RANDQ) )* SIN(2 * PI() * RANDQ).

В русском MS Office эта функция будет иметь вид = КОРЕНЬ( – 2*LN(CЛЧИC()) )* SIN(2* ПИ()* СЛЧИС()).

Чтобы получить распределение с заданным СКО, нужно эту величину умножить на нужное значение. Например, это значение можно умножить на СКО ошибок модели (9.44).

На рис. 9.13 показаны гистограммы распределений случайных величин, полученных с помощью метода Монте-Карло на основе модели (9.44) и предположения (9.43) с σε =335,57. Всего было сгенерировано по 1000 случайных величин на каждый шаг прогноза.

На рисунках представлено шесть гистограмм, в правом верхнем углу каждой из которых записан номер шага, на который делался интервальный прогноз. Как видим, с каждым шагом распределение случайных величин обретает все меньший эксцесс, становится более пологим, вследствие чего 95%-ный интервал на нервом шаге (примерно от 4800 до 6100) получается значительно у́же интервала на шестом шаге (примерно от 2500 до 8500). По полученным гистограммам мы выбрани соответствующие квантили, так, чтобы получить симметричные интервалы (чтобы слева и справа от границ было по 2,5% значений) и построили 95%-ный интервальный прогноз, который показан на рис. 9.14.

На рисунке так же представлен интервальный прогноз, полученный параметрическим методом в параграфе 9.1. Как видим, смоделированный нами интервал оказался незначительно у́же (что можно списать на случайность), но в целом во многом повторяет параметрический интервал.

Для моделей экспоненциального сглаживания классов 4 и 5 рекомендуется при построении интервальных прогнозов пользоваться методом Монте-Карло, что, как видим, приводит к неплохим результатам.

Стоит, однако, заметить, что метод требует значительных вычислений и серьезной работы с большими массивами данных, что, впрочем, в наше время может быть автоматизировано. В случае с построением интервального прогноза на шесть наблюдений вперед, мы сгенерировали 6 • 1000 = 6000 случайных величин, а в случае с прогнозированием на 18 наблюдений вперед нужно будет сгенерировать 18 000 случайных величин.

Главный недостаток метода Монте-Карло на самом деле заключается в предположении относительно распределения ошибок в модели. Существует много работ на тему того, что нормальное распределение плохо описывает экономические процессы, так как вероятность более редких событий

Гистограммы распределений случайных величин, сгенерированных методом Монте-Карло для прогнозов на 1–6 шагов вперед но модели Брауна

Рис. 9.13. Гистограммы распределений случайных величин, сгенерированных методом Монте-Карло для прогнозов на 1–6 шагов вперед но модели Брауна

Ряд данных № 41 (сплошная линия с точками), точечный (сплошная линия) прогноз, полученный по модели Брауна, и интервальные прогнозы, рассчитанные на основе параметрического метода (мелкая пунктирная линия) и метода Монте-Карло (прерывистая линия)

Рис. 9.14. Ряд данных № 41 (сплошная линия с точками), точечный (сплошная линия) прогноз, полученный по модели Брауна, и интервальные прогнозы, рассчитанные на основе параметрического метода (мелкая пунктирная линия) и метода Монте-Карло (прерывистая линия)

на практике оказывается значительно выше, чем это предполагает гауссиана[1]. Чтобы убрать это предположение, можно воспользоваться одним из методов "бутстрапирования", которые основаны на идее генерации случайных величин на основе имеющегося эмпирического распределения величины.

Однако существуют и более простые методы получения оценок, не основанные на предположении о нормальности распределения ошибок, не требующие оценки функции распределения и генерации случайных величин. Рассмотрим два из них.

  • [1] Эта проблема лучше всего рассмотрена в книге: Талеб Нассим Николас. Черный лебедь. Под знаком непредсказуемости / пер. с англ. В. Сонь- кина, А. Бердичевского, М. Костионовой, О. Попова; под ред. М. Тюнькиной. М.: Издательство КоЛибри, 2009.
 
< Пред   СОДЕРЖАНИЕ     След >