Проверка адекватности и точности модели
1. Прежде всего, подвергнем статистической проверке нулевую гипотезу о равенстве математического ожидания уровней ряда остатков нулю, т.е. гипотезу Н0: |ё-0| = 0 о том, что среднее значение ряда остатков статистически незначимо отличается от нуля. Для проверки гипотезы строится эмпирическая (расчетная) t-статистика
где
— стандартное отклонение ряда остатков от оценки среднего, а отношение
представляет собой ошибку

вычисления среднего S? и может быть записано в виде
Проверяемую гипотезу отклоняем на уровне значимости а, если tэмпир > f«,v • Здесь ta> — критерий распределения Стьюдента, соответствующий доверительной вероятности Р = (1-а)и v = (n-l) степеням свободы. В случае противоположного знака неравенства нулевая гипотеза не отклоняется.
2. Проверку случайности отклонений ряда остатков от тренда выполним в соответствии с условием (2).
Выражение P(q-q
Если это неравенство соблюдается, то случайность отклонений ряда остатков от тренда выполняется на уровне значимости a=0,05. Если же неравенство нарушается, ряд остатков нельзя считать случайным (скорее всего, в нем присутствует неслучайная компонента). В этом случае модель нельзя признать адекватной.
3. Статистическая проверка наличия (отсутствия) автокорреляции в ряде остатков чаще всего осуществляется с помощью критерия Дарбина — Уотсона. Для этого строим эмпирическую (расчетную) статистику Дарбина — Уотсона (d-статистику), которая рассчитывается по формуле
Значение полученной d-статистики сравнивается с границами интервала критических значений (см. табл. 7.11).
Таблица 7.17
Границы интервала (dL и dv) критических значений критерия Дарбина — Уотсона при уровне значимости а=0,05 (л-длина временного ряда, т — число объясняющих переменных в уравнении кривой роста)
п |
ГП= 1 |
m = 2 |
m = 3 |
m = 4 |
||||
dL |
dv |
dL |
dv |
dL |
dv |
dL |
dv |
|
6 |
0,610 |
1,400 |
||||||
7 |
0,7000 |
1,356 |
0,467 |
1,896 |
||||
8 |
0,763 |
1,332 |
0,359 |
1,777 |
0,368 |
2,287 |
||
9 |
0,824 |
1,320 |
0,629 |
1,699 |
0,435 |
2,128 |
0,296 |
2,388 |
10 |
0,879 |
1,320 |
0,697 |
1,641 |
0,525 |
2,016 |
0,356 |
2,414 |
11 |
0,927 |
1,324 |
0,658 |
1,604 |
0,595 |
1,928 |
0,444 |
2,283 |
12 |
0,971 |
1,331 |
0,812 |
1,576 |
0,658 |
1,864 |
0,512 |
2,177 |
13 |
1,010 |
1,340 |
0,861 |
1,562 |
0,715 |
1,816 |
0,574 |
2,094 |
14 |
1,045 |
1,330 |
0,905 |
1,551 |
0,767 |
1,779 |
0,632 |
2,030 |
15 |
1,077 |
1,361 |
0,946 |
1,543 |
0,814 |
1,750 |
0,685 |
1,977 |
При этом могут появиться неравенства:
- 1) dv< d <2 — автокорреляция в ряде остатков отсутствует;
- 2) d < dL _ ряд остатков содержит автокорреляцию;
- 3) dL < d < d,j— ситуация неопределенности: гипотеза о существовании автокорреляции не может быть ни принята, ни отвергнута;
- 4) d > 2 — свидетельство наличия отрицательной корреляции. В этом случае перед входом в таблицу значения d требуется преобразовать по формуле d '=4 - d.
При отсутствии автокорреляции (1) переходим к выявлению закона распределения ряда остатков.
Наличие автокорреляции остатков (2) означает неадекватность выбранной модели. Значит, модель надо улучшить либо выбрать другую модель из сформированного исходного набора моделей ВР.
Ситуация неопределенности (3) требует применения других критериев. Так, с помощью автокорреляционной функции по формуле (7.14) можно рассчитать коэффициенты автокорреляции, например, первого, второго и третьего порядков, а можно воспользоваться упрощенной формулой (7.28) для расчета первого коэффициента автокорреляции
Для вывода о наличии (отсутствии) автокорреляции в ряду остатков значение коэффициента автокорреляции (7.28) сопоставляется с табличным (см. табл. 7.9) для пяти- или однопроцентного уровня значимости. Превышение табличным значением соответствующего расчетного означает, что гипотезу об отсутствии автокорреляции в ряду остатков следует принять. Противоположное неравенство означает наличие автокорреляции, а значит, неадекватность выбранной кривой роста реальному временному ряду.
Заметим, что наличие в MS Excel функции КОРРЕЛ из категории Статистические, позволяет существенно упростить проверку наличия (отсутствия) автокорреляции (см. рис. 7.8). Причем проверить нулевую гипотезу о статистически незначимом отличии полученного коэффициента автокорреляции от нуля можно не только с помощью таблицы 7.9, но и напрямую с помощью t-критерия Стьюдента. В этом случае расчетное (эмпирическое) значение t-статистики вычисляется по формуле
На выбранном уровне значимости а нулевая гипотеза принимается (строго говоря, не отклоняется) при выполнении неравенства ^эмпир
4. Для проверки соответствия распределения ряда остатков нормальному закону чаще всего применяют так называемый P/S-критерий
Здесь етах и emjn суть максимальное и минимальное значения уровней ряда остатков; Se — стандартное отклонение ряда остатков от своего среднего (см. пояснения к формуле (7.25)).
Критические границы отношения R/S заданы таблично:
п |
Нижние границы |
Верхние границы |
||
а=0,05 |
а=0,10 |
а=0,05 |
а=0,10 |
|
8 |
2,50 |
2,59 |
3,308 |
3,399 |
10 |
2,67 |
2,76 |
3,57 |
3,685 |
12 |
2,80 |
2,90 |
3,78 |
3,91 |
14 |
2,92 |
3,02 |
3,95 |
4,09 |
Окончание таблицы
п |
Нижние границы |
Верхние границы |
||
а=0,05 |
а=0,10 |
а=0,05 |
а=0,10 |
|
16 |
3,01 |
3,12 |
4,09 |
4,24 |
18 |
3,10 |
3,21 |
4,21 |
4,37 |
20 |
3,18 |
3,29 |
4,32 |
4,49 |
25 |
3,34 |
3,45 |
4,53 |
4,71 |
30 |
3,47 |
3,59 |
4,70 |
4,89 |
35 |
3,58 |
3,70 |
4,84 |
5,04 |
40 |
3,67 |
3,79 |
4,96 |
5,16 |
45 |
3,75 |
3,88 |
5,06 |
5,26 |
50 |
3,83 |
3,95 |
5,14 |
5,35 |
Гипотеза о соответствии распределения ряда остатков нормальному закону принимается на выбранном уровне значимости а при условии, что эмпирическое (расчетное) значение R/S-критерия (7.29) окажется внутри критических границ для данного уровня значимости. Следует подчеркнуть, что полученный положительный результат является обоснованием возможности построения интервального прогноза.
Если по итогам проверки пунктов 1—4 получены положительные результаты, можно считать, что на выбранном уровне значимости исходная трендовая модель статистически адекватна реальному ряду динамики. Это дает основания для следующего шага проверки качества модели — оценки ее точности.
Оценка точности модели кривой роста базируется на совокупном учете ошибок аппроксимации (ряда остатков). В частности, это такие статистические показатели точности, как стандартное отклонение от линии тренда (стандартная ошибка)
где т — число факторов, включенных в трендовую модель, и средняя относительная ошибка аппроксимации
Обычно полагают, что точность модели приемлема, если относительная ошибка аппроксимации не превосходит 15%. С другой стороны, пользователь модели, выполнив содержательный анализ проблемы на предмет ее чувствительности к точности решения, может установить другой предел точности.
Если по итогам проверки модель признана качественной (адекватной реальному временному ряду и достаточно точной), ее можно использовать для разработки точечного прогноза. Так, в соответствие с соображениями (7.20) и (7.21) экстраполяция линейной трендовой модели на т шагов в будущее выглядит следующим образом

Распространение на период упреждения случайных колебаний и возможного изменения параметров тренда учитывается с помощью доверительных интервалов прогнозирования, накрывающих точечный прогноз. Они определяются стандартной ошибкой (7.30), горизонтом прогнозирования т, длиной временного ряда п и уровнем значимости прогноза а.
В частности, исходя из точечного прогноза (7.32), будущие значения Yn+X с вероятностью (1-а) попадут в интервал

Рассматривая (7.33), следует отметить, что выражение, которое в левой части квадратных скобок вычитается из точечного прогноза, а в правой — прибавляется к точечному прогнозу, имеет смысл половины ширины доверительного интервала заданного уровня значимости и обозначается латинской буквой 1Дт)

где т — горизонт прогнозирования т.е. экстраполяция тренда на т шагов вперед от момента времени п; tav-коэффициент доверия (коэффициент Стьюдента) для уровня значимости а или доверительной вероят-

ности Р=(1-а) и числа степеней свободы v;
стандартное отклонение показателя Yt от линии тренда Tr(t) (стандартная ошибка оценки тренда) — вносит поправку в интервальный прогноз за случайные отклонения фактических данных от линии тренда.
Заметим также, что для линейной кривой роста можно было бы рассматривать регрессию временного ряда на время.
Пример 7.7. Динамика цен на бензин (развитие темы примера 7.3) На рисунках 7.7—7.9 показана технология расчетов в MSEXCEL в связи с анализом и прогнозирование временных рядов.

Рис. 7.7. Численная оценка параметров тренда и прогнозных цен
на бензин
Обратим внимание, что на фрагменте листа MSEXCEL на рисунке 7.7 организовано вычисление половины ширины интервального прогноза:

На рисунках 7.8 и 7.9 представлены соответственно проверка адекватности модели и интервальный прогноз цен на бензин выполненные студентами в среде Excel.

Рис. 7.8. Проверка адекватности модели
? Yt, руб; —»— Tr(t); —Н/гр; —А— В/гр

Рис. 7.9. Построение интервального прогноза по трендовой модели
Адаптивные модели прогнозирования социально-экономических показателей[1]
- [1] Излагаемый материал впервые был опубликован автором в 2002 г. в учебнометодическом издании «Финансовая математика: Методические указания по изучениюдисциплины и контрольные задания / В. А. Половников, В. Я. Габескирия, И. В. Орлова,А. И. Пилипенко. — М. : ЗАО «Финстатинформ», 2002. — 80 с. (Тема 3. Анализ рядовдинамики и методы прогнозирования финансовых процессов. Тема 4. Статистическиеметоды моделирования финансово-экономических и социальных явлений и процессов)». В дальнейшем этот материал в расширенном виде был включен в Компьютернуюобучающую программу «КОПР4-ФМ» (см. Свидетельство об отраслевой регистрацииразработки № 2857: Компьютерная обучающая программа для студентов 4-го курсапо дисциплине «Финансовая математика» (КОПР4-ФМ). Дата регистрации 18.09.2003 /А. Н. Романов, В. С. Торопцов, Д. Б. Григорович, Л. А. Галкина, В. Л. Иванов, В. А. Половников, В. Я. Габескирия, А. И. Пилипенко, Ю. П. Лукашин, И. В. Орлова, А. М. Черногорский —Министерство образования Российской Федерации. Государственный координационныйцентр информационных технологий. Отраслевой фонд Алгоритмов и программ. (Пилипенко А. И. Тема 3. Анализ рядов динамики и методы прогнозирования финансовыхпроцессов. Тема 4. Статистические методы моделирования финансово-экономическихпроцессов). Кроме того, этот материал, переработанный, дополненный и по новомуорганизованный, представлен в учебном пособии «Финансовая математика: Математическое моделирование финансовых операций : учеб, пособие / под ред. В. А. Половни-кова, А. И. Пилипенко. — М. : Вузовский учебник ; ИНФРА-М, 2004, 2010 (переизд.). —360 с.» (Пилипенко А. И. : основной текст и редакция «Глава 4. Анализ рядов динамикиметоды краткосрочного прогнозирования финансовых показателей»,«Глава 5. Оценкаи анализ финансовых рисков» и «Глава 6. Стохастическое моделирование финансово-экономических процессов. Стохастическая финансовая математика»).