Статистический анализ и прогнозирование сезонных колебаний во временных данных

К важным задачам, возникающим при обработке временных данных, следует отнести выявление, оценивание, моделирование и прогнозирование периодических колебаний. При этом процедуры оценивания значений сезонной составляющей зависят от того, какой характер носят эти периодические колебания (аддитивный или мультипликативный). Если в модели предполагается наличие сезонности в аддитивной форме, то ее значения будут измеряться в абсолютных величинах, для мультипликативного типа сезонности – в относительных.

Укрупненный алгоритм оценивания значений сезонной компоненты можно представить в виде последовательных этапов, показанных на рис. 8.7.

Схема получения оценок сезонной составляющей

Рис. 8.7. Схема получения оценок сезонной составляющей

Рассмотрим особенности реализации каждого этапа.

  • 1. На первом шаге для описания тенденции применяется процедура скользящей средней. При этом, как правило, используется четное значение параметра, определяющего длину интервала сглаживания (), что позволяет сгладить как случайные, так и периодические колебания. При работе с данными ежемесячной динамики скользящие средние чаще всего рассчитываются с помощью выражения (8.4), в случае квартальной динамики – (8.3).
  • 2. Реализация второго этапа зависит от характера сезонности. Для мультипликативной сезонности рассчитываются отношения фактических значенийк уровням сглаженного ряда, полученным на предыдущем шаге:

В случае аддитивной сезонности происходит вычитание значений сглаженного временного ряда из фактических:

Уровни полученного временного рядаподвержены влиянию сезонных и случайных воздействий.

3. Для элиминирования воздействия случайной составляющей рассчитываются средние значения из уровней х, для одноименных месяцев (кварталов). Для ежемесячной динамики этот этап может быть представлен в виде

(8.13)

где k – число целых периодов дня временного ряда, полученного на втором шаге.

Аналогичным образом можно представить процедуру усреднения для временных рядов квартальной динамики:

(8.14)

Разные пределы суммирования в приведенных формулах связаны с тем, что при использовании скользящей средней будут потеряны р первых и р последних уровней временного ряда. В формуле (8.13) учитывается, что потери составят но шесть уровней в начале и конце временного ряда при анализе ежемесячной динамики, в свою очередь при исследовании квартальной динамики в формуле (8.14) учитывается, что будут потеряны два уровня в начаче и два – в конце временного ряда.

  • 4. Заключительный этап – корректировка первоначальных значений сезонной составляющей, полученных на предыдущем шаге. Необходимость этого этапа вызвана тем, что для полного сезонного периода значения сезонной составляющей должны удовлетворять следующим требованиям:
    • • для мультипликативной формы сезонности их средняя арифметическая должна быть равна единице;
    • • для аддитивной формы сезонности сумма их значений должна быть равна нулю.

Поэтому в случае мультипликативного характера сезонной составляющей ее скорректированные, окончательные значения определяются следующим образом:

где– число фаз в полном сезонном периоде (как правило, m = 12 для временных рядов ежемесячной динамики и m = 4 для квартальных данных).

Для аддитивной формы сезонности этап корректировки проводится с помощью следующего выражения:

(8.15)

где– число фаз в полном сезонном периоде (цикле).

Различия в реализации основных этапов выделения сезонной составляющей в зависимости от характера сезонности (аддитивного или мультипликативного) представлены в табл. 8.11.

Таблица 8.11

Основные этапы выделения сезонной составляющей (с учетом характера сезонности)

Основные

этапы

Аддитивный характер сезонности

М у л ьти 11 л и кати вны й хара ктер сезонности

I этап

Получение сглаженных уровней временного ряда () с помощью процедуры скользящей средней (при четной длине интервала сглаживания)

II этап

Вычисление разностей фактических уровней yt и сглаженных значений

Вычисление отношений фактических уровней у, ксглаженным значениям

III этап

Определение предварительных оценок сезонности () путем усреднения значений уровней л1, для одноименных месяцев (кварталов)

IV этап

Корректировка значений сезонной составляющей:

, где

– число фаз в полном сезонном цикле

Корректировка значений сезонной

составляющей:

где

Пример 8.5

На рис. 8.8 представлена по данным Росстата ежемесячная динамика ввода в действие жилых домов в Российской Федерации с 2002 по 2005 г. Графический анализ исследуемого временного ряда свидетельствует о наличии трендовой компоненты в анализируемом периоде: наглядно выражена тенденция роста объемов вводимого жилья.

Ежемесячная динамика ввода в действие жилых домов в Российской Федерации с января 2002 г. по декабрь 2005 г

Рис. 8.8. Ежемесячная динамика ввода в действие жилых домов в Российской Федерации с января 2002 г. по декабрь 2005 г.

Также па рис. 8.8 отчетливо видны внутригодовые сезонные колебания, характерные для ежемесячной динамики ввода в действие жилых домов. Пики приходятся на последний месяц каждого квартала, причем для II и III кварталов эти всплески более значительны, чем для I квартала, отличающегося в целом низкой строительной активностью. Наиболее существенный всплеск ежегодно приходится на декабрь, что связано со стремлением сдать работу в завершающемся отчетном году. В исследуемом периоде объемы жилья, вводимого в этом месяце, составляли почти 1/3 от общего ввода в действие жилых домов за год.

На рис. 8.8 амплитуда сезонных колебаний изменяется с течением времени, увеличивается с ростом тренда, что указывает на мультипликативный характер сезонности.

Применение вышеописанной процедуры (см. табл. 8.11) позволило получить оценки коэффициентов сезонности, наглядно представленные с помощью лепестковой диаграммы (рис. 8.9).

Представление сезонной составляющей с помощью лепестковой диаграммы

Рис. 8.9. Представление сезонной составляющей с помощью лепестковой диаграммы

Самые низкие значения коэффициентов сезонности характерны для января и февраля, выделяются третий, шестой и девятый месяцы, завершающие соответствующие квартаны.

Наглядно иллюстрирует неравномерность ввода жилья резко выделяющийся на рис. 8.9 "лепесток", соответствующий последнему месяцу года.

Следует отметить, что существуют различные модификации рассмотренной процедуры выделения сезонности. Например, на третьем этапе при определении предварительных оценок сезонности () может использоваться медианное значение из уровней х, для одноименных месяцев (кварталов). Привлекательность такого подхода объясняется тем, что медиана, в отличие от средней арифметической, устойчива к наличию выбросов, аномальных наблюдений.

В большинстве случаев получение оценок сезонности – лишь промежуточный этап исследования, так как в дальнейшем они используются для моделирования и прогнозирования исследуемых процессов. Таким образом, рассмотренная процедура оценивания сезонной составляющей представляет начальный этап построения тренд-сезонных моделей.

Для последующего моделирования и расчета прогнозов затем проводят процедуру сезонной корректировки, или десезонализации исходных данных (очищения их от сезонных колебаний).

На основе полученного сезонно-скорректированного (десезонализиро- ванного) временного ряда рассчитываются параметры трендовой модели, что позволяет на следующем этапе осуществить моделирование динамики исходных данных с учетом трендовой и сезонной составляющих.

Решение о целесообразности дальнейшего использования построенной модели для прогнозирования принимается исследователем после анализа характеристик точности и адекватности модели. Рассмотрим применение этого подхода на примере.

Квартальные данные о производстве электроэнергии в Российской Федерации, охватывающие период с 2009 по 2012 г., представлены в табл. 8.12.

Таблица 8.12

Производство электроэнергии в Российской Федерации

Год

Квартал

Порядковый номер квартала t

Производство электроэнергии уt млрд кВт • ч

2009

I

1

274

II

2

221

III

3

218

IV

4

279

2010

I

5

290

II

6

232

III

7

230

IV

8

287

2011

I

9

292

II

10

237

III

11

235

IV

12

288

2012

I

13

301

II

14

238

III

15

235

IV

16

290

Источник: по данным Федеральной службы государственной статистики.

Требуется рассчитать прогнозную оценку производства электроэнергии в I квартале следующего года.

Решение

Начальный этап исследования связан с проведением графического анализа динамики исходного временного ряда. В анализируемый период наблюдается небольшой рост производства, причем характер тенденции близок к линейному развитию. На рис. 8.10 отчетливо видны внутригодовые сезонные колебания, характерные для ежемесячной динамики производства электроэнергии в Российской Федерации, связанные с периодическими подъемами производства в зимне-осенние периоды и спадами в весенне-летние. Характер периодических колебаний свидетельствует о целесообразности выбора для этого временного ряда модели с аддитивной сезонностью.

Квартальная динамика производства электроэнергии в Российской Федерации, млрд кВт-ч

Рис. 8.10. Квартальная динамика производства электроэнергии в Российской Федерации, млрд кВт-ч

В табл. 8.13 представлены результаты расчетов, в частности, гр. 3 таблицы содержит результаты сглаживания исходных данных с помощью процедуры скользящей средней на основе формулы (8.3). Например:

Таблица 8.13

Прогнозирование производства электроэнергии в Российской Федерации с помощью тренд-ссзонной модели

t

Производство электроэнергии у,, млрд кВт • ч

Скользящая средняя у[

Десезонализированный ряд i/,01

Расчетные уровни, полученные по тренд-сезон ной модели у(

1

2

3

4

5

6

1

274

-

241,125

281,3

2

221

247,958

222,9

3

218

250,000

-32,000

248.542

220,7

4

279

253,375

25,625

254,375

277,3

5

290

256,250

33,750

257,125

287,0

6

232

258,750

-26,750

258,958

228,6

7

230

260,000

-30,000

260,542

226.5

8

287

260.875

26,125

262,375

283,1

9

292

262,125

29,875

259,125

292,8

10

237

262,875

-25,875

263,958

234,4

11

235

264,125

-29.125

265,542

232,3

12

288

265,375

22,625

263.375

288,9

13

301

265,500

35,500

268,125

298,6

14

238

265,750

-27,750

264,958

240,2

15

235

265,542

238,0

16

290

265,375

294,6

Уровни хг полученные вычитанием значений сглаженного ряда из исходных уровней (см. ф. 4 табл. 8.13), подвержены влиянию сезонности и случайных факторов.

Усреднение значений х, для одноименных кварталов (табл. 8.14) позволило получить предварительные оценки значений сезонной составляющей.

Таблица 8.14

Расчет оценок сезонной составляющей

Год

I квартал

II квартал

III квартал

IV квартал

2009

-32,000

25,625

2010

33,750

-26,750

-30,000

26,125

2011

29,875

-25.875

-29,125

22,625

2012

35,500

-27,750

33,042

-26,792

-30,375

24.792

5,

32,875

-26,958

-30,542

24,625

Например, для I квартала оценка сезонной составляющей рассчитана следующим образом:

Однако требуется провести корректировку полученных значений сезонной составляющей, так как их сумма отлична от нуля:. В соответствии с формулой (8.15) определяется значение поправки для расчета в дальнейшем скорректированных оценок сезонности:

Например, окончательная оценка значения сезонной компоненты для I квартала будет

В последней строке табл. 8.14 приведены скорректированные оценки сезонности, удовлетворяющие свойству

Последующие этапы прогнозирования показаны в табл. 8.13 (гр. 5,6). После удаления сезонной составляющей из исходных данных, т.е. проведения их сезонной корректировки (гр. 5), для десезонализированного временного ряда с помощью метода наименьших квадратов были определены коэффициенты линейной трендовой модели:

Суммирование трендовых значений, полученных с помощью данной модели, и соответствующих значений сезонной составляющей позволило определить расчетные уровни, представленные в гр. 6 табл. 8.13.

Прогноз уровня производства электроэнергии в I квартале следующего года рассчитывался следующим образом:

Фактические уровни и расчетные значения вместе с прогнозом на I квартал следующего года представлены на рис. 8.11.

Результаты прогнозирования производства электроэнергии в Российской Федерации, млрд кВт • ч

Рис. 8.11. Результаты прогнозирования производства электроэнергии в Российской Федерации, млрд кВт • ч:

– фактические уровни;– расчетные уровни

Полученные значения характеристик точности, а также результаты визуального анализа свидетельствуют о близости расчетных и фактических значений. При этом необходимо учитывать, что использование этого подхода базируется на предположении об устойчивости сезонных эффектов во времени, а применение модели кривой роста для описания и прогнозирования тенденции предполагает сохранение инерционности развития.

Для анализа и прогнозирования сезонных колебаний можно также использовать фиктивные переменные. Пусть уровни временного ряда квартальной динамики представлены в виде аддитивной модели:

(8.16)

где– коэффициенты модели;

В формуле (8.16) трендовая составляющая описывается линейной моделью, а сезонные колебания – с помощью фиктивных переменных , которые добавлены в линейной форме в правую часть уравнения. Бинарные переменныепринимают одно из двух значений: нуль или единица в зависимости от принадлежности уровня к определенному кварталу.

В рассматриваемой модели I квартал выступает в роли эталонной категории, а коэффициенты при фиктивных переменных позволяют оценивать разницу в уровнях сезонности между эталонным кварталом и остальными. Коэффициенты модели могут быть определены с помощью метода наименьших квадратов в предположении, что регрессионные остатки е, удовлетворяют всем необходимым требованиям.

Если бы в модель (8.16) со свободным членом были включены четыре фиктивные переменные, то возникла бы ситуация, получившая название "ловушка" {dummy trap). В этом случае сумма столбцов, соответствующих фиктивным переменным в матрице исходных наблюдений X, совпалабы с первым единичным столбцом этойматрицы. В результате матрица используемая в выражении', оказалась бы вырожденной, а оценивание параметров модели с помощью метода наименьших квадратов стало бы невозможным.

Значения коэффициентов при фиктивных переменных можно рассматривать в качестве оценок "сдвигов" в уровнях за счет фактора сезонности по сравнению с первым эталонным кварталом, а проверка гипотезы (для i = 2,3,4) позволяет сделать вывод о существенности этих сезонных сдвигов относительно первого эталонного квартала.

Проверка осуществляется с помощью f-статистики Стьюдента как в обычных регрессионных моделях. Гипотезаотвергается, если

где– оценка коэффициента при i-й фиктивной переменной,;

– стандартная ошибка соответствующего коэффициента;– значение, соответствующее t-распределению Стьюдента для заданного уровня значимостии числа степеней свободы– длина временного ряда (количество наблюдений);– число коэффициентов в модели.

Если коэффициент модели при г-й фиктивной переменной статистически значим (т.е. гипотеза Н0 отвергается), то делается вывод о существенности сезонного сдвига в г-м квартале относительно ранее выбранного эталонного.

Пример 8.7

Рассмотрим использование описанного подхода для моделирования и прогнозирования динамики временного ряда, содержащего квартальные данные о перевозке грузов железнодорожным транспортом за четыре года (табл. 8.15).

Требуется получить прогнозную оценку объемов перевозок фузов железнодорожным транспортом в первом полугодии следующего года, применив фиктивные переменные для моделирования сезонных колебаний.

Таблица 8.15

Квартальные данные о перевозке грузов железнодорожным транспортом

Порядковый номер квартала t

Квартал

Объем перевозок грузов у,, млн т

1

I

248

2

II

270

3

III

282

4

IV

284

5

I

269

6

II

291

7

III

298

8

IV

302

9

I

289

10

II

304

11

III

312

12

IV

315

13

I

299

14

II

317

15

III

325

16

IV

332

Решение

На рис. 8.12 отчетливо видны ежегодные сезонные спады, соответствующие I кварталу, также визуальный анализ позволяет высказать гипотезу о том, что повышательный тренд может быть описан линейной моделью.

Квартальная динамика объемов перевозок грузов железнодорожным транспортом

Рис. 8.12. Квартальная динамика объемов перевозок грузов железнодорожным транспортом

Графический анализ позволяет предположить аддитивный характер сезонности, а для описания динамики показателя используем модель (8.16). Оценивание коэффициентов модели осуществляем с помощью метода наименьших квадратов, при этом в выраженииматрица X имеет вид

В результате получена следующая регрессионная модель:

Представленные под уравнением статистические характеристики свидетельствуют о значимости уравнения и его коэффициентов. Опираясь на построенную модель, можно записать четыре уравнения, характеризующие динамику уровней ряда для различных кварталов:

  • • для наблюдений I квартала;
  • • для наблюдений II квартала:
  • • для наблюдений III квартала;
  • • для наблюдений IV квартала.

Различия в моделях вызваны влиянием сезонных эффектов, при этом следует обратить внимание на неизменность параметра, определяющей) угол наклона линейного тренда

На рис. 8.13 представлены фактические уровни исследуемого временного ряда и расчетные значения вместе с прогнозными опенками на I и II кварталы следующего года.

Для расчета прогноза объема перевозок грузов железнодорожным транспортом в первом полугодии следующего года требуется сложить прогнозные оценки, полученные для 17-го и 18-го кварталов:

Результаты прогнозирования объемов перевозок грузов железнодорожным транспортом

Рис. 8.13. Результаты прогнозирования объемов перевозок грузов железнодорожным транспортом:

– фактические уровни;– расчетные уровни

Следовательно, прогноз объемов перевозок грузов железнодорожным транспортом в первом полугодии следующего года составит 650,1 млн т.

Таким образом, фиктивные переменные существенно расширяют возможности регрессионных моделей для описания динамики сложных экономических процессов.

В то же время рассмотренные подходы предполагают сохранение инерционности развития исследуемых процессов и устойчивый характер сезонных колебаний, что не всегда соответствует реальной динамике. В следующем параграфе рассматриваются адаптивные модели прогнозирования, отказывающиеся от этих предположений.

 
< Пред   СОДЕРЖАНИЕ     След >