Меню
Главная
Авторизация/Регистрация
 
Главная

Анализ временных данных

В результате изучения материала главы 8 обучающийся должен:

знать

  • • основные методы анализа и прогнозирования временных данных;
  • • виды моделей прогнозирования, особенности их построения и реализации в современных аналитических пакетах, а также область их практического применения;

уметь

  • • проводить анализ динамики временных данных;
  • • проводить идентификацию и оценивание параметров моделей прогнозирования одномерных рядов динамики;
  • • проводить диагностическую проверку построенных моделей;

владеть

  • • навыками анализа динамики временных данных;
  • • навыками прогнозирования социально-экономических процессов с использованием статистических методов и аналитического программного обеспечения.

Введение в анализ временных данных. Методы сглаживания временных данных и моделирования тенденции развития

Видное место в аналитической практике занимают вопросы, связанные с исследованием изменений показателей во времени, с изучением динамики развития социально-экономических процессов. Методы анализа и прогнозирования динамики одномерных временных рядов стали важной частью аналитических исследований в различных сферах (финансовой, социально-экономической и др.).

Значения уровней временных рядов могут включать следующие структурные составляющие: долговременную составляющую (тренд); сезонную и циклическую компоненты; нерегулярную (случайную) составляющую.

Под трендом понимают составляющую долговременного действия, определяющую основную тенденцию в развитии временного ряда. Также во временных рядах часто наблюдаются периодические составляющие, различающиеся периодом колебаний и их устойчивостью во времени. Сезонными называют колебания, в случае если их период не превышает одного года. В экономической литературе часто причины их возникновения связывают с природно-климатическим фактором. Однако на появление и характер сезонных колебаний оказывают воздействие многие факторы, например носящие социальный характер: увеличение выплат в конце полугодия/ года, рост объемов продаж перед праздниками (в предновогодний период, перед 8 Марта и т.д.).

Также во временных рядах могут присутствовать циклические составляющие, связанные с наличием периодических колебаний с большим периодом. В качестве примеров можно указать демографические, инвестиционные циклы, наиболее часто обсуждаемые в экономической литературе циклы деловой активности, исследованные Кондратьевым. В аналитических пакетах встречается название "тренд-циклическая составляющая", так как на практике часто невозможно отделить эти компоненты. В экономике приходится иметь дело с короткими временными рядами, поэтому редко имеется возможность для полноценного анализа циклической составляющей. Популярным примером изучения циклических колебаний в естественнонаучной сфере служит выявленная 11-летняя периодичность солнечной активности.

Удаление из временного ряда тренда и периодических составляющих позволяет получить нерегулярную компоненту, которая, по мнению специалистов, может формироваться как под влиянием факторов резкого воздействия (например, эпидемии, стихийные бедствия и др.), так и текущих факторов.

Если на практике используется модель, рассматривающая каждый уровень временного ряда в виде суммы соответствующих структурных частей, то она носит название аддитивной (от англ. to add – "добавлять"):

где – уровни временного ряда; – трендовая составляющая; – сезонная компонента; – циклическая компонента; – случайная компонента.

Мультипликативная модель предполагает представление уровней временного ряда в виде произведения соответствующих компонент:

Также применяются модели смешанного типа. Примером может служить модель, в которой случайная составляющая прибавляется к произведению других компонент:

На рис. 8.1 показана ежемесячная динамика добычи угля в Российской Федерации, демонстрирующая сезонные эффекты при наличии возрастающего тренда.

Очевидно, что необязательно все компоненты должны участвовать в процессе формирования уровней каждого временного ряда. Например, в динамике одного временного ряда могут отсутствовать периодические составляющие, другого – трендовая компонента, третьего – как трендовая компонента, так и периодические составляющие, при этом его уровни будут формироваться под воздействием только случайной компоненты.

Визуальный анализ динамики временных рядов – важный этап исследования, так как с помощью графика можно провести предварительное исследование компонентного состава временных рядов, определить характер сезонных колебаний (аддитивный или мультипликативный), а также сделать первые шаги к выбору моделей. Следует учитывать, что амплитуда сезонных колебаний, отражающая отклонения от тренда или среднего, остается примерно постоянной, неизменной во времени для аддитивного характера сезонности.

Ежемесячная динамика добычи угля в Российской Федерации

Рис. 8.1. Ежемесячная динамика добычи угля в Российской Федерации[1]

На рис. 8.2 представлена ежемесячная динамика инвестиций в основной капитал в Российской Федерации.

Ежемесячная динамика инвестиций в основной капитал в Российской Федерации

Рис. 8.2. Ежемесячная динамика инвестиций в основной капитал в Российской Федерации

На графике возрастающий тренд сочетается с устойчивыми сезонными колебаниями, при этом ники активности в поступлении инвестиций в основной капитал ежегодно приходятся на декабрь. В данном случае целесообразно сделать вывод о мультипликативном характере сезонности, так как амплитуда сезонных колебаний возрастает с течением времени. Таким образом, графическое исследование данных представляет собой важный этап разведочного анализа, предшествующего моделированию и последующему прогнозированию.

Определение основной тенденции развития – важная задача, требующая в зависимости от характера динамики применения различных подходов. Распространенные на практике приемы связаны со сглаживанием временных рядов, т.е. с заменой фактических значений на расчетные уровни, менее подверженные колебаниям.

Процедуры скользящих средних играют важную роль в анализе временных рядов, так как используются для сглаживания как случайных, так и периодических колебаний. Традиционно выделяют простые и взвешенные скользящие средние.

Простую скользящую среднюю целесообразно использовать, если визуальный анализ характера динамики свидетельствует о близости к линейному развитию, в противном случае применение этой процедуры может привести к существенным искажениям.

При реализации этого подхода сначала необходимо задать значение параметра, определяющего длину l интервала сглаживания. При выборе этого значения требуется учитывать длину временного ряда, а также характер имеющихся колебаний. Увеличение значения параметра l способствует более сильному сглаживанию.

Далее следует разбить весь временной ряд на участки, каждый из которых содержит / уровней. Например, припервый участок содержит уровни; второй – и т.д. Затем центральный уровень в середине каждого участка следует заменить на соответствующее среднее значение из уровней, образующих этот участок.

Описанный алгоритм позволяет рассчитывать центрированные скользящие средние, так как в этом случае расчетные значения приходятся на средний (центральный) член интервала. Очевидно, что для реализации этого подхода удобно брать длину интервала сглаживания l в виде нечетного числа:, при этом все уровни активного участка могут быть представлены в виде

где– центральный уровень активного участка.

Расчет простой скользящей средней приможет быть представлен следующим образом:

(8.1)

где– фактическое значение i-го уровня.

При таком подходе будут потеряны как р уровней в начале, так и р уровней в конце сглаженного временного ряда.

Для устранения периодических колебаний во временных рядах используют процедуру сглаживания при значении параметра l, равном или кратном периоду колебаний, что, как правило, приводит к необходимости расчета скользящих средних при четном значении l. В этом случае (при) выражение (8.1) будет заменено выражением

(8.2)

Согласно формуле (8.2) число уровней, рассматриваемых на каждом активном участке, составляет + 1, при этом первое и последнее наблюдения на активном участке учитываются в числителе с весом 0,5. Наибольшее распространение на практике получили скользящие средние при l = 4 и l – 12:

(8.3)

(8.4)

Пример 8.1

В табл. 8.1 приведены квартальные данные об объемах продаж продукции фирмы за последние четыре года. Требуется сгладить сезонные колебания с помощью процедуры скользящих средних, приняв длину интервала сглаживания l = 4.

Таблица 8.1

Квартальные данные об объемах продаж продукции фирмы

Порядковый номер квартала 1

Квартал

Объем продаж уг тыс. шт.

1

I

66.0

2

II

55,3

3

III

53,6

4

IV

68,8

5

I

72,5

6

II

58,0

7

III

57,5

8

IV

76,0

9

I

75,5

10

II

61.0

11

III

58,8

12

IV

78,2

13

I

79,7

14

II

61,2

15

III

63,0

16

IV

81,4

Решение

Анализ данных показывает, что ежегодно в I и IV кварталах наблюдаются всплески в объемах продаж, при этом сезонные спады характерны для уровней, соответствующих II и III кварталам каждого года. Для сглаживания этих сезонных колебаний используем четырехчленную скользящую среднюю:

и т.д.

В табл. 8.2 представлены результаты расчетов, а их графическая иллюстрация на рис. 8.3 отражает тенденцию к росту объемов продаж.

Таблица 8.2

Результаты сглаживания с помощью скользящей средней при / = 4

Порядковый номер квартала t

Скользящая средняя l = 4

1

2

3

61,7

4

62,9

5

63,7

6

65,1

7

66,4

8

67,1

9

67,7

10

68,1

11

68,9

12

69,5

13

70,0

14

70,9

15

16

Сглаживание временного ряда объемов продаж с помощью скользящей средней при l = 4:

Рис. 8.3. Сглаживание временного ряда объемов продаж с помощью скользящей средней при l = 4:

– фактические уровни;– скользящая средняя при l = 4

При вычислении взвешенной скользящей средней также происходит замена центрального уровня на каждом активном участке на расчетное значение, однако в данном случае оно определяется с помощью средней арифметической взвешенной:

(8.5)

где– весовые коэффициенты.

Как следует из формулы (8.5), при расчете взвешенной скользящей средней каждому уровню соответствует весовой коэффициент, зависящий от его удаления от центрального уровня на активном участке. Следует учитывать, что при простой скользящей средней выравнивание на каждом активном участке производится по линейной модели (полиному первого порядка), а при сглаживании по взвешенной скользящей средней – по полиномам более высоких порядков, чаще всего – второго или третьего.

Значения весовых коэффициентов зависят от порядка сглаживающего полинома и длины интервала сглаживания. В табл. 8.3 представлены весовые коэффициенты, рассчитанные для длин интервала сглаживания l = 5,7, 9, 11, 13 в случае, когда на каждом активном участке сглаживание производится с помощью полинома второго или третьего порядка.

Таблица 8.3

Весовые коэффициенты для расчета взвешенной скользящей средней (при сглаживании по полиномам второго и третьего порядка)

Длина интервала сглаживания

Весовые коэффициенты

5

7

9

11

13

Весовые коэффициенты симметричны относительно центрального уровня, что позволило указать в таблице их значения только для половины уровней активного участка (для оставшихся уровней они могут быть повторены). При этом в таблице весовые коэффициенты, относящиеся к центральному уровню, выделены жирным шрифтом.

Проиллюстрируем процедуру расчета взвешенных скользящих средних на следующем примере.

Пример 8.2

По данным об изменении индекса ММВБ (табл. 8.4) рассчитаем взвешенные скользящие средние при длине интервала сглаживания / = 5 и / = 9 (сглаживание на каждом активном участке – по полиному второго порядка). Сравним результаты графически.

Таблица 8.4

Данные об изменении индекса ММВБ

Дата

Порядковый номер уровня t

Индекс ММВБ (открытие)

24.05.2013

1

1397,75

27.05.2013

2

1380,92

28.05.2013

3

1378,25

29.05.2013

4

1397,54

30.05.2013

5

1361,16

31.05.2013

6

1362,00

04.06.2013

7

1337,52

05.06.2013

8

1341,33

06.06.2013

9

1326,73

07.06.2013

10

1316,32

10.06.2013

11

1343,90

11.06.2013

12

1335,25

13.06.2013

13

1302,52

14.06.2013

14

1282,46

17.06.2013

15

1300,02

18.06.2013

16

1325,09

19.06.2013

17

1334,66

20.06.2013

18

1323,55

21.06.2013

19

1297,01

24.06.2013

20

1298,41

25.06.2013

21

1289,76

26.06.2013

22

1297,59

27.06.2013

23

1320,39

28.06.2013

24

1314,68

Решение

Для вычисления значений взвешенной скользящей средней при длине интервала сглаживания l = 5 воспользуемся табл. 8.3. Тогда

и т.д. Аналогичным образом с помощью соответствующих весовых коэффициентов рассчитываются значения взвешенной скользящей средней при длине интервала сглаживания l = 9. В табл. 8.5 отражены результаты дальнейших расчетов.

Таблица 8.5

Сглаживание временного ряда "Индекс ММВБ" с помощью взвешенной скользящей средней

Дата

Взвешенные скользящие средние

l=5

l = 9

24.05.2013

-

-

27.05.2013

-

-

28.05.2013

1385.57

-

29.05.2013

1382,92

-

30.05.2013

1374,48

1368,55

31.05.2013

1352,04

1359,87

04.06.2013

1346,12

1344,37

05.06.2013

1335,39

1333,09

06.06.2013

1325,77

1334,15

07.06.2013

1325.58

1331,99

10.06.2013

1336.50

1326,24

11.06.2013

1333,14

1315,23

13.06.2013

1303,53

1309.13

14.06.2013

1287,18

1307,44

17.06.2013

1299,41

1307,89

18.06.2013

1323,56

1312,44

19.06.2013

1333,77

1319,26

20.06.2013

1320,28

1318,58

21.06.2013

1303,98

1308,01

24.06.2013

1292,88

1299,79

25.06.2013

1292,16

26.06.2013

1301,19

27.06.2013

28.06.2013

-

На рис. 8.4 представлены исходный временной ряд, динамика которого носит нелинейный характер, а также взвешенные скользящие средние, полученные при различной длине интервала сглаживания. Очевидно, что временной ряд, сглаженный по 9-членной скользящей средней, носит более гладкий характер.

Применение скользящих средних часто предшествует построению моделей кривых роста, широко используемых на практике для описания тенденции развития. Моделирование на основе кривых роста, представляющих собой различные функции времени у = f(t), базируется на предположениях об инерционном характере развития показателя и наличии детерминированного тренда, что позволяет в дальнейшем осуществлять прогнозирование с помощью экстраполяции.

Сглаживание временного ряда

Рис. 8.4. Сглаживание временного ряда "Индекс ММВБ" с помощью взвешенных скользящих средних:

– фактические уровни:– взвешенная скользящая средняя при l= 5; – взвешенная скользящая средняя при l = 9

При использовании моделей кривых роста уровни временного ряда могут быть представлены в виде

где– случайные неавтокоррелированные отклонения с нулевым математическим ожиданием и постоянной дисперсией. Предполагается, что вид функцииизвестен, при этом требуется оценить параметры [3].

В большинстве случаев для оценивания параметров трендовых моделей 0 используется метод наименьших квадратов в рамках регрессионных моделей, в которых в качестве значений зависимой (dependent) переменной выступают фактические уровни ряда, а в роли независимой (independent) переменной – время t. При построении нелинейных трендовых моделей могут быть применены процедуры линеаризации либо нелинейные методы оценивания коэффициентов.

В социально-экономических исследованиях среди кривых роста наиболее часто используется класс полиномов

(8.6)

где– параметры многочлена; t – независимая переменная (время),

Обычно на практике применяются полиномы невысоких порядков, так как в противном случае аппроксимирующие функции будут отражать случайные отклонения (что противоречит смыслу тенденции). С помощью метода наименьших квадратов оценки параметров модели (8.6) находятся исходя из условия

(8.7)

где– фактическое значения;– расчетное значение; п – длина временного ряда.

В результате минимизации выражения (8.7) получается система нормальных уравнений

(8.8)

Решение системы (8.8), позволяющее найти неизвестные величины коэффициентов, может быть записано в матричном виде:

(8.9)

В этом выражении матрица X (по аналогии с регрессионным анализом – матрица наблюденных значений объясняющих переменных) имеет вид – вектор-столбец фактических наблюденных значений зависимой переменной.

Пример 8.3

С помощью выражения (8.9) для временного ряда, характеризующего динамику объема жилищного фонда в собственности граждан в Российской Федерации с 1993 по 2007 г. (табл. 8.6), найдем коэффициенты линейной трендовой модели

Таблица 8.6

Жилищный фонд в собственности граждан в Российской Федерации[2]

Год

Порядковый номер года

Жилищный фонд, млн м2

1993

1

943

1994

2

1078

1995

3

1166

1996

4

1234

1997

5

1312

1998

6

1418

1999

7

1538

2000

8

1620

2001

9

1809

2002

10

1897

2003

11

1971

2004

12

2055

2005

13

2182

2006

14

2298

2007

15

2385

Решение

Воспользуемся формулой (8.9) для определения коэффициентов модели.

В матрице X имеем два столбца, содержащие соответственно единицы и значения временного параметра t 1,2,..., 15. Следовательно.

Тогда, а матрицаi

Используя Y – вектор-столбец фактических значений зависимой переменной, после соответствующих вычислений получаем значения вектора

Теперь в соответствии с формулой (8.9) определяем коэффициенты линейной трендовой модели:

Таким образом, построенная трендовая модель имеет вид

Согласно этой модели в исследуемом периоде объем жилищного фонда в собственности граждан в Российской Федерации в среднем ежегодно увеличивался на 103,514 млн м2. Расчетные уровни, полученные на основе построенной трендовой модели, близки к фактическим значениям. Прогнозная оценка показателя в следующем году, рассчитанная путем подстановки в модель t = 16, составила 2488,5 млн м2. Фактическое значение – 2469 млн м2, модуль абсолютной ошибки – 19,5 млн м2, модуль относительной ошибки (см. табл. 8.9) – примерно 0,8%.

Также на практике для описания тенденции развития часто используется показательная (экспоненциальная) модель, имеющая вид

(8.10)

В этой модели параметр а характеризует начальные условия развития, а параметр b – постоянный темп роста.

Как известно, цепной темп роста вычисляется с помощью отношения – . Следовательно, учитывая формулу (8.10), можно записать

После логарифмирования выражения (8.10) становится очевидным, что для оценивания неизвестных параметров a, b можно использовать систему нормальных уравнений для линейной модели, заменив фактические значения уровней их логарифмами. Универсальность такого подхода к оцениванию неизвестных параметров модели делает его привлекательным в практических исследованиях.

Пример 8.4

В табл. 8.7 представлены квартальные данные о прибыли компании.

Таблица 8.7

Динамика прибыли компании

Порядковый

номер

квартала

Прибыль, тыс. долл.

Порядковый

номер

квартала

Прибыль, тыс. долл.

Порядковый

номер

квартала

Прибыль, тыс. долл.

1

73.5

4

87.4

7

102.8

2

80,3

5

90.7

8

114,6

3

82.5

6

98.5

9

120,7

Требуется по имеющимся данным определить коэффициенты показательной трендовой модели у( = а • Ь'.

Решение

Для оценивания неизвестных параметров используем систему нормальных уравнений после проведения логарифмирования для линеаризации модели гдеНеизвестные коэффициенты А и В могут быть определены с помощью выражения

где , а матрица X совпадает с аналогичной матрицей для линейной модели.

Затем следует провести потенцирование для определения значений коэффициентов а и Ь.

Имеем. Тогда

Проведя потенцирование, получаем. Следовательно, уравнение тренда примет вид

Согласно этой модели среднеквартальный темп роста прибыли компании в исследуемый период составил 106,2% (среднеквартальный темп прироста – 6,2%). Для определения прогноза уровня прибыли компании на следующий квартал надо подставить в полученную модель(тыс. долл.).

Примеры практики

Для быстрого построения трендовых моделей можно использовать имеющиеся возможности MS Excel. Для этого сначала на основе эмпирического временного ряда нужно построить диаграмму, выбрав, например, среди возможных тип диаграммы "график" (рис. 8.5). Щелкнув на диаграмме на одном из маркеров данных правой кнопкой мыши, можно выделить сам временной ряд. При этом раскрывается контекстное меню, в котором следует выбрать команду "Добавить линию тренда".

Добавление линии тренда в MS Excel

Рис. 8.5. Добавление линии тренда в MS Excel

На экране появится диалоговое окно "Формат линии тренда" (рис. 8.6). В этом окне пользователь может выбрать требуемый тип модели и задать соответствующие параметры. На рис. 8.6 показан выбор экспоненциальной модели из предлагаемого базового набора, включающего также линейную, логарифмическую, полиномиальные и степенную модели.

Диалоговое окно

Рис. 8.6. Диалоговое окно "Формат линии тренда" в MS Excel

Также на диаграмме в качестве дополнительной информации можно представить уравнение модели и характеристику достоверности аппроксимации (коэффициент детерминации R2), установив соответствующие флажки, как показано на рис. 8.6.

Также на практике при моделировании тенденции развития востребованы так называемые кривые насыщения, способные описывать процесс, имеющий предел роста в исследуемом периоде. Такие процессы встречаются в демографических исследованиях, при анализе эффективности использования ресурсов, исследовании динамики среднедушевого потребления товаров (услуг) и др.

Примером кривой насыщения, имеющей отличную от нуля асимптоту, может служить модифицированная экспонента:

(8.11)

где у = k – горизонтальная асимптота.

Асимптота будет находиться выше кривой при значении параметра а < 0, ниже кривой – при значении а > 0. При решении экономических задач наиболее распространен вариант кривой, у которой а < 0, b < 1. В этом случае рост уровней происходит с замедлением и стремится к некоторому пределу.

При решении экономических задач значение асимптоты часто задается экспертным путем либо определяется исходя из свойств прогнозируемого процесса (например, коэффициент использования оборудования не может превышать единицу).

Кривые насыщения, имеющие точки перегиба, образуют класс S-образ- ных кривых. Применение этих кривых целесообразно в тех случаях, когда воздействие ограничивающего фактора начинает сказываться только после определенного момента (точки перегиба). Кривые этого типа находят применение в страховых расчетах, демографических исследованиях, при определении спроса на новый вид продукции и для описания развития новой отрасли (нового производства).

Кривая Гомперца и логистическая кривая (кривая Перла – Рида) – наиболее известные модели этого типа. Модель Гомперца имеет вид

(8.12)

Кривая несимметрична и имеет S-образный вид, если, при этом равная k асимптота будет проходить выше кривой.

Заменив в модели модифицированной экспоненты (8.11)обратной величиной, можно получить уравнение логистической кривой

Возможны и другие формы записи уравнения логистической кривой, например

В отличие от кривой (8.12) эта кривая симметрична относительно точки перегиба, имеющей следующие координаты:. При этом приордината стремится к нулю, при– к асимптоте, равной значению параметра[16, 39].

Рассмотренные свойства кривых роста следует учитывать при выборе вида модели. Возможность построения широкого спектра моделей кривых роста предусмотрена в современных аналитических пакетах прикладных программ.

Примеры практики

В пакете IBM SPSS Statistics, относящемся к мировым лидерам в сфере статистического анализа и обработки данных, пользователю предлагается набор из трендовых моделей кривых роста, часто используемых на практике (табл. 8.8). Представленный набор моделей позволяет описать различный характер динамики, а также может быть расширен за счет моделей, вид которых задается пользователем.

Таблица 8.8

Модели кривых роста, представленные в пакете IBM SPSS Statistics

Название модели/эквивалент названия на английском языке

Вид модели*

Линейная/Linear

Квадратичная/ Quadratic

Кубическая / Cubic

Показательная (составная)/Compound

Экспоненциальная/Exponential

Обратная (гиперболическая)/Inverse

Логарифмическая /Logarithmic

Степенная/Porter

Роста/ Growth

Логистическая/Logistic

S- кривая/S-curve

*– коэффициенты модели.

Проверка адекватности выбранных моделей реальному процессу (в частности, адекватности полученной кривой роста) строится на анализе остаточной компоненты, полученной после выделения из исследуемого ряда систематической составляющей. Анализ ряда остатков включает исследование случайности колебаний его уровней, проверку отсутствия в нем автокорреляции, исследование его распределения и др.

В современных аналитических пакетах прикладных программ пользователю в достаточно удобном виде предоставляется широкий спектр характеристик качества построенных моделей. В табл. 8.9 приведены статистики ошибок (остатков), рассчитываемые при реализации кривых роста в среде IBM SPSS Statistics.

Таблица 8.9

Статистики остатков, рассчитываемые при реализации кривых роста в пакете IBM SPSS Statistics

Характеристика

ошибок

Эквивалент названия на английском языке

Формула

Средняя ошибка

Mean error

– фактическое значение уровня ряда;– расчетное значение уровня ряда; п – длина временного ряда или ретрос некти вного участка

Средняя абсолютная ошибка по модулю

Mean absolute error (MAE)

Средняя ошибка в процентах (средняя относительная ошибка)

Mean percent error (МРЕ)

Средняя абсолютная ошибка в процентах (средняя относительная ошибка по модулю)

Mean absolute percent error (MAPE)

Сумма квадратов ошибок

Sum of squared errors (SSE)

Средний квадрат ошибок

Mean squared error (MSE)

Корень квадратный из среднего квадрата ошибок

Root mean squared error (RMSE)

Статистика Дарбина – Уотсона

DurbinWatson (DUO

Для сравнения точности моделей при описании динамики разнородных объектов широко используется характеристика, называемая в англоязычных пакетах Mean Absolute Percent Error (МАРЕ) (средняя относительная ошибка по модулю или относительная ошибка аппроксимации,) (см. табл. 8.9). При этом в литературе часто встречаются указания на то, что о высокой точности модели свидетельствует значение при значенияхв диапазоне 10–20% точность можно признать хорошей, при

– удовлетворительной. Такой подход следует признать достаточно "механическим", так как он не учитывает особенности динамики исследуемых временных рядов и проводимых прогнозных расчетов.

Очевидно, что все указанные в табл. 8.9 характеристики точности могут быть вычислены после того, как период упреждения уже закончился, и имеются фактические данные о прогнозируемом показателе или при рассмотрении показателя на ретроспективном участке. Иногда в аналитических пакетах при выборе лучшей модели для прогнозирования используют суммы квадратов ошибок (Sums of Squared Errors, SSE) или средние квадраты ошибок (Mean Squared Errors, MSE).

Результаты расчета рассматриваемых характеристик для остатков линейной трендовой модели, описывающей динамику жилищного фонда в собственности граждан в Российской Федерации (см. пример 8.3), представлены в табл. 8.10. Данные таблицы показывают, что в среднем расчетные значения отклонялись от фактических на 1,5%, или на 21,9 млн м2, при этом средняя ошибка равна нулю, так как коэффициенты оценивались с помощью метода наименьших квадратов. Проверка гипотезы об отсутствии автокорреляции первого порядка в остатках с помощью статистики Дарбина – Уотсона показала, что при уровне значимости 0,05 нельзя сделать определенный вывод по имеющимся исходным данным (расчетное значение попало в область неопределенности).

Таблица 8.10

Статистики остатков линейной модели, построенной для ряда динамики жилищного фонда в собственности граждан в Российской федерации

Mean error, млн м2

МАЕ. млн м2

МРЕ, %

МАРЕ, %

SSE,

('млн м2)2

MSE, ('млн м2)2

RMSE, млн м2

DW

0,000

21,909

0,017

1,490

10 485,543

806,580

28,400

1,303

В заключение параграфа отметим, что особенно осторожно следует подходить к выбору модели кривой роста при ее использовании для экстраполяции найденных закономерностей в будущее, так как такое применение базируется на предположении о сохранении выявленных закономерностей в прогнозируемом периоде.

  • [1] Рисунки 8.1 и 8.2 составлены по данным Федеральной службы государственной статистики.
  • [2] По данным Федеральной службы государственной статистики на конец года.
 
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 

Популярные страницы