Оценка параметров уравнения тренда

При использовании полиномов разных степеней оценка параметров уравнения тренда производится методом наименьших квадратов (МНК) точно так же, как оценки параметров уравнения регрессии на основе пространственных данных. В качестве зависимой переменной рассматриваются уровни динамического ряда, а в качестве независимой переменной – фактор времени t, который обычно выражается рядом натуральных чисел 1, 2, ..., п.

Оценка параметров нелинейных функций проводится МНК после линеаризации, т.е. приведения их к линейному виду. Рассмотрим применение МНК для некоторых нелинейных функций, которые не излагались подробно в главе, посвященной регрессии.

Для оценки параметров показательной кривой у = ab1 или экспоненты у = еа+ы (либо у = аеы) путем логарифмирования функции приводятся к линейному виду lny = ln a + t ln b или экспоненты: lny = a + bt. Далее строится система нормальных уравнений

(5.21)

Пример 5.1

Число зарегистрированных ДТП (на 100 000 человек населения) по Новгородской области за 2000–2008 гг. характеризуется данными:

2000

2001

2002

2003

2004

2005

2006

2007

2008

105,7

105,3

156

158,1

160,1

178

191,5

274,6

287,3

Исходя из графика была выбрана показательная кривая / Для построения системы нормальных уравнений были рассчитаны вспомогательные величины

Система нормальных уравнений составила

Решая ее, получим значения

Соответственно имеем экспоненту или показательную кривую

За период с 2000 по 2008 г. число дорожно-транспортных происшествий возрастало в среднем ежегодно на 13,5%. Экспонента достаточно хорошо описывает тенденцию исходного временного ряда: коэффициент детерминации составил 0,9202. Следовательно, данный тренд объясняет 92% колеблемости уровней ряда и лишь 8% ее связаны со случайными факторами.

Некоторую специфику имеет оценка параметров кривых с насыщением: модификационной экспоненты, логистической кривой, кривой Гомперца, гиперболы вида По этим функциям должна быть сначала определена асимптота. Если она может быть задана исследователем на основе анализа временного ряда, то другие параметры могут быть оценены по МНК. В этих случаях данные функции приводятся к линейному виду. Рассмотрим оценку параметров этих кривых на отдельных примерах, начиная с модифицированной экспоненты.

Пример 5.2

Уровень механизации труда (в %) характеризуется динамическим рядом (табл. 5.2)

Таблица 5.2. Расчет параметров модифицированной экспоненты у = с ab't

Годы

У

У = с-у

1пУ

t

ИпУ

t2

У.

2001

82

18

2,890

1

2,890

1

82,4

2002

85

15

2,708

2

5,416

4

85,6

2003

89

11

2,399

3

7,197

9

88,2

2004

91

9

2,197

4

8,788

16

90,3

2005

92

8

2,079

5

10,395

25

92,0

2006

93

7

1,946

6

11,676

36

93,5

2007

94

6

1,792

7

12,544

49

94,6

2008

96

4

1,386

8

11,088

64

95,6

Σ

722

17,397

36

69,994

204

722,2

Так как уровень механизации труда не может превышать 100%, то имеется объективно заданная верхняя асимптота с = 100. Для оценки параметров а и b приведем рассматриваемую функцию к линейному виду ; обозначим (с-у) через Y и прологарифмируем:

Далее применим МНК и получим систему нормальных уравнений

Для нашего примера, исходя из данных итоговой строки табл. 3, имеем систему уравнений

Решив ее, получим ln а = 3,06311; ln b = -0,19744. Соответственно потенцируя, получим: т.е. уравнение .

Если перейти от Y к исходным уровням ряда, уравнение модифицированной экспоненты составит , где параметр показывает средний коэффициент снижения уровня использования ручного труда за 1998–2005 гг. Расчетные значения у, т.е. могут быть найдены путем подстановки в уравнение 0,8208' соответствующих значений t. Либо на основе уравнения In 7= 3,06311 – 0,19744 г при компьютерной обработке определяется In У и далее 100 – е 1пу. Так, при t = 8 In Y = = 1,48363 и 100 – e1'48363 = 100 – 4,40892 = 95,59108 = 95,6 (см. последнюю графу таблицы). Ввиду некоторой смещенности оценок (так как МНК применяется к логарифмам) Ху, Ф Ху,, хотя в примере эти величины достаточно близки друг другу.

Если асимптота с не задана, то оценка параметров модифицированной экспоненты усложняется. В этих случаях могут использоваться разные методы оценивания: метод трех сумм, метод трех точек[1], с помощью регрессии[2], метод Брианта[3]. Рассмотрим применение метода регрессии для оценки параметров модифицированной экспоненты вида у = с – abc.

Пример 5.3

В таблице представлены данные о расходах предприятия на рекламу за 10 мес. года.

Таблица 5.3. Данные о расходах предприятия на рекламу за 10 мес. года (в тыс. руб.)

t

У

Z

lnz

t-1

С

1

121

516,3118

2

196

75

4,317488

1

516,8105

3

256

60

4,094345

2

516,3499

4

305

49

3,89182

3

516,2838

5

345

40

3,688879

4

516,4648

6

377

32

3,465736

5

516,1502

7

403

26

3,258097

6

515,9256

8

425

22

3,091042

7

516,6434

9

442

17

2,833213

8

516,3721

10

456

14

2,639057

9

516,3558

Найдем по нашему ряду цепные абсолютные приростыг и представим их через параметры нашей функции, T.e.z = c-ab' – с + ab'~l = ab' 1 (1 – b). Известно, что для модифицированной экспоненты логарифм абсолютных приростов линейно зависит от фактора времени t. Следовательно, можно записать, что lnz = Ιηα + (f – 1) lnb + ln(l – b). Обозначим Ιηα + ln(l – b) через d. Тогда lnz = d + (t- 1) lnb, т.е. линейное в логарифмах уравнение. Применяя МНК, получим оценки параметров d, lnb, а соответственно и параметра Ь. В рассматриваемом примере на основании граф табл. 5.3 lnz и (t – 1) было найдено уравнение регрессии: lnz = 4,519641 – 0,20882 (t – 1). Исходя из него получаем lnb = -0,20882; b = 0,811538. 4,519641 = In a + In (1 – b) = In [α (1 – b)]. Тогда α (1 – b) = e4,519641, откуда параметра =91,80264/(1-0,811538) = 487,1145.

Далее можно найти оценку параметра с как среднее значение из величин с = у + ab', найденных для каждого месяца (см. последнюю графу табл. 5.3). Предельная величина расходов на рекламу составит 516,4 тыс. руб. Искомое уравнение тренда примет вид

Рассмотренный метод применим, если абсолютные приросты – величины положительные. Если же некоторые приросты окажутся меньше нуля, то нужно проводить сглаживание уровней временного ряда методом скользящей средней.

Для логистической кривой Перла – Рида аналогично параметры а и b могут быть найдены МНК, если асимптота с задана. Тогда данная функция преобразовывается в линейную из логарифмов обозначим через Y и прологарифмируем, т.е. ). Далее параметры а и b определяются МНК, как и в примере по табл. 5.3.

Для логистической кривой вида параметры а и b могут быть оценены МНК, если асимптота с задана, так как в этом случае функция линеаризуема: ; обозначим через Y величину и прологарифмируем : Далее, применяя МНК, оцениваем параметры а и b.

При практических расчетах значение верхней асимптоты логистической кривой может быть определено исходя из существа развития явления, различного рода ограничений для его роста (нормативы потребления, законодательные акты), а также графически.

Если верхняя асимптота не задана, то для оценки параметров могут использоваться разные методы: Фишера, Юла, Родса, Нейра и др. Сравнительная оценка и обзор этих методов изложены в работе E. М. Четыркина[4].

Покажем на примере расчет параметров логистической кривой по методу Фишера.

Пример 5.4

Производство продукции характеризуется данными, представленными в табл. 5.4.

Таблица 5.4. Расчет параметров логистической кривой

t

1

12

32,583

3,484

12,2

2

28

0,788

13,393

2,595

26,2

3

58

0,661

5,948

1,783

54,3

4

105

0,572

2,838

1,043

104,2

5

182

0,453

1,214

0,194

176,8

6

260

0,282

0,55

-0,598

256,4

7

320

0,163

0,259

-1,349

321,0

8

360

0,086

0,119

-2,125

361,7

9

380

0,061

-2,805

383,5

Σ

1705

2,222

1696,3

Метод Фишера основан на определении производной для логистической кривой. Дифференцируя данную функцию по t, получим уравнение

Обозначим темп прироста логистической кривой через . Тогда , т.е. для z, имеем линейную функцию с параметрами а и . Чтобы найти решение, необходимо оценить z,. Предполагая, что интервалы между уровнями в ряду динамики равны, Фишер предложил приближенно оценивать в виде уравнения , где п - 1. Для нашего примера значения z, представлены в графе 3 табл. 5.4. Далее применяем МНК к уравнению : , т.е. строим регрессию z( оту(, беря данные от t = 2 до f = 8. Уравнение регрессии запишется в виде Исходя из него находим параметры а и с для логистической кривой. Параметр а = 0,806. Данное уравнение статистически значимо: F-критерий равен 689,6; R2 = 0,996. Соответственно для него значимы и параметры: f-критерий для параметра а равен 47,2 и для параметра – равен -26,2. Так как , то и т.е. верхняя асимптота производства продукции составляет 403 ед.

После того, как найдены параметры а и с, находим параметр b. Для этого функциюпредставим как Обозначим через Y выражение в левой части равенства, т.е..-Тогда имеем уравнение Прологарифмируем его:. В этом уравнении свободным членом является In Ь. Его можно определить из первого уравнения системы нормальных уравнений, а именно Для нашего примера имеем уравнение . Соответственно Таким образом, логистическая кривая запишется в виде

Теоретические значения данной функции представлены в графе 6 табл. 5.4 (найдены путем подстановки соответствующих значений t). Они достаточно близко подходят к исходным данным: коэффициент корреляции между ними равен 0,999; ввиду того, что в расчетах использовались логарифмы. Если предположить, что предельное значение объема производства продукции равно 400 ед., т.е. применить МНК к уравнению , то получим и b = =67,5; параметр а при компьютерной обработке определяется как -а = -0,8. Соответственно уравнение тренда запишется в виде . Результаты двух уравнений достаточно близки.

Параметры кривой Гомперца также могут быть оценены МНК, если асимптота с задана, так как в этом случае данная функция сводима к линейному виду Прологарифмировав ее, получим уравнение .

Вторично прологарифмировав, получим уравнение , Обозначив через у*, lgb через В и Ig(lga) через А, запишем кривую Гомперца в линейном виде , для оценки параметров которой применим МНК.

При практическом применении кривой Гомперца могут возникнуть некоторые сложности по динамическому ряду с повышающейся тенденцией. В этом случае задается верхняя асимптота с и логарифмы При повторном логарифмировании в расчетах используются лишь положительные значения Продемонстрируем возможность оценки параметров кривой Гомперца с верхней асимптотой на примере динамики по предприятию товарных запасов на начало каждого месяца (тыс. долл.).

Таблица 5.5. Расчет параметров кривой Гомперца

t

y

1

50

0,2

-0,69897

0,69897

-0,15554

44,75

2

80

0,32

-0,49485

0,49485

-0,30553

76,87

3

114

0,456

-0,34104

0,341035

-0,4672

111,38

4

144

0,576

-0,23958

0,239578

-0,62055

143,63

5

170

0,68

-0,16749

0,167491

-0,77601

170,98

6

190

0,76

-0,11919

0,119186

-0,92377

192,68

7

207

0,828

-0,08197

0,08197

-1,08635

209,12

8

219

0,876

-0,0575

0,057496

-1,24036

221,20

9

228

0,912

-0,04001

0,040005

-1,39788

229,88

10

234

0,936

-0,02872

0,028724

-1,54175

236,03

11

242

0,968

-0,01412

0,014125

-1,85002

240,33

12

244

0,976

-0,01055

0,01055

-1,97674

243,33

Исходя из экономических соображений о нецелесообразности чрезмерного увеличения запасов выдвинута гипотеза, что верхняя асимптота не превысит 250 тыс. долл., т.е. в примере с = 250.

Используя данные предпоследней графы табл. 5.5 и применяя МНК, получим уравнение , в котором параметры выражены в логарифмах

. Далее переходим к искомым параметрам;; b. Потенцируя, определим параметр . Аналогично определим и для оценки парамеграа потенцируем величину . Соответственно получим, что , и кривая Гомперца примет вид

Расчетные (теоретические) значения для этой кривой приведены в последней графе табл. 5.5. В рассматриваемом примере верхняя асимптота может быть определена методом регрессии аналогично, как и для модифицированной экспоненты. В этих целях необходимо преобразовать кривую Гомперца. Прологарифмируем уравнение

и получим модифицированную экспоненту , где Далее найдем абсолютные приросты и выразим их через параметры модифицированной экспоненты

Вновь прологарифмировав это выражение, придем к выражению Выразив в нем lnА + через d, получим выражение т.е. линейное в логарифмах уравнение, в котором параметры d и b могут быть оценены МНК. В нашем примере уравнение принимает вид

Отсюда

Параметр . Соответственно и параметр

Зная параметры аиЬ, найдем для каждой строки таблицы параметр С как . Далее оценим среднее значение С и на его основе определим верхнюю асимптоту Для нашего примера параметр , что практически совпало с выдвинутой ранее гипотезой. Кривая Гомперца в этом варианте расчетов примет вид Некоторую специфику имеет также оценка параметров гиперболы вида . Если асимптота а задана (например, исходя из графика временного ряда), то рассматриваемая функция достаточно легко преобразовывается в линейный вид, что позволяет по МНК оценить параметры b и с. Преобразование гиперболы в линейную функцию сводится к следующему. Обозначимчерез У; т.е. . Тогда имеем уравнение , Заменим на z, получим откуда . Далее традиционно найдем оценку параметров b и с. Если асимптота а не задана заранее, то рассматриваемая гипербола может быть сведена к линейной множественной регрессии, что позволяет оценить ее параметры по МНК.

Из уравнения следует, что или . В этом равенстве ty представляет собой при расчетах ряд значений , которые обозначим через У. Тогда имеем . Далее обозначим через А и получим линейную множественную регрессии: , в которой параметры А, а, с могут быть найдены по МНК. Далее можно оценить параметр b как . Если в первом варианте расчетов асимптота а была задана правильно, то оба метода дают одинаковые оценки параметров. Однако второй подход предпочтителен, ибо его результаты не зависят от субъективизма исследователя. Вместе с тем следует отметить, что усложнение формулы гиперболы не всегда приводит к лучшим результатам, чем описание тенденции с помощью равносторонней гиперболы параметры которой можно оценить по МНК.

  • [1] Четыркин E. М. Статистические методы прогнозирования. М.: Статистика. 1975. С. 114–122.
  • [2] Там же. С. 125–130.
  • [3] Льюис К. Д. Указ. соч. С. 107–109.
  • [4] Четыркин E. М. Указ. соч. С. 126–133.
 
< Пред   СОДЕРЖАНИЕ     След >