Нелинейная регрессия

Соотношения между социально-экономическими явлениями и процессами далеко не всегда можно выразить линейными функциями, так как при этом могут возникать неоправданно большие ошибки. В таких случаях используют нелинейную (по объясняющей переменной) регрессию.

Выбор вида уравнения регрессии (8.3) (этот важный этап анализа называется спецификацией или этапом параметризации модели) производится на основании опыта предыдущих исследований, литературных источников, других соображений профессионально-теоретического характера, а также визуального наблюдения расположения точек корреляционного поля. Наиболее часто встречаются следующие виды уравнений нелинейной регрессии: полиномиальное ух — Ь0 + Ьхх + ... + bfpc, гиперболическое ух = Ь0 + Ьх/х,

степенное ух0 -xf1 ..-хЬр .

Например, если исследуемый экономический показатель у при росте объема производства х состоит из двух частей — постоянной (не зависящей от х) и переменной (уменьшающейся с ростом х), то зависимость у от х можно представить в виде гиперболы ух = b0 + bjx. Если же показатель у отражает экономический процесс, который под влиянием факторах происходит с постоянным ускорением или замедлением, то применяются полиномы. В ряде случаев для описания экономических процессов используются более сложные функции. Например, если процесс вначале ускоренно развивается, а затем, после достижения некоторого уровня, затухает и приближается к некоторому пределу, то могут оказаться полезными логистические функции типа у = b0/(1 + Ьф[^) .

Теория линейных моделей разработана наиболее полно. Поэтому оправдано преобразование полиномиального и гиперболического уравнений в линейные путем подстановок соответственно xJ = Uj (j = 1, 2,..., k) и 1jx = и.

При исследовании степенного уравнения регрессии следует иметь в виду, что оно нелинейно относительно параметров Ь}, однако путем логарифмирования может быть преобразовано в линейное:

Для определения неизвестных параметров b0, bv ..., bp, как и ранее, используется метод наименьших квадратов.

> Пример 13.3. По данным табл. 13.4 исследовать зависимость урожайности зерновых культур Y (ц/га) от количества осадков X (см), выпавших в вегетационный период[1].

Таблица 13.4

№ п/п

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

Количество

осадков Xj (см)

25

27

30

35

36

38

39

41

42

45

46

47

50

52

53

Урожайность и, (ц/га)

23

24

27

27

32

31

33

35

34

32

29

28

25

24

25

Рис. 13.3

Решение. Из качественных соображений можно предположить, что увеличение количества выпавших осадков приводит к увеличению урожайности до некоторого предела, после чего урожайность будет снижаться. Учитывая, кроме того, расположение точек корреляционного поля (рис. 13.3), можно предположить, что наиболее подходящим уравнением регрессии будет уравнение параболы

Его параметры 60, 6,, 62 находим, применяя метод наименьших квадратов:

TI ds ds ds

Приравняв частные производные ——, —— и —— к нулю, получим после

Э60 об, Э62

преобразований систему нормальных уравнений:

Для расчета необходимых сумм составим вспомогательную таблицу (табл. 13.5).

Решая эту систему, например, методом Гаусса, получим bQ=-43,93; b{ = 3,8342; Ь2 = -0,048361, т.е. уравнение регрессии имеет вид

Таблица 13.5

i

У,

*?

V,xi

y,xf

yf

*4

(yXi -vi)2

  • 1
  • 2
  • 14
  • 15
  • 25
  • 27
  • 52
  • 53
  • 23
  • 24
  • 24
  • 25
  • 625
  • 729
  • 2704
  • 2809
  • 15 625 19 683
  • 140 608 148 877
  • 390 625 531 441
  • 7 311 616 7 890 481
  • 575
  • 648
  • 1248
  • 1325
  • 14 375 17 496
  • 64 896 70 225
  • 529
  • 576
  • 576
  • 625
  • 21.7
  • 24.3
  • 24.7
  • 23.4
  • 1,69
  • 0,11
  • 0,46
  • 2,44

I

606

429

25 548

1 115 808

50 158 200

17 371

730 123

12 493

45,94

Теперь система (13.21) примет вид

Оценим значимость полученной зависимости. С этой целью по формуле (13.16) найдем суммы (см. итоговую строку табл. 13.5):

177,66 (15-3)

По формуле (13.18): F= ---- = 23,2. Табличное значение

^ 1 * v 7 45,94 (3-1)

^Ч).05;2;12= 3,88. Так как F> -Fo,05;2;i2’ т0 уравнение регрессии значимо.

Для оценки тесноты связи вычислим индекс корреляции по формуле (13.19):

т.е. полученная зависимость весьма тесная. Коэффициент детерминации Щх -0,795 показывает, что вариация урожайности зерновых культур

на 79,5% обусловлена регрессией, или изменчивостью количества выпавших в вегетационный период осадков. ?

В некоторых случаях нелинейность связей является следствием качественной неоднородности совокупности, к которой применяют регрессионный анализ. Например, объединение в одной совокупности предприятий различной специализации или предприятий, существенно различающихся по природным условиям, и т.д. В этих случаях нелинейность может являться следствием механического объединения разнородных единиц. Регрессионный анализ таких совокупностей не может быть эффективным. Поэтому любая нелинейность связей должна критически анализироваться.

По расположению точек корреляционного поля далеко не всегда можно принять окончательное решение о виде уравнения регрессии. Если теоретические соображения или опыт предыдущих исследований не могут подсказать точного решения, то необходимо сделать расчеты по двум или нескольким уравнениям. Предпочтение отдается уравнению, для которого меньше величина остаточной дисперсии. Однако при незначительных расхождениях в остаточных дисперсиях следует всегда останавливаться на более п р о с т о м уравнении, интерпретация показателей которого не представляется сложной.

Весьма заманчивым представляется увеличение порядка выравнивающей параболической кривой, ибо известно, что всякую функцию на любом интервале можно как угодно точно приблизить полиномом у = Ь0 + Ьрс + Ь2х2 +...+ bfpd*. Так, можно подобрать такой показатель к, что соответствующий полином пройдет через все вершины эмпирической линии регрессии. Однако повышение порядка гипотетической параболической кривой может привести к неоправданному усложнению вида искомой функции регрессии, когда случайные отклонения осредненных точек неправильно истолковываются как определенные закономерности в иоведении кривой регрессии. Кроме того, за счет увеличения числа параметров снижается точность кривой регрессии (особенно в случае малой по объему выборки) и увеличивается объем вычислительных работ. В связи с этим в практике регрессионного анализа для выравнивания крайне редко используются полиномы выше третьей степени.

  • [1] То есть в период роста, развития растений.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >