Модели регрессии с фиктивными переменными сдвига

Рассмотрим линейное уравнение регрессии. Для простоты возьмем в качестве объясняющих одну количественную переменную хг и один неколичественный показатель с двумя альтернативными значениями, что требует включения в уравнение одной фиктивной переменной zn:

(3.1)

Из уравнения (3.1) следует, что при zn = 1 значение зависимой переменной / равно

(3.2)

а при zn = О равно

(3.3)

Сравнивая два полученных уравнения (3.2) и (3.3), видим, что они различаются величиной свободного члена. То есть для одного уровня неколичественного показателя значение зависимой переменной всегда в среднем будет на γη единиц выше или ниже, чем для альтернативного.

Графически эта ситуация соответствует двум параллельным прямым (рис. 3.1). Отметим, что коэффициент 0Ц при количественной переменной X, остается неизменным. То есть изменение Xj оказывает одинаковое влияние на изменение переменной/ вне зависимости от значений неколичественного показателя.

Так как изменение значения фиктивной переменной в модели 3.1 приводит к изменению значения зависимой переменной на некую фиксированную среднюю величину, такую переменную еще называют фиктивной переменной сдвига. Изменение ее значения приводит к переходу от одной параллельной прямой к другой.

Рассмотрим данные примера 2.1. В качестве зависимой переменной по-прежнему выберем показатель "поступление налогов, сборов и иных обязательных платежей в консолидированный бюджет РФ (без поступлений ЕСН) в 2009 г. (млн руб.)"; в качестве количественной независимой переменной – "объем отгруженных товаров собственного производства, выполненных работ и оказанных услуг собственными силами по виду экономической деятельности “Обрабатывающие производства”" в Российской Федерации в 2009 г. (млн руб.)".

Сила влияния количественной переменной ху на переменную у не зависит от значения неколичественного показателя

Рис. 3.1. Сила влияния количественной переменной ху на переменную у не зависит от значения неколичественного показателя

Предположим, что на сбор налогов влияет также географическое положение регионов. Разделим все субъекты РФ, имеющиеся в нашей выборке, на две группы:

  • – регионы Центрального и Северо-Западного федеральных округов. Для краткости будем называть эти регионы "центральными";
  • – регионы прочих федеральных округов ("прочие" регионы).

Так как имеется всего две категории (значения) неколичественного показателя "географическое положение", то необходимо ввести только одну фиктивную переменную. За базисную категорию примем "прочие" регионы:

Исходные данные приведены в табл. 3.1.

Таблица 3.1. Поступление налогов и объем отгруженных товаров по субъектам РФ

Субъект РФ

Поступление налогов, млн руб.

Отгрузка в обрабатывающих производствах, млн руб.

Региональная принадлежность

y

x2

z21

Республика Ингушетия

1422,20

266

0

Еврейская автономная область

2529,70

2865

0

Республика Тыва

2629,10

431

0

Республика Алтай

2764,30

1228

0

Карачаево-Черкесская Республика

3347,50

10 921

0

Республика Калмыкия

3914,20

928

0

Республика Адыгея

4400,80

12 565

0

Республика Северная Осетия – Алания

5904,00

11 088

0

Магаданская область

6956,70

2486

0

Кабардино-Балкарская Республика

7595,10

17 609

0

Республика Хакасия

9257,80

39 640

0

Чукотский автономный округ

9317,10

531

0

Республика Марий Эл

9978,80

46 180

0

Псковская область

10 144,80

32 074

1

Чеченская Республика

10 215,40

579

0

Республика Карелия

11 349,50

39 962

1

Курганская область

12 046,90

38 308

0

Республика Мордовия

12 061,40

65 507

0

Костромская область

12 104,20

50 532

1

Камчатский край

13 042,40

11 245

0

Орловская область

13 104,30

38 089

1

Ивановская область

13 396,40

42 865

1

Республика Дагестан

14 170,30

21 031

0

Тамбовская область

14 227,00

47 738

1

Новгородская область

16 868,50

80 915

1

Республика Бурятия

18 019,40

29 660

0

Смоленская область

18 950,30

78 278

1

Курская область

19 995,50

67 241

1

Забайкальский край

20 445,60

7910

0

Липецкая область

21 220,80

228 812

1

Ульяновская область

21 360,00

76 523

0

Пензенская область

21 418,80

71 307

0

Кировская область

21 477,10

76 151

0

Чувашская Республика

21 816,30

85 926

0

Астраханская область

22 824,90

34 576

0

Брянская область

23 579,30

57 187

1

Амурская область

23 702,60

16 412

0

Калужская область

24 007,20

161 769

1

Тульская область

27 581,20

182 031

1

Вологодская область

28 057,50

236 267

1

Алтайский край

29 815,50

115 197

0

Тверская область

32 236,50

103 158

1

Белгородская область

32 657,40

233 608

1

Владимирская область

32 672,70

142 867

1

Мурманская область

34 351,10

49 081

1

Воронежская область

36 050,40

125 343

1

Рязанская область

36 544,30

95 522

1

Калининградская область

37 136,90

147 573

1

После применения МНК к уравнению (3.1) получим:

(3.4)

Табличное значение t-критерия Стьюдента составляет 2,014 при числе степеней свободы df = п-т- 1 =48-2-1 =45 и уровне значимости а = 0,05. Следовательно, коэффициент при фиктивной переменной z21 незначим. Как было показано выше, он равен величине, на которую значение зависимой переменной в среднем отличается для разных значений неколичественного показателя. То есть он показывает, насколько (в среднем) поступление налогов в центральных регионах больше, чем в прочих регионах. Для нашего примера эта величина составляет 3713,6 млн руб., однако мы не можем утверждать это с высокой степенью вероятности. Так как этот параметр незначим, возможно, региональные различия в поступлении налогов близки к нулю.

Если не принимать в расчет незначимость параметра при фиктивной переменной, уравнения регрессии для двух групп регионов, построенные на основе уравнения (3.4), будут иметь вид

Отметим, что если находить параметры этих уравнений регрессии отдельно, применяя к исходным данным МНК, получим не совсем тот же результат:

для центральных регионов:

(3.5)

для прочих регионов:

(3.6)

Свободные члены этих двух моделей различаются на величину 8971,9 что существенно больше, чем "прибавка" к свободному члену в модели с фиктивной переменной. Более того, все параметры в последних двух моделях статистически значимы. Можно заметить также, что в этих моделях существенно (более чем в два раза) отличаются коэффициенты при количественной переменной х2- То есть можно предположить, что влияние объема отгрузки в обрабатывающих производствах в центральных и прочих регионах на собираемость налогов различно. Это соображение приводит к необходимости построения моделей с фиктивными переменными наклона, рассмотренными в следующем параграфе.

 
< Пред   СОДЕРЖАНИЕ     След >