Модели регрессии с фиктивными переменными наклона

Если влияние количественной независимой переменной на результативную меняется для разных значений неколичественного показателя, то можно записать

(3.7а)

(3.7б)

В таком случае говорят, что имеют место структурные изменения в исследуемой зависимости количественных переменных. Для их учета в уравнении регрессии фиктивную переменную вводят как сомножитель при количественной переменной:

[1] (3.7в)

Действительно, если рассмотреть это уравнение для 2n = 1 и для zu = 0, получим соответственно:

Следовательно, коэффициент а12 из модели (3.76) будет равен (αη + <рш).

Графически модель (3.7в) можно представить в виде двух прямых с разным углом наклона, отражающих зависимость переменной / от количественной переменной X] при разных значениях фиктивной переменной (рис. 3.2). Так как речь идет о фиктивной переменной, включение которой позволяет изменить угол наклона прямой, такую переменную называют фиктивной переменной наклона.

Параметр otj интерпретируется как сила влияния количественной переменной при значении неколичественного показателя, соответствующего 2П = 0, а параметр φιη – как среднее изменение силы влияния количественной переменной при переходе от одной категории неколичественного показателя к другой (при переходе от zu = 0 к ζπ = 1).

Построим уравнение регрессии с фиктивной переменной наклона для нашего примера. После применения МНК к выражению (3.7в) получим выражение

Несмотря на большое различие коэффициентов регрессии по моделям, построенным по отдельным группам регионов (в предыдущем параграфе), мы получили, что коэффициент при фиктивной переменной z21 статистически незначим. То есть

Сила влияния количественного переменной хх на переменную у зависит от значения неколичественного показателя

Рис. 3.2. Сила влияния количественного переменной хх на переменную у зависит от значения неколичественного показателя

различия между коэффициентами регрессии для данных по центральным и прочим регионам несущественны. В противном случае мы могли бы интерпретировать значение -0,028 как более низкую "налоговую отдачу" с рубля отгруженной продукции по обрабатывающим производствам (на 0,028 руб. с 1 руб. отгрузки) в центральных регионах, чем в других регионах РФ.

Модели, полученные для разных значений фиктивной переменной z21, будут иметь следующий вид:

для центральных регионов

(3.8)

для прочих регионов

(3.9)

Выражения (3.8) и (3.9) не соответствуют моделям, полученным по каждой группе регионов по отдельности, что приводит к выводу о необходимости дальнейшего совершенствования модели регрессии с фиктивными переменными. Это можно сделать с помощью общей модели.

Общий вид модели регрессии с фиктивными переменными

Модели, рассмотренные выше, можно считать частными случаями общей модели. Очевидно, что это будет модель, в которой для разных категорий неколичественного показателя будут разные параметры уравнения регрессии. Например, для простейшего случая с одной количественной Xj и одной фиктивной переменной zn необходимо объединить в одну модель два уравнения регрессии:

(3.10)

Используем для этого модели (3.1) и (3.7в):

(3.10а)

Действительно,

Параметры уравнения (3.10) можно выразить через параметры уравнения (3.10а) следующим образом:

Графически модель (3.10а) может быть представлена в виде двух прямых, отражающих зависимость переменной у от количественной переменной при разных значениях фиктивной переменной. Параметры этих прямых различны, поэтому они имеют разный угол наклона (разный коэффициент при количественной переменной) и пересекают ось ординат в разных точках (разный свободный член, рис. 3.3).

Влияние неколичественного показателя полностью изменяет параметры регрессии

Рис. 3.3. Влияние неколичественного показателя полностью изменяет параметры регрессии

Продолжим рассмотрение нашего примера. Найдем параметры модели (3.10а), используя МНК. Получим следующее уравнение регрессии:

Все параметры статистически значимы (табличное значение t-критерия равно 2,01 при df = 48-3-1 = 44 степенях свободы и уровне значимости а = 0,05), следовательно, общая форма модели с фиктивными переменными хорошо описывает исследуемые нами связи. Этот вывод подтверждает достаточно высокое значение коэффициента детерминации (R2 = 0,59), а также то, что уравнение регрессии статистически значимо (F = 7,79 при FTa6jl = 2,82).

Каковы причины статистической незначимости параметров при фиктивных переменных в моделях с фиктивными переменными сдвига и фиктивными переменными наклона, в то время как в общей модели все параметры стали значимыми? Ответ, очевидно, следует искать, сопоставляя значения параметров, полученных в общей модели.

Мы получили, что центральные регионы в среднем обеспечивают более высокое поступление налогов, чем прочие регионы (на статистически значимую величину, равную 8971,9 млн руб.). В то же время налоговая отдача от объема отгруженной продукции обрабатывающих производств в центральных регионах, наоборот, меньше (на статистически значимую величину, равную -0,112 млн руб. с каждого миллиона рублей отгруженной продукции). То есть имеет место разнонаправленное воздействие неколичественного показателя "географическое положение" на объем сбора налогов. Оно опосредовано объемом отгрузки (связь обратная) и прочими факторами, которые в совокупности дают прямую связь. В моделях с фиктивными переменными сдвига и фиктивными переменными наклона мы фактически накладываем ограничения на параметры общей модели в виде их равенства нулю:

  • – в модели с фиктивными переменными сдвига: φ221 = 0;
  • – в модели с фиктивными переменными наклона: γ21 = 0.

Из-за неучета значимой переменной разнонаправленное влияние неколичественного показателя отражается в одном коэффициенте регрессии (при фиктивной переменной), что приводит к его незначимости. Отметим, что если бы влияние географического положения на сбор налогов, опосредованное количественными переменными, имело бы одинаковую направленность, то все три модели с фиктивными переменными имели бы значимые параметры.

Проинтерпретируем параметры полученной общей модели с фиктивными переменными.

Коэффициент 0,186 при переменной х2 означает, что в регионах, не являющихся центральными (z21 = 0), сбор налогов составляет в среднем 0,186 млн руб. с 1 млн руб. отгруженной продукции обрабатывающих производств (или 18,6 коп. с 1 руб. отгруженной продукции). В центральных регионах (ζπ = 1) отдача с рубля отгруженной продукции обрабатывающих производств меньше на 0,112 руб. (11,2 коп.), т.е. составляет 0,186 – 0,112 = 0,074 руб. Действие других факторов приводит к тому, что в целом по центральным регионам средний сбор налогов выше, чем в прочих, на величину 8971,9 млн руб.

Рассмотрим, как соотносятся параметры общей модели, полученной по данным примера, с параметрами уравнений регрессии, полученных с помощью МНК, по каждой совокупности регионов в отдельности (уравнения (3.5) и (3.6)). Оформим результаты сравнения в табл. 3.2.

Таблица 3.2. Модель с фиктивными переменными и модели, построенные по отдельным частям совокупности

Регионы

Общая модель с фиктивными переменными

Модели, построенные по каждой совокупности отдельно

Центральные регионы (¾ = 1)

Прочие регионы (z21 = 0)

Отметим, что параметры моделей для каждой группы регионов, полученные различным способом, совпадают. Небольшое расхождение для центральных регионов объясняется ошибками округления.

Модели (3.1), (3.7в), (3.10а) были построены для простейшего случая с двумя объясняющими переменными: одной

фиктивной и одной количественной. Запишем каждую из этих моделей в общей форме.

1. Модель с фиктивными переменными сдвига

(3.11)

где а0 – свободный член; – коэффициенты при количественных переменных – коэффициенты при фиктивных переменных введенных для первого неколичественного показателя; – коэффициенты при фиктивных переменных введенных для второго неколичественного показателя; – коэффициенты при фиктивных переменных введенных для j-го неколичественного показателя.

2. Модель с фиктивными переменными наклона

(3.12)

Для удобства чтения уравнение (3.12) записано в несколько строк. В первой приведено обычное уравнение множественной регрессии С количественными независимыми переменными ^...Хр. В другие строки, начиная со второй, включены (с параметрами φ) попарные произведения количественных и фиктивных переменных.

3. Общая форма модели с фиктивными переменными объединяет модели (3.11) и (3.12):

Частным случаем модели с фиктивными переменными является модель, не содержащая количественных независимых переменных. Рассмотрим этот вид моделей на примере модели с одной фиктивной переменной (ζπ). Очевидно, что здесь не может быть фиктивной переменной наклона, так как отсутствует количественная независимая переменная. Поэтому модель может быть единственного вида – с фиктивной переменной сдвига

Так как фиктивная переменная принимает всего два значения, может быть рассчитано всего два выровненных значения зависимой переменной: при ζπ = 0 и при zn = 1. Это будут, соответственно, величины а0 и (а0 + уп). Их можно рассматривать как средние значения переменной/ по группам, образованным двумя значениями фиктивной переменной. Модели с фиктивными переменными, не содержащие количественных независимых переменных, называются ANOVA-моделями (моделями дисперсионного анализа). Модели с фиктивными переменными, содержащие независимые количественные переменные, называются ANCOVA-моделями (моделями ковариационного анализа).

Существенным недостатком моделей с фиктивными переменными является значительное число параметров, требующее соответствующего увеличения числа наблюдений. Например, если неколичественный показатель имеет три возможных значения, то для линейной модели с фиктивными переменными сдвига требуется два дополнительных слагаемых. Если же рассматриваются модели с несколькими количественными факторами и фиктивными переменными наклона, то число параметров еще больше возрастает. Как правило, объем наблюдений, находящихся в распоряжении исследователя, весьма незначителен и не может обеспечить статистическую значимость столь "длинной" модели.

Решением может быть объединение нескольких значений неколичественного показателя в одно, если эти значения не различаются по силе влияния на результат. Например, местоположение квартиры определяется ее адресом: городом, улицей, номером дома и номером квартиры. Это индивидуальная характеристика рассматриваемого объекта. Она отражена в неколичественном показателе "местоположение", имеющем столько значений, сколько адресов. Такие индивидуальные характеристики можно укрупнить, объединив квартиры по принадлежности к номеру дома, еще крупнее – к номеру квартала, к району города или, наконец, разделить все квартиры на те, которые расположены в центре города, и находящиеся вне него.

Модели с фиктивными переменными могут применяться для анализа временных рядов, в частности для изучения периодических колебаний. Если рассматриваются сезонные колебания продаж (например, меховой одежды), можно построить модель зависимости объема продаж от квартала, месяца и т.п. Чем шире будет интервал времени, рассматриваемый в качестве фактора, тем короче модель, что повышает ее статистическую надежность. Однако укрупнение временных интервалов ведет к значительному усреднению характеристик влияния неколичественного показателя, что понижает аналитическую ценность модели.

  • [1] Так как параметр <р объединяет две переменные –и zu, то он имеет тройной индекс – φιη.
 
< Пред   СОДЕРЖАНИЕ     След >