Множественная линейная регрессия с ограничениями на параметры

В эконометрических моделях на значения параметров уравнения множественной регрессии могут накладываться ограничения, связанные с величиной этих параметров, взаимосвязи их друг с другом. Примеры таких ограничений:

При наличии ограничений на параметры уравнения регрессии возникают два вопроса. Первый: если ограничения справедливы, то каким образом обеспечить их выполнение в формируемой модели? Второй: насколько значимо модель без ограничений на параметры отличается от модели с ограничениями?

В простейшем случае при наличии ограничений на параметры уравнение регрессии может быть преобразовано таким образом, чтобы учесть имеющиеся ограничения в самой структуре модели. Например, в линейной модели регрессии с тремя независимыми переменными

(2.32)

имеется ограничение вида

(2.33)

Тогда можно провести следующие преобразования:

(2.34)

Рассчитав новые переменные получим новое уравнение регрессии

(2.35)

После применения к уравнению (2.35) метода наименьших квадратов будут получены оценки неизвестных параметров а2 и а3, a по формуле (2.34) можно оценить параметр 04.

В общем случае необходимо сформулировать общую линейную гипотезу, содержащую ограничения на параметры. Если представить одно линейное ограничение на параметры в виде выражения

(2.36)

то при к линейных ограничениях выражение (2.36) можно записать в матричной форме:

(2.37)

где С – матрица размерностью ; Q – вектор размерностью

Очевидно, что если на параметр ос, не наложено ограничений, то коэффициент Су в выражении (2.36) и, в общем виде, коэффициенты Су в выражении (2.37) будут равны нулю.

Например, для выражения (2.32) с ограничением (2.33) матрицы С и Q будут иметь вид

Тогда

Если для выражения (2.32) добавить еще одно ограничение:, то матрицы С и Q будут иметь вид

Для решения задачи минимизации целевой функции квадратов случайных остатков (метод наименьших квадратов) с учетом линейных ограничений можно воспользоваться методом множителей Лагранжа.

Метод множителей Лагранжа заключается в нахождении минимума функции вида

где – вектор-столбец параметров регрессии с ограничениями; М – вектор множителей Лагранжа размерностью к х 1.

Функция Ф дифференцируется по и М, полученные выражения приравниваются нулю и находится их решение.

Применение модели с линейными ограничениями целесообразно в том случае, если сокращение остаточной дисперсии в модели без ограничений по сравнению с остаточной дисперсией в модели с ограничениями статистически незначимо.

Ограничение, связанное с равенством коэффициента о, регрессии нулю, можно проверить с помощью частного критерия Фишера (частного F-критерия).

Нулевой гипотезой в данном случае является незначимость величины сокращения остаточной дисперсии при включении в уравнение независимой переменной х; (т.е. переходе от модели с ограничениями к модели без ограничений). Фактическое значение частного F-критерия рассчитывается по формуле

(2.38)

где – остаточная сумма квадратов для модели без независимой переменной Xj•, – остаточная сумма квадратов для модели, включающей независимую переменную .у; т – количество параметров (без учета свободного члена) в модели с независимой

Переменной Xj.

Разделив каждую из дробей на общую сумму квадратов 55общ и произведя преобразования, получим выражение

или

(2.39)

где – коэффициент детерминации для уравнения зависимости переменной у от переменных , включая переменную

Xj•, – коэффициент детерминации для уравнения зависимости переменной у от всех переменных , кроме переменной Xj.

Полученное значение F-критерия сравнивают с табличным, найденным для d/j = 1 и df2 = (п – т – 1) степеней свободы. Если фактическое значение F-критерия больше табличного, нулевая гипотеза отклоняется, т.е. включение рассматриваемой переменной Xj существенно уменьшает остаточную дисперсию и является статистически значимым и ограничение оj = 0 не подтверждается.

Можно показать, что для линейной множественной регрессии верно соотношение

(2.40)

т.е. значимость параметра а; при переменной Xj означает также значимость сокращения остаточной дисперсии при включении данной переменной в модель регрессии.

Если ограничения на равенство нулю касается к коэффициентов регрессии, то для оценки этого предположения проводят проверку, аналогичную проверке по частному F-критерию.

Отличие состоит в том, что под величиной SSf} понимается остаточная сумма квадратов по уравнению регрессии без переменных, на коэффициенты при которых накладывается ограничение в виде их равенства нулю. Так как число добавляемых переменных составит к, то число степеней свободы для разности дисперсий в формуле (2.38) будет также равно к (а не единице):

(2.41)

где SS^ –остаточная сумма квадратов для модели без независимых переменных Xj... Xj+k_i; SS(2> – остаточная сумма квадратов для модели без ограничений (с независимыми переменными х; ,лй4); т –количество параметров (без учета свободного члена) в модели с независимыми переменными x f... .

Аналогично формула (2.39) примет вид

(2.42)

где RyX х χ –коэффициент детерминации для уравнения зависимости переменной у ОТ переменных X] ...Хр, включая X:, ..-tXj+k-i,

R%x х. <х х – коэффициент детерминации для уравнения зависимости переменной^ ОТ всех переменных Ху..Хр, кроме Xj, ...,Xj+k_v

В общем случае линейных ограничений вида (2.37) фактическое значение F-критерия рассчитывается по формулам (2.43) или (2.44):

(2.43)

где SS*1 ' –остаточная сумма квадратов для модели с ограничениями;

SS® – остаточная сумма квадратов для модели без ограничений; к – количество ограничений, наложенных на уравнение регрессии;

(2.44)

где R 2 – коэффициент детерминации для уравнения регрессии без ограничений; RI – коэффициент детерминации для уравнения регрессии с ограничениями.

Для случая к ограничений нулевая гипотеза о незначимости различий остаточных дисперсий в модели с ограничениями и модели без ограничений принимается, если фактическое значение F-критерия ((2.41)–(2.44)) меньше или равно табличному, взятому для уровня значимости а, числа степеней свободы d/j = к, df2 = п – т – 1, где т – количество параметров (без учета свободного члена) в модели без ограничений.

Рассмотрим наложение ограничений на модель регрессии из примера 2.1. Простейший случай ограничения предполагает равенство нулю одного из коэффициентов регрессии. Пусть, например, мы предполагаем, что число занятых не оказывает влияния на собираемость налогов. Тогда ограничение будет иметь вид

а уравнение регрессии с ограничениями запишется в виде

(2.45)

После оценки параметров уравнения (2.45) с помощью МНК получаем выражение

Частный F-критерий для переменной хх равен

Табличное значение критерия Фишера, найденное для d/j = = 1 и df2 = 44 степеней свободы, равно 4,06, следовательно, гипотеза о незначимости включения переменной хг в уравнение регрессии отклоняется. Иначе говоря, отклоняется гипотеза о наложении ограничения на коэффициент ctj в виде его равенства нулю.

Проверим выполнение равенства (2.40). Действительно,

Равенство получилось неточным из-за ошибок округления. При использовании ППП Excel имеем равенство

Как видим, ошибка округления присутствует и в данном случае, но она крайне незначительна и проявляется в восьмом знаке после запятой.

Рассмотрим другой вариант ограничений на модель из примера 2.1. Пусть наложены ограничения в виде равенства нулю двух коэффициентов:

т.е. мы считаем, что объемы отгрузки в обрабатывающих производствах х2 и производства энергии х3 не оказывают влияния на сбор налогов. Модель с ограничениями в данном случае представляет парную линейную регрессию вида

После применения МНК имеем выражение

Используя формулу F-критерия для модели с ограничениями (2.42), получим выражение

Табличное значение критерия Фишера, найденное для dfa = 2 и df2 = 44 степеней свободы, равно 3,21, следовательно, гипотеза о необходимости наложения ограничений на коэффициенты а2 и а3 в виде их равенства нулю отклоняется.

 
< Пред   СОДЕРЖАНИЕ     След >