Тестирование линейной модели множественной регрессии

Подход к оценке качества спецификации уравнения множественной линейной регрессии остается таким же, как и в случае уравнения парной регрессии. В качестве меры влияния выбранных регрессоров используется коэффициент детерминации икак критерий принятия решения о качестве спецификации. Однако в этом случае имеют место некоторые особенности.

Замечено, что с ростом числа регрессоров в модели, значение коэффициента детерминации так же возрастает. Это обстоятельство приводит к недоразумениям при анализе качества спецификации модели. Вы добавили в модель еще один регрессор, увидели, что коэффициент детерминации увеличился, кажется, что добавление регрессора положительным образом сказалось на качестве спецификации, а, на самом деле, это эффект увеличения числа регрессоров.

Чтобы нивелировать эффект влияния числа регрессоров при анализе линейных моделей множественной регрессии рассматривается модифицированный коэффициент детерминации, который связан с классическим коэффициентом детерминации следующим соотношением:

(6.11)

где – модифицированный коэффициент детерминации;

– классический коэффициент детерминации; п – объем выборки;– количество регрессоров в модели.

Из соотношения (6.11) видно, что призначения модифицированного и классического коэффициентов детерминации совпадают. С ростом k модифицированный коэффициент детерминации становится меньше классического.

Замечание. Функция "ЛИНЕИН" вычисляет значение модифицированного коэффициента детерминации.

Вторая особенность связана с интерпретацией результата. Если значение , то вывод однозначный: все выбранные для моделирования регрессоры не влияют на формирование значения эндогенной переменной. А если это условие не выполняется, то ответ – не все выбранные регрессоры не влияют на формирование значения эндогенной переменной. Это, в свою очередь, означает, что среди регрессоров могут быть, как влияющие на эндогенную переменную, так и не влияющие. Например, в модели присутствуют 10 регрессоров, условие качества выполнено, но среди них четыре регрессора "вытягивают" коэффициент детерминации, остальные шесть на нем не сказываются.

Отсюда задача: как среди регрессоров выделить те, которые оказывают влияние па значение эндогенной переменной, от тех, которые такого влияния не оказывают?

Идея решения этой задачи проста.

Пусть имеем уравнение множественной регрессии в виде

(6.12)

Если, например, в этой модели регрессорне влияет на формирование значения переменной, то признаком этого может быть равенство нулю параметрапри регрессоре. Ели параметр, то при любых значениях регрессорапроизведениевсегда будет равно нулю, а, следовательно, этот регрессор не будет сказываться на значении эндогенной переменной.

Таким образом, для ответа на вопрос: влияет или нет регрессор на формирование значения эндогенной переменной? – достаточно проверить гипотезу о равенстве нулю параметра при нем.

Для тестирования гипотезысоздается случайная переменная в виде дроби Стьюдента:

(6.13)

где– значение, на равенствокоторому, тестируется параметр(в данном тесте);– МНК-оценка параметра

– ошибка опенки параметра.

Известно, что дробь (6.13) подчиняется закону распределения Стьюдента, следовательно, для нее можно, при заданной доверительной вероятности, найти критическое значениедля принятия выдвинутой гипотезы. Если

, то значение параметра с номером j принимается равным нулю.

Такую проверку называют оценкой значимости коэффициентов регрессии.

Приведенный способ применения критерия Стьюдента для оценки статистических гипотез, в частности, гипотезы , часто называют точечным методом проверки статистической гипотезы. На практике пользуется популярностью интервальный метод. Решив неравенство

(6.14)

относительно , получим:

(6.15)

Если доверительный интервал "накрывает" тестируемое значение параметра, то выдвинутая статистическая гипотеза принимается. В данном тесте проверяется гипотеза , следовательно, если ноль лежит внутри интервала (6.15), то гипотеза принимается.

Пример. Оценим модель зависимости объема продажот числа рекламных сообщений, индекса цен на продукцию, индекса цен на рекламуи протестировать качество спецификации.

Согласно заданию спецификация модели должна иметь вид:

(6.16)

Исходные данные для оценки модели (6.16) и результаты оценки приведены на рис. 6.1, который представляет собой фрагмент листа приложения EXCEL. Там же приведены результаты обработки этих данных с помощью функции "Л ИНЕЙ II" и результат анализа модели на качество спецификации.

Из рис. 6.1 видно, что модифицированный коэффициент детерминации R2 = 0.775, при этом значение а .

Отсюда следует, что спецификация модели (6.16) не является абсолютно плохой. Это означает, что в сумме все использованные экзогенные переменные оказывают влияние па формирование значения объема продаж ().

Для оценки степени влияния каждого из факторов (регрессоров) в отдельности проведен анализ значимости параметров, стоящих при регрессорах. Вычислены значения дроби Стьюдента для параметров, стоящих при регрессорах () и критическое значение дроби Стьюдента . Сравнив попарно эти значения, делаем вывод, что только регрессор(индекс цен на продукцию) оказывает значимое влияние на формирование объема продаж.

Фрагмент листа приложения EXCEL

Рис. 6.1. Фрагмент листа приложения EXCEL

Влияние остальных факторов оказалось статистически незначимым и как следствие их можно удалить из спецификации модели.

К аналогичному выводу можно прийти и с помощью анализа качества спецификации через доверительные интервалы. Из рис. 6.1 видно, что доверительные интервалы для параметровинакрывают ноль и, следовательно, значения этих параметров с доверительной вероятностью можно считать равными нулю.

Другими словами, объем продажзависит только от индекса цеп па продукцию. Для моделирования зависимости объема продаж достаточно ограничится спецификацией:

(6.17)

Для спецификации модели (6.17) формируется выборка результатов наблюдений. Она состоит из двух столбцов: у и , вновь производится идентификация модели и проверяется ее качество спецификации.

Оценка модели (6.17) по данным рис. 6.1 следующая:

При модель имеет качественную спецификацию. Дополнительное тестирование модели (6.17) с помощью теста Стьюдента не имеет смысла, так как в спецификации (6.17) участвует всего один регрессор.

 
< Пред   СОДЕРЖАНИЕ     След >