МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ

В главе рассматривается модель множественной линейной регрессии, проблемы спецификации модели, случай мультиколлинеарности. Подробно рассмотрен вопрос использования фиктивных переменных.

Спецификация модели множественной линейной регрессии

Экономические зависимости, как правило, содержат большое число одновременно и совокупно действующих факторов. В связи с этим часто возникает задача исследования зависимости одной переменной от нескольких объясняющих переменных (факторов). Эта проблема решается при помощи множественного регрессионного анализа. Примерами подобных зависимостей являются следующие:

  • • показатель у - расходы фирмы за месяц, фактор jc, - объем выпущенной продукции за месяц, х2 - стоимость электроэнергии в этом месяце;
  • • показатель у - спрос на товар, факторы: цена единицы товара, х29х3 - цепы товаров-заменителей.

Итак, при построении множественной регрессии, в отличие от случая парной регрессии, предполагают, что имеется несколько объясняющих факторов. Пусть у - изучаемый эконометрический показатель; х19х2,...9хк - объясняющие факторы.

Эконометрическая модель множественной регрессии, имеет следующий вид:

где f(xl9x29...9xk) - неизвестная функциональная зависимость (теоретическая регрессия); € - случайное слагаемое (возмущение), представляющее собой совокупное действие не включенных в модель факторов, ошибки измерения.

Основная задача регрессионного анализа - построение выборочной (эмпирической) множественной регрессии f(xl9x29...9xt)9 являющейся оценкой теоретической регрессии (функции /(*,,...,*>)):

здесь - эмпирическая (выборочная) регрессия, описывающая

усредненную зависимость между изучаемым показателем и факторами. После построения выборочной множественной регрессии, так же как и в случае парной регрессии, обычно производится верификация модели - проверка статистической значимости и адекватности построенной регрессии имеющимся эмпирическим данным.

Экспериментальная основа построения выборочной множественной регрессии - многомерная выборка (xll,xl29...9xlk9yl(x„rxn2y...yxntyyn)y где п - объем выборки (объем массива экспериментальных данных), к - число факторов, х0 - /'-с наблюдение объясняющей переменной х.

(i = ,n, у = 1,А:).

Одна из важных задач спецификации модели множественной регрессии заключается в выборе функциональной зависимости.

Основные методы выбора вида функциональной зависимости / в основном те же, что и в случае парной регрессии, однако в случае множественной регрессии эта задача оказывается более сложной.

Так, геометрический метод, основанный на построении поля корреляции, менее нагляден, чем в случае парной регрессии, а в ряде случаев просто неприменим, что связано с трудностями графического изображения многомерных данных.

Эмпирический метод основан на методе наименьших квадратов. Согласно этому методу значения параметров (будем обозначать их через а, bn b2,...,bk) функции которая является оценкой по выборке

функции теоретической регрессии выбираются таким образом, чтобы сумма квадратов отклонений наблюдаемых значений yf от значений f(xn,...yxjk) была минимальной:

минимум ищется по параметрам я, b]y Ь...уЬк, которые входят в зависимость f(xiy...yxt).

Найденные значения параметров, которые минимизируют указанную сумму квадратов разностей отклонений, называются оценками неизвестных параметров регрессии по методу наименьших квадратов (оценками

МИК). Выборочная регрессия у = /(*,,. ..,**) (или yt = /(хл,...,хЛ), / = 1,л), в которую подставлены найденные значения, уже не содержит неизвестных параметров и является оценкой теоретической регрессии. Именно эту зависимость /(х,,...,х*) рассматривают как эмпирическую усредненную зависимость изучаемого показателя от объясняющих факторов.

После нахождения эмпирического уравнения регрессии вычисляются значения у — f (xj]y.. .,xik), i = ,п и остатки е{ = у, - у,, i = ,n. По всличи-

п

нс остаточной суммы квадратов V(^-^)2 можно судить о качестве со-

»=i

ответствия эмпирической функции /(*,,...,**) имеющимся в наличии выборочным наблюдениям. Перебирая разные функциональные зависимости и каждый раз действуя подобным образом, можно подобрать наиболее подходящую функцию для описания имеющихся данных.

Используя аналитический метод для анализа зависимости расходов фирмы у от объемов выпущенной продукции х,,...,хА, можно получить следующую модель:

где а - условно-постоянные расходы, Дх, + Р2хг +...+fikxk - условнопеременные расходы.

В практике эконометрического анализа часто используют линейную множественную регрессию. В модели множественной линейной регрессии зависимость (2.1.1) между переменными имеет вид

т. с. в качестве теоретической регрессии рассматривается зависимость

На основе выборочных наблюдений оценка теоретической регрессии - выборочная (эмпирическая) регрессия у строится в виде:

где a,bl,b2,...ibk являются оценками параметров с?,ДД теоретической регрессии.

Выбор объясняющих переменных х,,...,хА является основным моментом спецификации модели множественной линейной регрессии (иногда выбор объясняющих переменных и называют спецификацией модели). Иногда, исходя из экономической теории, предыдущих исследований, заранее известен вид зависимости, определен список объясняющих переменных. В этом случае задача состоит лишь в оценивании неизвестных параметров зависимости.

Но на практике чаще встречается случай, когда имеется достаточное число наблюдений (значений независимых переменных), но нет априорной модели, позволяющей однозначно определить состав объясняющих переменных. В этом случае используют различные эмпирические процедуры пошагового отбора факторов. Суть этих процедур в том, что сначала рассматривается только одна объясняющая переменная, имеющая с зависимой переменной у наиболее тесную корреляционную связь. На следующем шаге в регрессионную модель включается новая объясняющая переменная таким образом, чтобы улучшить «качество» модели (для проверки используется скорректированный коэффициент детерминации (2.4.5), коэффициенты частной корреляции (2.4.7), значение F -статистики (2.5.3) и т. д.). Следует иметь в виду то, что подобные пошаговые процедуры нс гарантируют получение наилучшего набора факторов.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >