Многофакторные и нелинейные уравнения регрессии

Рассмотренная выше однофакторная линейная модель - простейшая. На практике же чаше на исследуемый показатель оказывают влияние несколько независимых друг от друга факторов. При этом их влияние может носить как линейный, так и нелинейный характер.

Часто для удовлетворения потребностей практики используются многофакторные линейные модели, обладающие простотой получения и ясностью экономической интерпретации.

Линейная многофакторная модель имеет вид

Для расчета статистических коэффициентов уравнения регрессии ао, а, а2,... используется метод наименьших квадратов.

Для линейной двухфакторной модели

необходимо найти минимум функции

Взяв частные производные функции 5 по а$, а и а2, получаем систему трех уравнений с тремя неизвестными, решение которой позволит найти необходимые статистические коэффициенты

Коэффициенты ао, а и а2 могут быть найдены по аналогии с рассмотренным ранее примером либо способом определителей. При использовании способа определителей вначале находят общий определитель

В результате находятся значения статистических коэффициентов

Если на показатель ^ наибольшее влияние оказывает один фактор ж, но связь между ними носит нелинейный характер, то используется однофакторная нелинейная модель (типа параболы) вида

Для получения коэффициентов уравнения параболического уравнения, например второго порядка (у = а§ + ахх + + а$г), используется следующая система уравнений, также полученная с помощью метода наименьших квадратов:

В случаях когда на показатель у нелинейно влияет несколько факторов, следует использовать степенные

или показательные функции

Выбор вида модели регрессии

Выбор вида модели при анализе, наилучшим образом характеризующей существо экономического процесса, предполагает выполнение следующей последовательности рекомендаций:

  • 1) провести качественный отбор факторов исходя из предположения о возможном их влиянии на анализируемый показатель;
  • 2) собрать и систематизировать данные о значениях показателя и факторов по таблице-матрице факторов - п опытов";
  • 3) провести графический анализ связи между показателем и каждым фактором, позволяющий предварительно установить наличие связи и ее вид (возрастающая или убывающая, прямолинейная или криволинейная функция);
  • 4) построить регрессионную модель. При этом если графический анализ не позволяет однозначно выбрать вид модели, то следует использовать одну и ту же статистику для получения различных уравнений (линейных и нелинейных, однофакторных и многофакторных) и сравнить их между собой по одному из известных критериев, например, по методу наименьших квадратов:

Пример 17.2. Для исходных данных табл. 17.1 найдите уравнение параболической модели регрессии и сравните ее с линейной.

Для нахождения уравнения параболы составляется система уравнений

Далее находятся определители

и статистические коэффициенты

В результате уравнение параболы второй степени имеет вид

Сопоставим (табл. 17.2) расчетные значения показателя г/ф, полученные с помощью параболического и линейного уравнения регрессии (//;|) = 3 + 1,3лг().

Из табл. 17.2 видно, что уравнение параболы имеет меньший суммарный разброс точек 5 относительно линии регрессии, чем уравнение прямой (0,05 < 5,3)-

Таблица 17.2

Критерии приемлемости уравнения регрессии

Один из критериев эффективности уравнения регрессии - относительная погрешность е,т1. В рассмотренном выше примере относительная погрешность еотн при использовании линейного уравнения по сравнению с уравнением параболы составляет

Относительная погрешность еотн дает возможность соотнести точности используемых регрессионных зависимостей относительно друг друга, но не отвечает на вопрос: насколько эти уравнения регрессии близки к истинным значениям?

Ответ па этот вопрос может быть дан другим критерием приемлемости уравнения регрессии - средней относительной ошибкой 8ор, определяемой как отношение суммы абсолютных значений отклонений фактических значений от расчетных к сумме всех фактических значений показателя

На практике принято считать, что если величина Еср < 15%, то модель адекватна реальному процессу. В рассмотренном примере єСр для линейной регрессии составляет (3,8/25)-100% = 15,2%, а для параболической регрессии - (0,4/25) -100% = 1,6%.

Таким образом, первая модель (линейная регрессия) по рассмотренному критерию признается не приемлемой по точности, в то время как параболическая регрессия отвечает предъявляемым требованиям.

Для оценки соответствия уравнения регрессии реальной статистике часто используется критерий Фишера Г, вычисляемый по формуле

где а^г - дисперсия регрессии, характеризующая отклонения расчетных значений показателя от его среднего значения

где п - количество пар наблюдений уг и х£ т - число вычисляемых статистических параметров (а0, а> "2" ooo): ^ост ~~ ос~ таточная дисперсия, характеризующая отклонения фактических значений показателя у от расчетных, полученных с помощью уравнения регрессии

Величина ар0Г характеризует интенсивность изменения показателя при варьировании фактора, а значение а^. -плотность расположения точек относительно уравнения регрессии.

Расчетное значение ^-критерия (^расч) сравнивается с табличным (^табл)- При ^расч > ^табл гипотеза об адекватности проверяемого уравнения регрессии принимается, в противном случае - отвергается. При этом учитывается степень гарантии, с которой можно принять гипотезу о возможности использования проверяемого уравнения регрессии.

Пример 17.3. Для рассмотренного выше примера проверьте гипотезу об адекватности линейного уравнения = 3 + 1,3л",-реальной статистике по критерию Фишера с уровнем гарантии 90%.

Рассчитаем среднее значение показателя

По таблице значений критерия Фишера для степеней свободы т - 1 = 1 ип - т = 2 и доверительной вероятности (уровня гарантии 90%) находим табличное значение критерия = = 8,53. Поскольку Fp.ICЧ > /^бл* гипотеза об адекватности линейной модели не отклоняется.

Экономический смысл коэффициентов в уравнениях регрессии

Экономический смысл коэффициентов уравнения регрессии рассмотрим на примере линейной однофакторной модели вида у = а§ + <цх.

Коэффициент #0 характеризует:

  • o существование помимо х других факторов, оказывающих влияние на результирующий показатель г/;
  • o наличие большого количества случайных факторов, оказывающих влияние результирующий показатель у;
  • o недостаточность исходных статистических данных для определения формы зависимости между х и у.

Коэффициент а характеризует степень изменения результирующего показателя у при варьировании исследуемого воздействующего факторах.

 
< Пред   СОДЕРЖАНИЕ     След >