Изучение тесноты связи по множественной регрессии

В множественной линейной регрессии показателями тесноты связи являются коэффициенты множественной корреляции и детерминации. Коэффициент множественной детерминации равен

или, с учетом правила сложения дисперсий,

где – остаточная сумма квадратов, – факторная сумма квадратов, – общая сумма квадратов,

Коэффициент множественной корреляции равен корню из коэффициента множественной детерминации:

Оба показателя – коэффициенты множественной детерминации и корреляции изменяются в границах от нуля до единицы. Коэффициент множественной детерминации показывает долю дисперсии результативной переменной в ее общей дисперсии, объясненную вариацией независимых переменных, входящих в модель регрессии. При формулировке выводов, как правило, полученное значение R2 умножают на 100%. Например, для модели

полученной по данным примера 2.1, , следовательно, вариация объясняющих переменных, входящих в уравнение регрессии, на 73% обусловила вариацию результативной переменной. Коэффициент множественной корреляции интерпретируют по степени его близости к единице: тесная связь, умеренная, слабая. Для примера 2.1 он составил

что говорит о тесной связи между зависимой и независимыми переменными.

Показатели тесноты связи можно рассматривать как характеристики качества аппроксимации конкретной моделью (уравнением регрессии) исследуемой зависимости. При прочих равных условиях, чем выше или R, тем выше качество аппроксимации. При интерпретации этих показателей следует учитывать, что на их величину оказывают влияние как наличие связи между показателями, так и функция, выбранная для описания связи (функция регрессии), а также соотношение количества наблюдений и количества параметров уравнения регрессии.

Очевидно, что если показатели связаны нелинейно, то чем больше кривизна функции регрессии, тем меньше будет показатель детерминации (и корреляции), рассчитанный для линейной регрессии по тем же данным. Но усложнение функции, увеличение ее параметров при неизменном объеме наблюдений автоматически приводит к увеличению показателей тесноты связи. Это объясняется сокращением степеней свободы у остаточной суммы квадратов. Для учета этой особенности рассчитывают скорректированный коэффициент детерминации

(2.26)

Разделив числитель и знаменатель формулы (2.26) на общую сумму квадратов и проведя преобразования, можно получить выражение, связывающее скорректированный коэффициент детерминации с исходным :

Для примера 2.1 скорректированный коэффициент детерминации равен

Скорректированный коэффициент детерминации применяется для оценки реальной тесноты связи между результатом и факторами и сравнения моделей с разным числом параметров. В первом случае обращают внимание на близость скорректированного и нескорректированного коэффициентов детерминации. Если эти показатели близки к единице и различаются незначительно, модель считается хорошей. Этот вывод можно отнести, в частности, к нашему примеру.

При сравнении разных моделей предпочтение, при прочих равных условиях, отдается той, у которой больше скорректированный коэффициент детерминации.

Следует отметить, что область применения скорректированного коэффициента детерминации ограничивается только этими задачами. Его нельзя использовать в формулах, где применяется обычный коэффициент детерминации. Скорректированный коэффициент детерминации нельзя интерпретировать как долю вариации зависимой переменной, объясненную вариацией независимых переменных, включенных в модель регрессии.

 
< Пред   СОДЕРЖАНИЕ     След >