Парная линейная корреляция. Определение параметров линейной зависимости методом наименьших квадратов

Предположим, что по эмпирической линии регрессии или из других соображений установлено, что между двумя количественными признаками существует линейная корреляционная зависимость. Уравнение регрессии имеет вид

или

Сначала рассмотрим простейший случай, когда пары чисел в табл. (6) наблюдались по одному разу, т. е. = 1 для всех I - j и л# = 0 для всех / * у.

Подставив в (32) вместо X и ух соответственно х/ и у,, мы не получим в правой части равенства ноль, так как на результаты каждого наблюдения влияют случайные «возмущения». Имеем:

Числа v1lv2lv3,...,v#l называются отклонениями. Параметры а и b находят из условия, состоящего в том, чтобы сумма квадратов отклонений

была наименьшей из всех возможных. Поэтому данный метод и называется методом наименьших квадратов.

Сумма (33) является функцией параметров а и Ь. Составим эту функцию, заменив значения v, на yt -ах, - Ь- Имеем

Для нахождения минимума функции F{a, b), зависящей от двух неизвест-

. - dF dF

ных а и о. найдем частные производные — и — и приравняем их нулю:

да дЬ

Вынесем постоянный множитель за знак суммы, умножим обе части равенств на (-1) и. перегруппировав слагаемые, запишем

Найдя из системы (34) а и Ь, получаем искомое уравнение прямой линии регрессии:

где а - выборочный коэффициент регрессии.

Система (34) составлена для случая, когда пары чисел X/ и у/ наблюдались по одному разу. Если необходимо найти параметры а и Ь, когда связь ме- жду X и У описывается корреляционной таблицей, то система уравнений будет иметь вид

где

Значения лх/, % Пу/ - поясняются таблицей 7.

Для определения а и b из системы (36) умножим второе уравнение на х и вычтем результат почленно из первого уравнения откуда

Из второго уравнения найдем Ь-у - ах и подставим его в уравнение регрессии (35). В результате имеем уя = ах + Ь. Далее получаем ух = ах + у - ах или

Проводя аналогичные рассуждения для уравнения регрессии ху = сх + d, приходим к уравнению

Угловой коэффициент прямой (37) называется выборочным коэффициентом регрессии У на X, его обозначают символом :

В результате преобразований уравнения прямых регрессии принимают следующий вид:

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >