МНК в матричной записи

Уравнение парной регрессии можно представить в матричной записи:

Из нашего примера по регрессии обхвата груди и живой массе у свиноматок можно записать:

или

для каждого из 15 наблюдений. При нахождении коэффициентов регрессии в уравнениях в матричной записи применяются операции транспонирования, произведения и обращения матриц.

Транспонированной называется матрица (Ат), в которй столбцы исходной матрицы (Л) заменяются строками с соответствующими номерами, А = (ау), то Лт = (а;1). Из определения транспонированной матрицы следует, что если исходная матрица А имеет размер тх п, то транспонированная матрица Ат имеет размер п х т.

Произведение матриц определено, если число столбцов первой матрицы равно числу строк второй.

Пусть А = (dy) т х п, В = (by) п х р, тогда размерность произведения Л х В равна тхр. При этом матрица С (размера тхр) называется произведением матриц Л и В, если каждый ее элемент Сц равен сумме произведений элементов i-й строки матрицы А на соответствующие элементы j-го столбца матрицы В:

Обращение матриц. Матрица А~г называется обратной по отношению к квадратной матрице А, если при умножении этой матрицы на данную как слева, так и справа получается единичная матрица: Л х А-1 = А-1 х А = Е. Из определения следует, что обратная матрица является квадратной того же порядка, что и исходная матрица. Необходимым и достаточным условием существования обратной матрицы является невырожденность исходной матрицы. Матрица называется невырожденной или неособенной, если ее определитель (А Ф 0).

Обратные матрицы используются для решения систем уравнений с несколькими неизвестными.

Доказано[1], что

т. е. получаем нормальные уравнения, которые можно записать так: Х*ХЪ = ХТУ.

Умножая обе части этого уравнения на (ХТ.Х)-1 получим (X[1].XJ^XVCb = = QPX)~[1]Х*У, отсюда Ъ = {Х*Х)-[1]Х*У, поскольку QFX)-[1]QFX) = Е, где Е — единичная матрица. В нашем примере:

Таким образом, выражая одномерную линейную модель, подлежащую оцениванию на основе данных нашего примера по регрессии обхвата груди и живой массы у свиноматок в форме матричной записи:

гм

МНК оценки (Р0, (ЗД, МНК оценки вектора (3 = можно выразить формулой vPiy

Умножая обратную матрицу (АТХ)-[1] на ХТУ получим вектор столбец коэффициентов регрессии:

При этом уравнение регрессии имеет вид

Таким образом, если вычисления провести с максимальным количеством знаков после запятой, то коэффициенты регрессии, вычисленные разными способами, полностью совпадают.

Коэффициент корреляции г^ служит основой для вычисления коэффициента детерминации г?у.

Коэффициент детерминации выступает как мера качества подбора линии регрессии и показывает, какая доля вариации одного признака зависит от варьирования другого признака.

В нашем примере коэффициент корреляции г^ между обхватом груди и живой массой у свиноматок равен 0,905. Следовательно, г2, = 0,82. Это означает, что 82 % общей дисперсии обхвата груди свиноматок (относительно средней) связано с изменением их живой массы.

  • [1] Дрейпер Н., Смит Г. Прикладной регрессионный анализ. М. : Статистика, 1973.
  • [2] Дрейпер Н., Смит Г. Прикладной регрессионный анализ. М. : Статистика, 1973.
  • [3] Дрейпер Н., Смит Г. Прикладной регрессионный анализ. М. : Статистика, 1973.
  • [4] Дрейпер Н., Смит Г. Прикладной регрессионный анализ. М. : Статистика, 1973.
  • [5] Дрейпер Н., Смит Г. Прикладной регрессионный анализ. М. : Статистика, 1973.
  • [6] Дрейпер Н., Смит Г. Прикладной регрессионный анализ. М. : Статистика, 1973.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >