Меню
Главная
Авторизация/Регистрация
 
Главная arrow Математика, химия, физика arrow ПРИКЛАДНАЯ МАТЕМАТИКА: ТЕХНОЛОГИИ ПРИМЕНЕНИЯ
Посмотреть оригинал

Коэффициент детерминации. Корреляционное отношение. Индекс корреляции

Для измерения степени тесноты количественных переменных помимо коэффициентов корреляции используются коэффициент детерминации, корреляционное отношение и индекс корреляции. Эти меры определены для любой формы связи: при линейной или нелинейной зависимости и для признаков, не имеющих совместного нормального распределения. Формально они определяются с помощью общей (полной) дисперсии aj, признака/: + о;?,

где о} — дисперсия функции регрессии Дх) относительно математического ожидания у; of — дисперсия ошибки наблюдения, которая характеризует разницу между эмпирическими значениями у,- и расчетными значениями Дх,).

Тогда коэффициент детерминации равен

Его величина показывает, какая доля общей дисперсии признака у определяется (детерминируется) дисперсией функции

регрессии. Оставшаяся доля общей дисперсии, т.е. ,

объясняется действием неконтролируемых факторов («помехи») и определяет верхнюю границу точности предсказания у по х.

При нелинейной форме связи показательназывается корреляционным отношением.

Индекс корреляции 1ух характеризует тесноту парной связи. Он является величиной неотрицательной. Свойства индекса корреляции во многом похожи на свойства коэффициента корреляции, при этом 0<|р|у|х <1. Если 1ух =|р|, то имеет место точная линейная корреляционная зависимость. В случае 1ух = 1, т.е. при су. = 0, отсутствует влияние прочих факторов и все распределение сконцентрировано на кривой регрессии, между у и х присутствует функциональная зависимость. При 1ух=0 связь полностью отсутствует (су = 0).

Если для линейных регрессий знак коэффициента корреляции связан с наклоном прямой, то знак индекса корреляции, используемого также и для нелинейных регрессий, не интерпретируется.

Более высокое значение индекса корреляции по сравнению с величиной коэффициента корреляции свидетельствует о том, что подгонка кривой имеет преимущества по сравнению с прямой линией, т.е. регрессия нелинейная.

Оценка индекса корреляции. Если уравнение регрессии у = Дх) предварительно оценено по выборке, то оценкой квадрата индекса корреляции служит величина

где Sj — оценка дисперсии о^; S^CT — остаточная дисперсия значений у, относительно модели регрессии Дх); Sj — оценка общей дисперсии отклика у.

Для сгруппированных данных, например при использовании корреляционной таблицы, оценкой дисперсии aj является выборочная дисперсия

где К — число интервалов группировки по х; nxj — частота попадания в j-й интервал по х; у, — среднее значение у в j-м интервале.

Тогда индекс корреляции вычисляется по формуле

где S|CT — остаточная дисперсия относительно у(х).

Для характеристики силы связи по значениям г или 1ух используется шкала Чеддока [16] (табл. 9.1).

Таблица 9.1

Шкала Чеддока

Значения | г | или 1у|Х

ОД—0,3

0,3—0,5

0

СП

1

о

  • 0
  • 1

о

NO

0,9—0,99

Сила связи

Слабая

Умеренная

Заметная

Высокая

Весьма

высокая

При значениях / . ниже 0,7 величина коэффициента детерминации Ц.|v всегда будет меньше 50%, т.е. менее половины общей

дисперсии признака у определяется дисперсией функции регрессии. Такие модели связи не имеют практического значения. При значениях I ^ выше 0,9 сила связи является весьма высокой

и ее модель можно использовать на практике.

 
Посмотреть оригинал
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 

Популярные страницы