Оценка существенности коэффициента корреляции, уравнения регрессии и его коэффициентов

Оценка степени тесноты связи с помощью коэффициента корреляции обычно проводится на основе выборки. Возникает вопрос, насколько правомерен вывод о наличии корреляционной связи в генеральной совокупности, из которой была произведена выборка, и не являются ли полученные значения параметров результатом действия случайных причин. В этом случае необходимо оценить существенность линейного коэффициента корреляции, дающую возможность распространить выводы по результатам оценивания выборки на всю генеральную совокупность. Для этого используется критерий Стыодента:

где п — объем выборки.

Величину fpaC4 сравнивают с табличным значением критерия Стьюдента (Гтаб11) при числе степеней свободы, равным (п - 2). Если Грасч больше f.ra6.„ то подтверждается связь между признаками. Если величина коэффициента корреляции превышает величину средней квадратической ошибки более чем в Гтабл о,, раз, то можно говорить о существенности выборочного коэффициента корреляции. Доверительный интервал для коэффициента корреляции будет равен

И-г2

где or =.-гг — значение коэффициента корреляции

V п -1

в генеральной совокупности.

Значимость коэффициентов уравнения регрессии (обычно для совокупности п < 30) определяется с помощью критерия Стыодента. При этом вычисляются фактические значения ^критерия для параметров аи Ь:

где о(КП. = ^ —--среднее квадратическое отклонение

результативного фактора у, от выравненных значений у;,

о = - — среднее квадратическое отклонение фак-

п

тора х,.

Полученные по этим формулам фактические значения ta и tb сравниваются с критическим ?табл, определенным по таблице Стьюдента на основе принятых уровня значимости а и числа степеней свободы v:

где п — количество наблюдений, k — число факторов в уравнении регрессии.

Параметры а и b уравнения регрессии можно считать типичными, если соответствующие фактические t больше (табл- Средние ошибки оценки параметров а и Ь, а также коэффициента корреляции г вычисляются по формулам

Прогноз, полученный подстановкой в уравнение регрессии ожидаемого значения фактора, называют точечным прогнозом. Вероятность точной реализации такого прогноза очень мала. Поэтому рассчитывается значение средней ошибки прогноза или доверительный интервал прогноза с достаточно большой вероятностью. Среднюю ошибку положения линии регрессии в генеральной совокупности при х = хк определяют следующим образом:

?0/;-?)2

где 5Уост=^—--— — оценка среднего квадратического

отклонения результативного признака от линии регрессии в генеральной совокупности с учетом степеней свободы вариации; п — количество элементов в выборке; хк ожидаемое значение фактора х.

Для вычисления доверительных границ прогноза линии регрессии находят значение ^-критерия по таблице Стью- дента па основе числа степеней свободы и уровня значимости (доверительной вероятности). Затем вычисляют предельную ошибку по формуле

В экономической статистике в большинстве случаев уровень значимости принимается равным 0,05. Доверительный интервал прогноза представляет собой диапазон от (?<**)” Апр) Д° (&{хк) + &пр)* Средняя ошибка прогноза для индивидуального значения по правилу дисперсии суммы независимых переменных образуется из ошибки прогноза положения линии регрессии и среднего квадратичного отклонения индивидуальных значений от линии регрессии (остаточной вариации):

Аналогично вышеизложенному доверительный интервал прогноза индивидуальных значений результирующего признака при х = хк представляет собой диапазон от (г/(д>) - Д) до

(%) + *)> где д = ’t-

значимость коэффициента множественной детерминации и, соответственно, адекватность модели можно проверить с помощью критерия Фишера

где R2 — коэффициент множественной детерминации (Я*/Эд); k — число факторных признаков в уравнении регрессии.

Связь считается существенной, если /7расч больше табличного значения ^-критерия (FTa6л) для заданного уровня значимости а и числа степеней свободы vt = ky v2 = п - k -1.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >