Оценка существенности коэффициента корреляции, уравнения регрессии и его коэффициентов

Оценка степени тесноты связи с помощью коэффициента корреляции обычно проводится на основе выборки. Возникает вопрос, насколько правомерен вывод о наличии корреляционной связи в генеральной совокупности, из которой была произведена выборка, и не являются ли полученные значения параметров результатом действия случайных причин. В этом случае необходимо оценить существенность линейного коэффициента корреляции, дающую возможность распространить выводы по результатам оценивания выборки на всю генеральную совокупность. Для этого используется критерий Стыодента:

где п — объем выборки.

Величину fpaC4 сравнивают с табличным значением критерия Стыодента (Гтабл) при числе степеней свободы, равным (п - 2). Если грасч больше tTaбл, то подтверждается связь между признаками. Если величина коэффициента корреляции превышает величину средней квадратической ошибки более чем в Гтабл • о,, раз, то можно говорить о существенности выборочного коэффициента корреляции. Доверительный интервал для коэффициента корреляции будет равен

где — значение коэффициента корреляции

в генеральной совокупности.

Значимость коэффициентов уравнения регрессии (обычно для совокупности п < 30) определяется с помощью критерия Стыодента. При этом вычисляются фактические значения ^критерия для параметров а и b:

где среднее квадратическое отклонение

результативного фактора у, от выравненных значений у

- среднее квадратическое отклонение фактора х,.

Полученные по этим формулам фактические значения tQ и tb сравниваются с критическим ?табл, определенным по таблице Стьюдента на основе принятых уровня значимости а и числа степеней свободы v:

где п — количество наблюдений, k — число факторов в уравнении регрессии.

Параметры а и b уравнения регрессии можно считать типичными, если соответствующие фактические t больше ?табл• Средние ошибки оценки параметров а и Ь, а также коэффициента корреляции г вычисляются по формулам

Прогноз, полученный подстановкой в уравнение регрессии ожидаемого значения фактора, называют точечным прогнозом. Вероятность точной реализации такого прогноза очень мала. Поэтому рассчитывается значение средней ошибки прогноза или доверительный интервал прогноза с достаточно большой вероятностью. Среднюю ошибку положения линии регрессии в генеральной совокупности при х = хк определяют следующим образом:

где — оценка среднего квадратического

отклонения результативного признака от линии регрессии в генеральной совокупности с учетом степеней свободы вариации; п — количество элементов в выборке; хк ожидаемое значение фактора х.

Для вычисления доверительных границ прогноза линии регрессии находят значение ^-критерия по таблице Стью- дента па основе числа степеней свободы и уровня значимости (доверительной вероятности). Затем вычисляют предельную ошибку по формуле

В экономической статистике в большинстве случаев уровень значимости принимается равным 0,05. Доверительный интервал прогноза представляет собой диапазон от (У(Хк)~ ДПР) Д° (4Г(,*) + Дпр). Средняя ошибка прогноза для индивидуального значения по правилу дисперсии суммы независимых переменных образуется из ошибки прогноза положения линии регрессии и среднего квадратичного отклонения индивидуальных значений от линии регрессии (остаточной вариации):

Аналогично вышеизложенному доверительный интервал прогноза индивидуальных значений результирующего признака при х = хк представляет собой диапазон от (г/(д>) - А) до (%> + д)>гДе Ь = ту, уt.

Значимость коэффициента множественной детерминации и, соответственно, адекватность модели можно проверить с помощью критерия Фишера

где R2 — коэффициент множественной детерминации (!§/ ); к — число факторных признаков в уравнении регрессии.

Связь считается существенной, если /7расч больше табличного значения F-критерия (FTaбл) для заданного уровня значимости а и числа степеней свободы v{ = ky v2 = п - к -1.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >