Стандартная ошибка и оценка доверительных интервалов для коэффициентов корреляции и регрессии

Несколько сложнее обстоит дело в ситуации, когда необходимо построить доверительные интервалы для величины коэффициента корреляции. Представленный здесь подход будет работать только, когда оказывается верной статистическая гипотеза о равенстве нулю коэффициента корреляции в генеральной совокупности. Только в этом случае мы, очевидно, будем иметь дело с симметричным распределением. При отклонении коэффициента корреляции от этого значения распределение становится все более асимметричным.

На самом деле редко, когда приходится обращаться к проверке гипотез о равенстве теоретического значения корреляции какому- либо ненулевому значению. Неудивительно, что эта процедура все еще очень слабо разработана в статистическом анализе. Приступая к проверке такого рода гипотез, прежде всего, необходимо иметь в виду, что форма распределения коэффициента корреляции, неравного нулевому значению, отличается как от нормального, так и от распределения Стьюдента. Строго говоря, в каждом конкретном случае это распределение свое. Поэтому для проверки гипотез о конкретном значении коэффициента корреляции применяют нелинейное преобразование, позволяющее свести это распределение к нормальному. Способ такого рода преобразования был предложен Р. Фишером и в честь него получил название логарифмического преобразования Фишера•.

Распределение z' исследовано достаточно хорошо. В частности, известно, что оно приблизительно соответствует нормальному распределению даже для небольших выборок. Стандартная ошибка этого распределения зависит только от величины п:

Интервальная оценка различий. Пусть нам требуется оценить разность двух коэффициентов регрессии. В этом случае стандартная ошибка для интервала между ними может быть определена на основе стандартных ошибок для каждого из них:

Несколько сложнее обстоит дело при построении доверительных интервалов, описывающих различия между двумя коэффициентами корреляции. Ранее считалось, что оценка стандартной

(7.13)

ошибки для таких различий может быть рассчитана так же, как и для одного коэффициента корреляции, т.е. на основе логарифмических преобразований Фишера двух сравниваемых коэффициентов. Позже такой подход был признан некорректным. Однако это не значит, что различия между двумя r не могут быть оценены статистически.

Выше было показано, что если у нас имеются достаточно большие независимые выборки, для которых были рассчитаны коэффициенты корреляции r1 и r2, то различие между r1 и r2 описывается нормальным распределением, а стандартная ошибка для этого различия может быть приблизительно оценена по следующей формуле:

Ранее мы выяснили, что распределение коэффициентов регрессии и различий между ними может быть описано с помощью хорошо известного нам t-распределения. Поэтому процедуры проверки гипотез, касающихся этих параметров простой линейной регрессии, мало чем отличаются от того, что нам известно относительно статистических гипотез, касающихся средних значений и сравнения двух средних. Эти процедуры были рассмотрены нами в гл. 2.

Так, для проверки статистической гипотезы о равенстве коэффициента регрессии какому-либо теоретическому значению необходимо вычислить следующую статистику:

где ВH – значение коэффициента регрессии, предполагаемое нулевой гипотезой (чаще всего предполагается нулевое значение этого параметра).

Такая статистика описывается t-распределением Стьюдента с п – 2 степенями свободы. Если вычисления проводятся вручную, то оценить статистическую надежность полученного результата можно с помощью таблиц t-распределения с соответствующим числом степеней свободы. Аналогичным образом оцениваются гипотезы о коэффициенте регрессии А.

Если необходимо проверить нулевую гипотезу о равенстве коэффициента корреляции в генеральной совокупности нулевому

 
< Пред   СОДЕРЖАНИЕ     След >