Определение доверительных интервалов для коэффициентов и функции регрессии

Перейдем теперь к оценке значимости коэффициентов регрессии bj и построению доверительного интервала для параметров регрессионной модели (3, (/=1,2,..., р).

В силу соотношений (13.34), (13.36) и изложенного выше оценка дисперсии коэффициента регрессии Ь} определится по формуле

где s2 — несмещенная оценка параметра а2; [(Х'Х)-1]^ — диагональный элемент матрицы (Х'Х)

Среднее квадратическое отклонение (стандартная ошибка) коэффициента регрессии bj примет вид

Оценка значимости коэффициента регрессии bj означает проверку нулевой гипотезы о равенстве параметра Р; множественной модели (13.22) нулю, т.е. Я0: (3; = 0 против альтернативной гипотезы Я,: Р;*0.

Эта проверка основана на том, что статистика [b} _Р;)/sb. имеет С распределение Стьюдента ck-n-p-1 степенями свободы. Поэтому bj значимо отличается от нуля на уровне значимости а (гипотеза Я0

j

отвергается), если |?| = J'->tx_a.п_р_х, где tx_a.n_p_х табличное значение

shj

i-критерия Стьюдента, определенное на уровне значимости а при числе степеней свободы k = n-p-1.

В общей постановке гипотеза Я0 о равенстве параметра р; заданному числу р;0, т.е. Я0: Р^=Р^0 против альтернативной гипотезы Я,: Р^Р^0 отвергается, если

у = (1 - а)%-ный доверительный интервал для параметра (3; есть

Наряду с интервальным оцениванием коэффициентов регрессии по формуле (13.39) весьма важным для оценки точности определения зависимой переменной (прогноза) является построение доверительного интервала для функции регрессии или для условного математического ожидания зависимой переменной Мг (У), найденного в предположении, что объясняющие переменные Xv Х2,..., Хр приняли значения, задаваемые вектором Xq = fl х10 х20 ... х/)0). Выше такой интервал получен для уравнения парной регрессии (см. (13.13) и (13.12)). Обобщая соответствующие выражения на случаи множественной регрессии, можно получить доверительный интервал для М (У):

где уч — групповая средняя, определяемая по уравнению регрессии,

— ее стандартная ошибка.

При обобщении формул (13.15) и (13.14) аналогичный доверительный интервал для индивидуальных значений зависимой переменной у^ примет вид

где

Доверительный интервал для дисперсии возмущений ст2 в множественной регрессии с надежностью у = 1 - а строится аналогично парной модели по формуле (13.20) с соответствующим изменением числа степеней свободы критерия х2:

О Пример 13.6. По данным примера 13.4 оценить сменную добычу угля на одного рабочего для шахт с мощностью пласта 8 м и уровнем механизации работ 6%; найти 95%-ные доверительные интервалы для индивидуального и среднего значений сменной добычи угля на 1 рабочего для таких же шахт. Проверить значимость коэффициентов регрессии и построить для них 95%-ные доверительные интервалы. Найти с надежностью 0,95 интервальную оценку для дисперсии возмущений о2.

Решение. В примере 13.4 уравнение регрессии получено в виде: ух = -3,54 + 0,854л'! + 0,367лг2. По условию надо оценить MX (Y), где Хц =(18 6). Выборочной оценкой М,.о(У) является групповая средняя, которую найдем но уравнению регрессии: уХ() = -3,54 + 0,854 • 8 + + 0,367 • 6 = 5,49 (т). Для построения доверительного интервала для Мг-0(У) необходимо знать дисперсию его оценки — s2 . Для ее вычисления обра-

тимся к табл. 13.7 (точнее, к ее двум последним столбцам, при составлении которых учтено, что групповые средние определяются по полученному уравнению регрессии).

Теперь по формуле (13.37): s2 = ’ —- = 0,904 и s = ^0,904 =0,951 (т).

Определяем стандартную ошибку групповой средней уХ{) но формуле (13.41). Вначале найдем

Теперь s - 0,951^/0,1870 = 0,411 (т).

Ухо

По табл. IV приложений при числе степеней свободы & = 10- 2-1=7 находим ?095;7 = 2,36. По формуле (13.40) доверительный интервал для МГо(У) равен 5,49 - 2,36 • 0,411 < MxJy) < 5,49 + 2,36 • 0,411 или 4,52 < MXq(y)< 6,46 (т).

Итак, с надежностью 0,95 средняя сменная добыча угля на одного рабочего для шахт с мощностью пласта 8 м и уровнем механизации работ 6% находится в пределах от 4,52 до 6,46 т.

Сравнивая новый доверительный интервал для функции регрессии MXq{Y)> полученный с учетом двух объясняющих переменных, с аналогичным интервалом с учетом одной объясняющей переменной (см. пример 13.1), можно заметить уменьшение его величины. Это связано с тем, что включение в модель новой объясняющей переменной позволяет несколько повысить точность модели за счет увеличения взаимосвязи зависимой и объясняющей переменных (см. ниже).

Найдем доверительный интервал для индивидуального значения при Хц = (l 8 б):

по формуле (13.43): sljQ = 0,951^1 + 0,1870 = 1,036 (т) и по формуле (13.42):

5,49 - 2,36 • 1,036 < у1 < 5,49 + 2,36 • 1,036, т.е. 3,05 <у*0< 7,93 (т).

Итак, с надежностью 0,95 индивидуальное значение сменной добычи угля в шахтах с мощностью пласта 8 м и уровнем механизации работ 6% находится в пределах от 3,05 до 7,93 (т).

Проверим значимость коэффициентов регрессии Ьх и Ь2. В примере 13.4 получены bj = 0,854 и Ь2 = 0,367. Стандартная ошибка sb в соответ-

П

ствии с формулой (13.38) равна: sb =0,951 J--201 = 0,221. Так как

0 854 1 * 3738

t = —-= 3,81 >?095;7 = 2,36 , то коэффициент bt значим. Аналогично

6,221 1 ?

вычисляем 5/? =0,951. /--244=0,243 и t = —-= 1,51 0 05.7 =2,36, т.е.

*2 V 3738 0,243 °'957

коэффициент Ь2 незначим на 5%-ном уровне.

Доверительный интервал имеет смысл построить только для значимого коэффициента регрессии Ь{ по (13.39) 0,854 - 2,36 • 0,221 < (3j < 0,854 + + 2,36 • 0,221 или 0,332 < pt < 1,376.

Итак, с надежностью 0,95 за счет изменения на 1 м мощности пласта Х{ (при неизменном Х2) сменная добыча угля на одного рабочего Y будет изменяться в пределах от 0,332 до 1,376 т.

Найдем 95%-ный доверительный интервал для параметра сг. Учитывая, что а = 1 - 0,95 = 0,05, а/2 = 0,025, 1 - а/2 = 0,975, найдем по табл. V приложений при п -р -1 = п - 3 степенях свободы Хо,025;7 =16,0; Хо,975;7 = 1.69 и по формуле (13.43')

Таким образом, с надежностью 0,95 дисперсия возмущений заключена в пределах от 0,565 до 5,35, а их стандартное отклонение — от 0,751 до 2,31 (т). ?

Формально переменные, имеющие незначимые коэффициенты регрессии, могут быть исключены из рассмотрения. В экономических исследованиях исключению переменных из регрессии должен предшествовать тщательный качественный анализ. Поэтому может оказаться целесообразным все же оставить в регрессионной модели одну или несколько объясняющих переменных, не оказывающих существенного (значимого) влияния на зависимую переменную.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >