Определение доверительных интервалов для коэффициентов и функции регрессии

Перейдем теперь к оценке значимости коэффициентов регрессии bj и построению доверительного интервала для параметров регрессионной модели Ру (/-1,2,..., р).

В силу (4.14), (4.16) и изложенного выше оценка s^ дисперсии коэффициента регрессии /у определится по формуле:

где s2 — несмещенная оценка параметра а2;

[(ХХ)~ ]jj диагональный элемент матрицы уХ!Х)1.

Среднее квадратическое отклонение (стандартная ошибка) коэффициента регрессии bj примет вид:

Значимость коэффициента регрессии bj можно проверить, сели учесть, что статистика (bj -$j)l sbj имеет /-распределение Стью-

дента с к = п — р — 1 степенями свободы. Поэтому bj значимо отличается от нуля (иначе — гипотеза Щ о равенстве параметра нулю, т. е. Я0: Р, = 0 , отвергается) на уровне значимости а,

ь

если |/| =1—-> tx_a.n_p_l9 где tx_a.n_p_x табличное значение

sb

/-критерия Стьюдента, определенное на уровне значимости а при числе степеней свободы к = п — р — 1.

В общей постановке гипотеза #о ° равенстве параметра ру-

заданному числу р/0, т. е. Я0: ру = ру0, отвергается, если

Поэтому доверительный интервал для параметра р, есть

Наряду с интервальным оцениванием коэффициентов регрессии по (4.23') весьма важным для оценки точности определения зависимой переменной (прогноза) является построение доверительного интервала для функции регрессии или для условного математического ожидания зависимой переменной MX(Y), найденного в предположении, что объясняющие переменные Х, Хр приняли значения, задаваемые вектором Х'0 = (l x]Q х20 ... хр0).

Выше такой интервал получен для уравнения парной регрессии (см. (3.34) и (3.33)). Обобщая соответствующие выражения на случай множественной регрессии, можно получить доверительный интервал для Мх{ Y):

где у — групповая средняя, определяемая по уравнению регрессии,

— ее стандартная ошибка.

При обобщении формул (3.36) и (3.35) аналогичный доверительный интервал для индивидуальных значений зависимой переменной у% примет вид:

где

Доверительный интервал для параметра а2 в множественной регрессии строится аналогично парной модели по формуле (3.39) с соответствующим изменением числа степеней свободы критерия х2*

? Пример 4.3. По данным примера 4.1 оценить сменную добычу угля на одного рабочего для шахт с мощностью пласта 8 м и уровнем механизации работ 6%; найти 95%-ные доверительные интервалы для индивидуального и среднего значений сменной добычи угля на 1 рабочего для таких же шахт. Проверить значимость коэффициентов регрессии и построить для них 95%-ные доверительные интервалы. Найти интервальную оценку для дисперсии а2.

Решение. В примере 4.1 уравнение регрессии получено в виде у = —3,54 + 0,854xj + 0,367x2.

По условию надо оценить MX(Y), где Х'0 =(18 6). Выборочной оценкой Мх{Y) является групповая средняя, которую найдем по уравнению регрессии:

Для построения доверительного интервала для Мх( Y) необходимо знать дисперсию его оценки — sj. Для ее вычисления обратимся к табл. 4.2 (точнее к ее двум последним столбцам, при составлении которых учтено, что групповые средние определяются по полученному уравнению регрессии).

6 3?9 I-

Теперь no (4.21): .у2 =—--= 0,904 и s = J0,904 = 0,951 (т).

10-2-1

Определяем стандартную ошибку групповой средней у по формуле (4.25). Вначале найдем

Теперь sfi = 0,951^0,1870 = 0,411 (т).

По табл. II приложений при числе степеней свободы ?=10— —2—1=7 находим /о,95;7=2,36. По (4.24) доверительный интервал для Мх{ Y) равен

или

Итак, с надежностью 0,95 средняя сменная добыча угля на одного рабочего для шахт с мощностью пласта 8 м и уровнем механизации работ 6% находится в пределах от 4,52 до 6,46 т.

Сравнивая новый доверительный интервал для функции регрессии MX( Y), полученный с учетом двух объясняющих переменных, с аналогичным интервалом с учетом одной объясняющей переменной (см. пример 3.3), можно заметить уменьшение его величины. Это связано о тем, что включение в модель новой объясняющей переменной позволяет несколько повысить точность модели за счет увеличения взаимосвязи зависимой и объясняющей переменных (см. ниже).

Найдем доверительный интервал для индивидуального значения уо при ^0=0 8 б):

по (4.27): 5Л = 0,951^1 + 0,1870 = 1,036 (т)

и по (4.26): 5,49-2,36-1,036 <,у% <5,49+2,36 • 1,036,

т. е. 3,05 < уо <7,93(т).

Итак, с надежностью 0,95 индивидуальное значение сменной добычи угля в шахтах с мощностью пласта 8 м и уровнем механизации работ 6% находится в пределах от 3,05 до 7,93 (т).

Проверим значимость коэффициентов регрессии Ь и b2- В примере 4.1 получены Ь= 0,854 и Ь2=0,367. Стандартная ошибка sbl в соответствии с (4.22) равна

Так как t = ~~~ = 3,81 > /0>95;7 = 2,36 , то коэффициент Ь значим.

Аналогично вычисляем Su =0,95L —-—244 = 0,243 и t = 9^^ =

V 3738 0,243

= 1,51 = 2 ,36, т. е. коэффициент hi незначим на 5%-ном

уровне.

Доверительный интервал имеет смысл построить только для значимого коэффициента регрессии Ь. по (4.23'):

0,854 - 2,36 • 0,221 < р, < 0,854+2,36 • 0,221, или 0,332 < р, < 1,376.

Итак, с надежностью 0,95 за счет изменения на 1 м мощности пласта Х (при неизменном сменная добыча угля на одного рабочего Yбудет изменяться в пределах от 0,332 до 1,376 (т).

Найдем 95%-ный доверительный интервал для параметра а2. Учитывая, что «= 1—0,95 = 0,05, найдем по таблице III приложений п — р— 1 = /2—2 — 1 = /2 — 3 степенях свободы

По формуле (4.28)

или 0,565 < а2 < 5,349 и 0,751 < а < 2,313 .

Таким образом, с надежностью 0,95 дисперсия возмущений заключена в пределах от 0,565 до 5,349, а их стандартное отклонение — от 0,751 до 2,313 (т). ?

Формально переменные, имеющие незначимые коэффициенты регрессии, могут быть исключены из рассмотрения. В экономических исследованиях исключению переменных из регрсс-

сии должен предшествовать тщательный качественный анализ. Поэтому может оказаться целесообразным все же оставить в регрессионной модели одну или несколько объясняющих переменных, не оказывающих существенного (значимого) влияния на зависимую переменную.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >