Интервальные оценки

Доверительные интервалы. Доверительные интервалы для параметров нормального распределения

Точечные оценки дают приближенное значение неизвестного параметра. Однако более содержательной является задача определения интервала (tj, t2), содержащего 0 с большей вероятностью. При этом концы интервала

являются функциями от наблюдений, следовательно, будут случайными величинами.

Пустьхь ...,х„ — случайные наблюдения сл. в.Х, распределение которой зависит от неизвестного параметра 9. Рассмотрим интервал (tx, t2), где = t,(Xj, t2 = t2{xv ...,xn) статистики, и пусть 0< a < 1.

Определение. Доверительным интервалом с коэффициентом доверия 1 - а называется всякий интервал (Г1; t2), для которого

для всех 0.

Число 1 - а называют доверительной вероятностью, а tj и t2 — нижней и верхней доверительными границами.

Вероятностный смысл утверждения (1.35) состоит в том, что при многократном пользовании таким интервалом окажется, что примерно в (1 - а)х100% случаях он накроет 0 и лишь в ах 100% случаях не накроет.

Существует два метода решения поставленной задачи: байесовский метод и метод доверительных интервалов, предложенный Нейманом.

Зададим число а > 0, которое на практике выбирают достаточно близким к 0, чтобы событие с вероятностью 1 - а можно было считать практически достоверным. При фиксированном значении параметра 0 распределение оценки tjOq, х„) обозначим g(x|0). Эту плотность можно рассматривать как распределение единичной массы на вертикальной прямой, проходящей через точку (0, 0) в плоскости (0, t) (рис. 1.2).

Метод доверительных интервалов

Распределение единичной массы на вертикальной прямой

Рис. 1.2. Распределение единичной массы на вертикальной прямой

Определим для каждого фиксированного значения 0 числа Cj(0, а) и С2(0, а) так, чтобы количество массы, попавшее на отрезок [С1; С2] рассматриваемой вертикальной прямой, было равно 1 - а, т.е.

Числа С, и С2 зависят от 0 и с изменением 0 точки (0, С,) и (0, С2) описывают в плоскости (0, t) две кривые. Предположим, что всякая прямая, параллельная оси 00, пересекает каждую из кривых лишь в одной точке.

Обозначим через fjCxj, ...,х„) и t2(x1; ...,х„) точки пересечения этих кривых с прямой, проходящей через точку (0, t(Xj,..., х,,)) параллельно оси 00. Пусть D(а) — область, заключенная между двумя кривыми.

Очевидно, что

  • (1) Ci < t(xx,х„) < С2 эквивалентно (0, t) е D(а) и
  • (2) tj < 0 < t2 эквивалентно (0, t) € D(a).

Таким образом, если для какой-нибудь выборки xv ..., хп справедливо неравенство (1), то справедливо неравенство (2), и наоборот. Поэтому при любом

Соотношение (1) означает, что сл. в. t(xlf...,хп) заключены между границами С, и С2, а неравенство (2) означает, что величина 0 заключена между случайными пределами г, и Г2.

Таким образом, случайный интервал (f,, t2), с вероятностью 1 - а содержит внутри себя неизвестное значение 0. Строить доверительные интервалы, отвечающие заданному уровню доверия, и оценивать неизвестные параметры можно разными способами. Способ построения следует выбирать так, чтобы доверительная полоса была по возможности уже.

Пример 1.20

Построение доверительного интервала для математического ожидания а нормального распределения с известной дисперсией а2. Пусть х1;..., хп — выборка из нормальной совокупности N(a, a2), причем дисперсия а2 известна. В качестве оценки для а возьмем выборочное среднее х =

Оценим точность этого приближенного равенства, т.е. укажем доверительные границы, в которых с вероятностью 1 - а лежит неизвестный параметр а.

Выборочное среднее х имеет нормальное распределение с па-

{ ст21

раметрами а, — . В силу симметричности распределения х относительно а для центрального интервала (он имеет наименьшую длину среди других возможных интервалов) функции С^а, а) иС2(а, а) имеют вид

оО

где число t — находится из уравнения

^2 )

x-a

Сделав замену переменной и = -f, получим

ап 2

Если Ф(х) — функция распределения стандартного нормального распределения, то, так как Ф(-х) = 1 - Ф(х), получаем

( (х ^ (X

Решение tl — I этого уравнения называется — X 100% точкой

распределения Ф(х). Чтобы найти ее, воспользуемся таблицами процентных точек нормального распределения. Например, для а = 0,05 по таблицам находим, что t(0,025) = 1,96.

-1 fa) - -1 Г а'j

Решив неравенство a- an 2tl — I<х < а + стп 2tl —I относительно а, получим для а доверительный интервал с заданной надежностью 1 - а

Приведем графическое представление этого интервала (рис. 1.3).

Графическое представление доверительного интервала

Рис. 1.3. Графическое представление доверительного интервала

Вся зона между вертикальными прямыми образует доверительную полосу. Интервал будет возрастать, если увеличивать коэффициент доверия, т.е. уменьшать а — значит увеличивать

Доверительная полоса сужается, если растет п или уменьшается дисперсия а2.

Второй способ построения доверительного интервала состоит в подборе такой функции ф(0, х,, ..., х„), что распределение ф не зависит от 0. В этом случае числа С, и С2> для которых

выбираются независящими от0: С, = Cj(a), С2 = С2(а).

Если множество {0: Ct < ф(0, х„ х„) < С2} есть интервал (или неравенства разрешимы относительно 0), то это доверительный интервал с заданным коэффициентом доверия.

Пример 1.21

Построение доверительного интервала для независимой дисперсии о2 при заданном а в случае выборки из нормальной совокупности. В качестве оценки для а2 возьмем

п " (л:; - а)2

Рассмотрим сл. в. ~S = Zj-5— = Хп> т-е- она имеет

  • 1 ст
  • •/^-распределение с п степенями свободы.

Для заданного коэффициента доверия 1 - а найдем из уравнений

Р{Х2(п) < С2(а)} = |,Р{Х2(п) < CjCа)} = |

числа CjCa) и С2(а). Если обозначить через Xn(a) - а X 100% точку распределения х2 с п степенями свободы, то

Решая относительно ст2 неравенства

получим искомый доверительный интервал

Пример 1.22

Построение доверительного интервала для дисперсии а2 в случае неизвестного а.

Оценкой для дисперсии будет

nS2 '

Так как сл. в. имеет % распределение с п - 1 степенями свободы, то (см. пример 1.21) получаем искомый доверительный интервал

Замечание. Если в качестве оценки для а2 использовать 1 П

Sq = ——г X (х, -х)2, то получаем доверительный интервал

Пример 1.23

Построение доверительного интервала для математического ожидания а при неизвестной дисперсии о2.

_ х-а [—

Рассмотрим сл. в. t = —— уп, которая имеет t-распределение

Vs2

с (п - 1) степенями свободы. Поскольку t-распределение симметрично относительно нуля, то С,(а)= -С2(а), причем С2(а) нахо-

ОС ос

дим из условия P{t > С2(а)} = —, т.е. С2(а) есть — х 100% точка

t-распределения с (п - 1) степенями свободы. Искомый довери- - S - S

тельный интервал х——С2(а) < а < х +—С2(.а).

Vn Vn

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >