Доверительные интервалы для параметров нормального распределения

Ниже будут рассмотрены доверительные интервалы для параметров нормального распределения, затем — для параметров других распределений. Удобно этот материал представить в виде теоретических задач.

Теоретическая задача 14.1. Найти доверительный интервал для математического ожидания нормально распределенной случайной величины при известной дисперсии.

Пусть наблюдается случайная величина ~ N(a, ст2). По выборке хь х2, ..., хп определить доверительный интервал для математического ожидания.

Решение. Среднее значение х является несмещенной, состоятельной и эффективной оценкой математического ожидания а, распределенной нормально, кроме того, х является случайной величиной с нормальным распределением: х ~ N(Mx,Dx) = N^a,j. Поэтому разумно

построить доверительный интервал на основе распределения х. Слу- „ х-Мх х-а г

чайная величина ц=—-vn имеет стандартное нормальное

?jDx а

распределение: Г| ~ iV(0, 1). Введем надежность у, т.е. вероятность, с которой параметр а попадет в доверительный интервал. Надежности у соответствует некоторое критическое число хкр из таблицы функции Лапласа, такое что Р{ | г| | < хкр} = у. Другими словами, вероятность случайной величине г| попасть в промежуток (-хкр; хкр) равна у. Тогда

Выбирая квантиль хкр из равенства Фо(хкр) = —, получим

Итак, математическое ожидание а с вероятностью у находится в интервале

или, что то же самое, доверительный интервал с серединой в точке х

с вероятностью у содержит значение а. Длина интервала 26 = 2-^х,ф

Vn

зависит от вероятности у через хкр. Большая дисперсия приводит к растягиванию интервала. Рост объема выборки п сжимает интервал, делая оценку точнее.*

Замечание 14.1. Вместо обозначения границы хкр можно ввести обозначение ха, чтобы подчеркнуть тот факт, что на графике плотности

2

распределения слева и справа отделяются площадки величиной по а/2. Величина а называется уровнем значимости. Справедливо равенство а + у = 1.

Введенные критические значения хкр тесно связаны с приятыми в статистике разными формами записи и названиями границ, на которых строятся доверительные интервалы.

Квантилем уровня р называется критическое значение х_, которое является решением уравнения Р(?, < хр) = Р^(хр) = р. Например, в теоре- .. „ .. Л а 1+у

тическои задаче 14.1 РСг|<хкр) = —+у= ^ , т.е. хкр есть квантиль 1 + у

уровня —Y~.

Квантили х0 25, Xq so, х0;75 называются квартилями, причем х0 2s есть нижний квартиль, х0 75верхний квартиль, величина х0 75 - х0 25 называется интерквартильным размахом. Медиана и интерквартильный размах иногда используются вместо МЬ, иО^в случае невозможности вычисления последних.

Квантилих0д,х02,..., х09 называются децилями, х001, х002,..., х0 99перцентилями (процентилями, центилями). Например, медиана является 50-й перцентилью, а первый и третий квартиль — 25-й и 75-й перцентилями.

Теоретическая задача 14.2. Найти доверительный интервал для математического ожидания нормально распределенной случайной величины при неизвестной дисперсии.

Решение. По-прежнему будем опираться на х. Теоретическая дисперсия неизвестна, но может быть найдена выборочная дисперсия при неизвестном математическом ожидании и исправлена на S%. Тогда слу- х-а г-

чаиная величина р=——vn имеет другое распределение, а именно,

Sn

распределение Стьюдента с п - 1 степенями свободы.

Таблица Стьюдента устроена иначе, чем таблица Лапласа. Для числа степеней свободы п - 1 и уровня значимости а в таблице указана вероятность Р{ | г| | > хкр. п_а} = а при двусторонней критической области. В силу соотношения у + а = 1 это равенство равносильно равенству

Pi hi <*KP;„-l}=Y-

Последовательность работы с таблицей в нашей задаче такова: для заданного у вычислим а = 1 - у по таблице Стьюдента найдем хкр. п-1 для двусторонней области и числа степеней свободы п - 1. Получим

-*кр;л-1 <Хкр;п-1, откуда

т.е. математическое ожидание с вероятностью у (уровнем значимости а)

« (- 4 _ Sn )

будет находиться в интервале х—px^-^i; х-ь-^х™.^] . ?

ч Vn Vn ’

Теоретическая задача 14.3. Найти доверительный интервал для неизвестной теоретической дисперсии нормально распределенной случайной величины при известном математическом ожидании а.

Решение. Статистическая точечная оценка параметра ст2 есть выборочная дисперсия. При поиске доверительного интервала для дисперсии при известном математическом ожидании а разумно пользоваться

1 "

выборочной дисперсией ст^.п =—У(х,- - а)2. Эта оценка, как мы устано-

п i=1

вили, является несмещенной, состоятельной и асимптотически эффек-

пст2

тивной. Связать а2 и а2 можно с помощью случайной величины р =-—,

а2

имеющей известное распределение. Действительно, поскольку случай- " (х- - а)2

ная величина р = У——-— распределена по закону Пирсона с числом

i=i

степеней свободы п, то

Таблица Пирсона может быть устроена подобно таблице Лапласа. Распределение Пирсона не обладает симметрией. Для числа степеней свободы п в таблице указана вероятность Р{г < хкр}. Обрезав оба «хвоста» распределения, на каждый из которых случайная величина попадает с вероятностью —, получим с надежностью у (рис. 14.1)

пст2

Решая неравенство хкр1.„ <-— <*Кр2-п относительно а2, получим

а2

Размещение критических значений доверительного интервала на графике плотности распределения

Рис. 14.1. Размещение критических значений доверительного интервала на графике плотности распределения

/ АО А О

- П<П.;п пста;п

Таким образом, интервал -;- с уровнем значимости а

. ^кр2; и ^кр1; п ,

(с надежностью у) накрывает неизвестный параметр о2. ?

Замечание 14.2. Критические точки хкр1 и хкр2 можно представить как квантили соответствующего уровня, используя индексы надежности у или уровня значимости а: хкр1ах_у; хкр2а1+у.

2 1_2

Теоретическая задача 14.4. Найти доверительный интервал для неизвестной дисперсии нормально распределенной случайной величины при неизвестном математическом ожидании.

Решение. Выборочная дисперсия при неизвестном математическом ожидании, как известно, вычисляется с использованием х. Рассмотрим п (х- - х)2

случайную величинут| = У—1——:

;=i

Повторяя преобразования предыдущей задачи, получим Р{хкр1. п_2 < < 11 < *кр2; n-l> = Y-

„ „ (n-l)S2

Случайная величина г| попадет в промежуток xKni n_i <-т—1-<

а2

<Лгкр2;п-1- Решая неравенство относительно а2, приходим к доверительному интервалу

Теоретическая задача 14.5. По выборке из п наблюдений нормально распределенной случайной величины с неизвестными математическим ожиданием и дисперсией построить доверительный интервал для (п + 1)-го наблюдения.

Решение. Здесь необходимо, используя любые вычисляемые по п наблюдениям выборочные характеристики, спрогнозировать, в какой области значений с заданной вероятностью следует ожидать следующее (п + 1)-е наблюдение.

( о2Л

Известно, что x~N а,— , х„+1 ~ JV(a, а2). Алгебраическая сумма V п

случайных величин, принадлежащих нормальному распределению,

( ст2 ^

также нормальна, т.е. хп+1-х ~ N1 0, ст2 +— . Тогда случайная вели-

V п

чина = ,X"+1 Х= ~ N(0,1). Построенная на ее основе другая случай-

ЯР

ная величина г|= .——0 имеет распределение Стьюдента с п - 1 сте-

пенью свободы.

Случайная величина

с надежностью у попадет в интервал | г| | < хкр; п_1; т.е. Р{ц < хкр; n_j} = у. г. xn+i

Решая неравенство — .кр относительно х„+1, получим

Ч1 + 1п

По выборке из п наблюдений нормально распределенной случайной величины можно построить для п + 1 наблюдения:

• доверительный интервал с известным математическим ожиданием и известной дисперсией

• доверительный интервал с неизвестным математическим ожиданием и известной дисперсией

• доверительный интервал с известным математическим ожиданием и неизвестной дисперсией

Пример 14.1. Молочный комбинат выпускает творог с номинальным весом 180 г. Автомат расфасовки творога имеет стандартное отклонение 3 г. Взвешивание коробки с 10 пачками творога показало вес нетто 1,810 кг. Найти доверительный интервал для среднего веса с надежностью 95%.

Решение. Средний вес генеральной совокупности есть математическое ожидание а. Интервал разброса а при п = 10ист = 3г определяется соотношением х--2= хкр <а<х + -2=хкр. Величинахкр находится из равенства Ф0кр) = л/п %/п

0 95

= =0,475 и равна хкр= 1,96. Получаем доверительный интервал 181-

—5=1,96<а< 181+ -Д=1,96’ или i79-1 г < а < 182>- Ло_Щ._

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >