Проверка гипотезы однородности

Одна из важных прикладных задач математической статистики — проверка однородности статистического материала

[10, 16]. Пусть имеются две независимые выборки X = (ххп) и 7 = (у ...,ут), описывающие один и тот же процесс, но полученные в разных условиях (например, путем исследования на различных моделях). Требуется установить, являются ли они выборками из одного и того же распределения или же закон распределения от выборки к выборке менялся.

В общем виде задачу можно сформулировать следующим образом. ПустьX = ь ...,ХП) — выборка из распределения 1Z(Q с некоторой неизвестной функцией распределения Fl(х), a Y — = (Yb ..., Ym)— выборка из распределения 7Z(0 с неизвестной функцией распределения F2(x). Требуется проверить гипотезу однородности Н0: Тх(х) = F2(x).

Одним из критериев проверки гипотезы однородности служит критерий Смирнова, основанный на статистике

где Fln(x) и F2m(x) — эмпирические функции распределения, построенные по выборкам X и Y соответственно.

Очевидно, что большие значения статистики Dnm свидетельствуют против нулевой гипотезы Н0. Следовательно, критическую область разумно выбирать в виде

По теореме Смирнова при больших пит (порядка 50 и бо- Л ^ / пт

лее) величина Dnm.- подчиняется закону распределения

V п + т

Колмогорова К(Х) независимо от вида функции F(x). Иными словами,

Это означает, что для уровня значимости а критическая область для проверки гипотезы определяется величиной

Пусть, например, из анализа экспериментальных данных получено, что Dnm = 0,1667 при п = т = 60. Воспользуемся таблицей распределения Колмогорова, фрагмент которой приведен ниже:

а

0,5

од

0,05

0,01

0,001

К

0,828

1,224

1,358

1,627

1,950

Находим, что Ха = 1,358 при уровне значимости а = 0,05. Тогда критическая область определится следующим образом:

Полученное на опыте значение D60 60 = 0,1667 лежит в области допустимых значений, следовательно, гипотеза об одинаковости распределений не противоречит наблюдениям.

Проверка гипотезы о равенстве центров распределения двух нормальных генеральных совокупностей

Если проводятся две серии экспериментов на моделях или сравниваются две модели и средние результаты различаются, то возникает вопрос: можно ли объяснить обнаруженное расхождение средних случайными ошибками эксперимента или оно вызвано другими причинами (например, различиями в моделях).

Сформулируем задачу сравнения двух центров распределения в общем виде [16]. Рассмотрим две случайные величины X и У, каждая из которых подчиняется нормальному закону распределения. Пусть имеются две независимые выборки объемами пг и п2 из генеральных совокупностей X и У Необходимо проверить нулевую гипотезу Н0: М[Х] = М[У] относительно альтернативной гипотезы Нг: М[Х] -М[У] > 0.

Рассмотрим случай, когда генеральные дисперсии и Оу известны.

Для проверки гипотез используем статистический материал в виде оценок М [Х] = Х и М[У] = У. Как известно, средние значения X и Y распределены нормально с параметрами (М[Х], /щ) и (М[У], Оу / п2). Выборки независимы, поэтому

X и У также независимы и случайная величина, равная разности между X и У, также имеет нормальное распределение, причем

Если гипотеза Н0 справедлива, то М[Х - У] = М[Х] - М[У] = 0 и, следовательно, нормированная разность

подчиняется нормальному закону распределения с математическим ожиданием, равным нулю, и дисперсией, равной единице.

Выбирая вероятность (3 = 1 - а, сообразуясь с условиями задачи, можно по таблице функции Ф*0) определить статистику Zp, которая разделит множество z на два непересекающихся подмножества: область допустимых значений и критическую область. Те значения z, при которых | образуют область

допустимых значений; значения z, при которых |z| > Zp, образуют критическую область.

Итак, для вероятности (3 = 1 - а критическая область определяется неравенством

Вероятность а отвечает событиям, которые при данных условиях исследования считаются практически невозможными. Чем меньше а, тем меньше вероятность отклонить проверяемую гипотезу, если она верна (ошибка первого рода); с уменьшением уровня значимости а увеличивается риск принять неверную проверяемую гипотезу (ошибка второго рода).

При проверке гипотезы о равенстве центров распределения двух нормальных генеральных совокупностей при заданном уровне значимости а контролируется лишь ошибка первого рода, но нельзя сделать вывод о степени риска, связанного с принятием неверной гипотезы, т. е. с возможностью совершения ошибки второго рода.

Вообще с помощью проверки статистических гипотез можно лишь отвергнуть проверяемую гипотезу, но никогда нельзя доказать ее справедливость.

Если генеральные дисперсии неизвестны, механизм проверки остается таким же, но вместо неизвестных дисперсий используются их оценки. Это приводит к замене нормального закона распределения законом распределения Стьюдента.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >