Критерий Вилкоксона и проверка гипотезы об однородности двух выборок

Критерий Вилкоксона[1] служит для проверки однородности двух независимых выборок: xv х2, хп и yv у2, ^.Достоинство этого критерия состоит в том, что он применим к случайным величинам, распределения которых неизвестны; требуется лишь, чтобы величины были непрерывными.

Если выборки однородны, то считают, что они извлечены из одной и той же генеральной совокупности и, следовательно, имеют одинаковые, причем неизвестные, непрерывные функции распределения F{(x) и F2(x).

Таким образом, нулевая гипотеза состоит в том, что при всех значениях аргумента (обозначим его через х) функции распределения равны между собой: F,(x) = F2(x).

Конкурирующими являются следующие гипотезы: F{(x) * * F2(x), F{(x) < F2(x) и F{(x) > F2(x).

Заметим, что принятие конкурирующей гипотезы Н{F{(x)2(pc) означает, что Х> У. Действительно, неравенство F{(x) < F2(x) равносильно неравенству Р(Х<.х) Отсюда легко получить, что P(X>x)>P(Y> х). Другими словами, вероятность того, что случайная величинах превзойдет фиксированное действительное число .г, больше, чем вероятность случайной величине У оказаться большей, чем х; в этом смысле Х> У.

Аналогично, если справедлива конкурирующая гипотеза Hx:Fx(x) > > F2(y), то X

Далее предполагается, что объем первой выборки меньше (не больше) объема второй: пл < п2; если это не так, то выборки можно перенумеровать (поменять местами).

А. Проверка нулевой гипотезы в случае, если объем обеих выборок не превосходит 25. Правило 1. Для того чтобы при заданном уровне значимости ос = 2 Q проверить нулевую гипотезу #0: /*', (х) = = Е,(х) об однородности двух независимых выборок объемов п[ и п2 (пл < п,2) при конкурирующей гипотезе Ht: 1 (х) Ф Е, (х), надо:

  • 1) расположить варианты обеих выборок в возрастающем порядке, т.е. в виде одного вариационного ряда, и найти в этом ряду наблюдаемое значение критерия 1Еайл — сумму порядковых номеров вариант первой выборки;
  • 2) найти по таблице приложения 10 нижнюю критическую точку да„иж,,кр. (Q; nv «2>- гда а=«/2;
  • 3) найти верхнюю критическую точку по формуле

Если W , < w или W r >w — нулевую гипотезу от-

набл нижн. кр набл верхи, кр J J J

вергают.

Если w — нет оснований отвергнуть нуле-

нижи, кр набл верхи, кр г J J

вую гипотезу.

Пример 1. При уровне значимости 0,05 проверить нулевую гипотезу об однородности двух выборок объемов п = 6 и п = 8: х 15 23 25 26 28 29

у] 12 14 18 20 22 24 27 30

при конкурирующей гипотезе Я,: 1 (х) Ф F., (х).

Р е ш е н и е. Расположим варианты обеих выборок в виде одного вариационного ряда и перенумеруем их:

порядковые номера ...1 2 3 4 5 6 7 8 9 10 11 12 13 14

варианты... 12 14 15 18 20 22 23 24 25 26 27 28 29 30

Найдем наблюдаемое значение критерия Вилкоксона — сумму порядковых номеров (они набраны курсивом) вариант первой выборки:

Найдем по таблице приложения 10 нижнюю критическую точку, учитывая, что Q = а/2 = 0,05/2 = 0,025, и, = 6, и., = 8:

Найдем верхнюю критическую точку:

Так как 29 < 54 < 61, т.е. w „ < IV . нет оснований от-

пижм, кр набл верхи, кр

вергнуть нулевую гипотезу об однородности выборок.

Правило 2. При конкурирующей гипотезе /*’ (х) > F2 (х) надо найти по таблице нижнюю критическую точку даш)Жи кр (Q; nv п.,), где Q = а. Если W . > w — нет оснований отвергнуть нулевую ги-

набл нижн. кр it j j j

потезу.

Если W , < w — нулевую гипотезу отвергают.

наол нижн. кр J J j г

Правило 3. При конкурирующей гипотезе //,: F (х) < /', (х) надо найти верхнюю критическую точку: то (Q; га,, п.2) = («, + п2 + 1)и, - -w (О; п„ п.,), где 0 = а.

нижн. Г 2'’ ^

Если W , < w — нет оснований отвергнуть нулевую ги-

наол верхи, кр г j j J

потезу.

Если W , > w — нулевую гипотезу отвергают.

наол верхн. кр J J j i

Замечание. Если несколько вариант только одной выбор- к и одинаковы, то в общем вариационном ряду им приписывают обычные порядковые номера (совпавшие варианты нумеруют так, как если бы они были различными числами): если же совпадают варианты разных выбор о к, то всем им присваивают один и тот же порядковый номер, равный среднему арифметическому порядковых номеров, которые имели бы эти варианты до совпадения.

Б. Проверка нулевой гипотезы в случае, если объем хотя бы одной из выборок превосходит 25. 1. При конкурирующей гипотезе 1(х) * F2(x) нижняя критическая точка

где <2 = а/2; zKj находят по таблице функции Лапласа по равенству Ф(гк|1) = (1 - а)/2; знак [я] означает целую часть числа а.

В остальном правило 1, приведенное в и. А, сохраняется.

2. При конкурирующих гипотезах Е,(х) > f./х) и Е,(х) < Е/х) нижнюю критическую точку находят но формуле (*), положив Q= а; соответственно zKp находят по таблице функции Лапласа по равенству Ф(гк1>) = (1 - 2а)/2. В остальном правила 2—3, приведенные в и. А, сохраняются.

Пример 2. При уровне значимости 0,01 проверить нулевую гипотезу об однородности двух выборок объемов nf = 30 и и, = 50 при конкурирующей гипотезе Я,: Е,(х) # Е2(х), если известно, что в общем вариационном ряду, составленном из вариант обеих выборок, сумма порядковых номеров вариант первой выборки W|ia6ji = 1600.

Решение. По условию, конкурирующая гипотеза имеет вид Ft(х) Ф Ф Fix'), поэтому критическая область — двусторонняя.

Найдем гкр но равенству

По таблице функции Лапласа (см. приложение 2) находим г = 2,58.

Подставив п{ = 30, п., = 50, гкр = 2,58 в формулу (*), получим wmaKil кр = 954.

Найдем верхнюю критическую точку:

Так как 1600 > 1476, т.с. Wiia6ji > да и , — нулевая гипотеза отвергается.

  • [1] В 1945 г. Вилкоксон опубликовал критерий сравнения двух выборок одинакового объема; в 1947 г. Манн и Уитни обобщили критерий на выборки различногообъема.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >