Проверка гипотез об однородности выборок

Гипотезы об однородности выборок — это гипотезы о том, что рассматриваемые выборки извлечены из одной и той же генеральной совокупности.

Пусть имеются две независимые выборки, произведенные из генеральных совокупностей с неизвестными теоретическими функциями распределения Fx (х) и F2 (х). Проверяемая нулевая гипотеза имеет вид Н0: I'] (х) = /*2 (х) против конкурирующей Нх: F{ (х) ^ F2 (х). Будем предполагать, что функции /•', (х) и F) (х) непрерывны.

Критерий Колмогорова — Смирнова использует ту же самую идею, что и критерий Колмогорова, но только в критерии Колмогорова сравнивается эмпирическая функция распределения с теоретической, а в критерии Колмогорова-Смирнова сравниваются две эмпирические функции распределения.

Статистика критерия КолмогороваСмирнова имеет вид

где Ftl[ (х) и F„2 (х) — эмпирические функции распределения, построенные по двум выборкам объемов пх и п2.

Гипотеза Я0 отвергается, если фактически наблюдаемое значение статистики X' больше критического Л'ф, т.е. X' > л'ф , и принимается в противном случае.

При малых объемах выборок (пх,п2 < 20) критические значения А'р для заданных уровней значимости критерия можно найти в специальных таблицах. При п 1; п2 —> °о

(а практически при пх > 50, п2 > 50) распределение статистики X' сходится к распределению Колмогорова для статистики X. Поэтому гипотеза Н0 отвергается на уровне

значимости а, если фактически наблюдаемое значение X' больше критического Ха, т.е. X' > Ха, и принимается в противном случае.

О Пример 10.13а. В течение месяца выборочно осуществлялась проверка торговых точек города по продаже овощей. Результаты двух проверок по недовесам покупателям одного вида овощей приведены в табл. 10.6.

Таблица 10.6

Номер

интервала

Интервалы недовесов,г

Частоты

щ для выборки 1

и,2 для выборки 2

1

0-10

3

5

Окончание табл. 10.6

Номер

интервала

Интервалы недовесов,г

Частоты

щ для выборки 1

п для выборки 2

2

10-20

10

12

3

20-30

15

8

4

30-40

20

25

5

40-50

12

10

6

50-60

5

8

7

60-70

25

20

8

70-80

15

7

9

80-90

5

5

I

пЛ= 110

п2 = 100

Можно ли считать, что на уровне значимости а = 0,05 по результатам двух проверок (случайных выборок) недовесы овощей описываются одной и той же функцией распределения?

Решение. Обозначим: пнак и лг!,ак — накопленные частоты соответ-

*1 12

ственно выборок 1 и 2; Fn{ ) = /гРк jпх, Fn2 (xj) = n^K jn2 — значения их

эмпирических функций распределения. Результаты вычислений сведем в табл. 10.7.

Таблица 10.7

^нак

*1

^нак

*2

(*i)

р Ы

К (л'.)-^2(^)

10

3

5

0,027

0,050

0,023

20

13

17

0,118

0,170

0,052

30

28

25

0,254

0,250

0,004

40

48

50

0,436

0,500

0,064

50

60

60

0,545

0,600

0,055

60

65

68

0,591

0,680

0,089

70

90

88

0,818

0,880

0,072

80

105

95

0,955

0,950

0,005

90

110

100

1,000

1,000

0,000

Из последнего столбца видно, что max I) - Fni (x,• )| = 0,089.

По формуле (10.21) наблюдаемое значение статистики при п{ = 110,

п2=100 X' =, 11 °'100 • 0,089 = 0,644. По табл. 10.4 при а = 0,05 Х00,=1,36. 2 V110 + 100 1 °'03

Так как ^'<^0,05 (0,644 < 1,36), то нулевая гипотеза Н0 не отвергается, следовательно, недовесы покупателям описываются одной и той же функцией распределения, т.е. они являются устойчивым и закономерным процессом при продаже овощей в данном городе. ?

Если данные сгруппированы, то для проверки однородности двух или нескольких выборок можно использовать критерий х2.

Пусть имеется / независимых выборок объемом п, (i= 1, 2,..., /) и данные выборки сгруппированы в т интервалов (групп), а Пц — число элементов j-й выборки, попавшей в i-и интервал. Проверяется гипотеза Н0 о том, что все / выборок извлечены из одной и той же генеральной совокупности.

В качестве статистики критерия используется величина

/ т т I

где rij* = X np n*j= n = = Z n*j

7=1 /=1 /=1 7=1

В случае справедливости гипотезы #0 статистика (10.22) имеет распределение %2 с (т - 1)(/ - 1) степенями свободы.

[> Пример 10.14. По данным примера 10.13а на уровне значимости а = 0,05 проверить гипотезу Н0 об однородности двух выборок (результатов двух проверок торговых точек города).

Решении. Необходимые для расчета статистики х2 величины представлены в табл. 10.8.

Таблица 10.8

Интервалы

  • 0-
  • 10
  • 10-
  • 20
  • 20-
  • 30
  • 30-
  • 40
  • 40-
  • 50
  • 50-
  • 60
  • 60-
  • 70
  • 70-
  • 80
  • 80-
  • 90

n«j = 9

= 2>у

i=l

Частоты

«,1

П,2

  • 3
  • 5
  • 10
  • 12
  • 15
  • 8
  • 20
  • 25
  • 12
  • 10
  • 5
  • 8
  • 25
  • 20
  • 15
  • 7
  • 5
  • 5
  • 110
  • 100

2

«;- = 5>у /=1

8

22

23

45

22

13

45

22

10

« = 210

По формуле (10.22) статистика критерия

По таблице V приложений при числе степеней свободы (/ - 1 ){т - 1) = = (9 — 1 )(2 — 1) = 8 %о,о5;8 = . Так как %2 < Хо,о5;8» то гипотеза Н0 об однородности двух выборок не отвергается. ?

Наряду с рассмотренными, в математической статистике используются также ранговые критерии однородности.

Ранговые критерии однородности к выборок объемов п, основаны не на значениях признака, полученных в выборке, а на порядковых номерах (рангах)' этих значений, расположенных в порядке возрастания (убывания) и полученных после упорядочивания объединенной выборки объемом к

я = 5Л-

1=1

В критерии Вилкоксона —Манна —Уитни для проверки нулевой гипотезы однородности двух выборок #0: к](х) = Р2(х) против альтернативной //,: к(х) * Р2(х) используется статистика

где .S’,(S2) — сумма рангов наблюдений первой (второй) выборки, причем общая сумма рангов

Доказано, что если гипотеза #0 верна, то при пх —> оо, п2 —> оо и п 1п2 -> ^ <00 статистика

имеет стандартный нормальный закон N(0; 1). Поэтому гипотеза Я0 отвергается на уровне значимости а (при щ >8, и2 -8 ), если |? |>?,_а, где ?,_а определяется по табл. II приложений.

О Пример 10.14а [29]. Две группы выпускников двух высших учебных заведений (1 и 2) по 10 человек в каждой получили оценки своих административных способностей (в баллах), приведенные в табл. 10.9.

Таблица 10.9

хп

26

22

19

21

14

18

29

17

11

34

Xj'2

16

10

8

13

19

11

7

13

9

21

Можно ли утверждать на уровне значимости а = 0,05, что не существуют различия в уровне подготовки выпускников двух вузов?

1

Подробнее о рангах см. параграф 12.8.

Решение. 1. Составим упорядоченную объединенную выборку объема п = П + п2 = 10 + 10 = 20 и определим ранги оценок выпускников (табл. 10.10).

Таблица 10.10

Оценка

7

8

9

10

11

11

13

13

14

16

Номер

вуза

2

2

2

2

1

2

2

2

1

2

Ранг

1

2

3

4

5,5

5,5

7,5

7,5

9

10

Оценка

17

18

19

19

21

21

22

26

29

34

Номер

вуза

1

1

1

2

2

1

1

1

1

1

Ранг

11

12

13,5

13,5

15,5

15,5

17

18

19

20

2. Находим суммы рангов оценок для первой и второй выборок:

Проверяем выполнение равенства (10.24):

3. Находим значения статистик[1] U и t по формулам (10.23) и (10.25):

  • 4. По таблице II приложении при а = 0,05 =i095 = 1,96. Так как
  • 111 > i]_a(2,75 > 1,96), то нулевая гипотеза отвергается, т.е. уровни подготовки выпускников двух вузов существенно отличаются (в первом вузе он существенно выше, так как 5, > 52). Полученный вывод интуитивно ясен, так как в объединенной выборке низкие ранги (низкие оценки) получили преимущественно выпускники второго вуза, а высокие ранги (высокие оценки) — первого вуза. ?

Тот же принцип, что и в рассмотренном критерии, используется в других ранговых критериях однородности выборок (критерии Фишера — Йэтса, Кру скала — Уоллиса и др. (см., например, 11]).

На практике нередко приходится проверять гипотезу Н0 Fx(x) = F2(x) для зависимых выборок Х2, Хп) и (У1? Y2, ...,У77). Например, рассматривается одна и та же группа пациентов (учащихся) до и после курса лечения (обучения), и необходимо выяснить эффективность этого курса. Здесь может быть использован критерий знаков, основанный на попарном сравнении элементов выборок.

Фактически здесь имеет место выборка для двумерной случайной величины у У). Пары (Xif У,), i = 1,2, ..., п предполагаем независимыми, но компоненты внутри каждой пары могут быть зависимыми. Так, результаты лечения до и после соответствующего курса для различных пациентов можно считать независимыми, но для одного пациента они будут, очевидно, зависимыми случайными величинами.

Из проверяемой гипотезы #0 следует, что компоненты Х{ и У, одинаковы распределены. Это означает, что

Рассмотрим для каждого i случайную величину Z7 = Xt - У7 и в общем случае Z = X - У. Тогда рассматриваемая гипотеза равносильна гипотезе

Следовательно, знак любого значения Z, с вероятностью 1/2 может быть положительным (отрицательным). В качестве статистики R критерия рассматривается число значений Z7 с положительными знаками. Если гипотеза #0 верна, то R имеет биномиальное распределение (4.1) с параметрами п и р = 1 /2: значит, можно применить методы проверки гипотезы о вероятности события р0 = 1/2, изложенные в параграфе 10.6.

[> Пример 10.15. Ноток из 120 студентов был разбит на две равные группы. Занятия по математике в обеих группах проводились по единой программе, но в первой группе по ряду причин число часов занятий оказалось существенно больше, чем во второй. По результатам компьютерного тестирования получено 60 пар значений (xjf г/7), где х7, yt - тестовые баллы студентов с одинаковыми порядковыми номерами i соответственно первой и второй групп. Из них значений z7 = х{1 со знаком «+» оказалось 38. Можно ли утверждать (на уровне значимости а = 0,05), что для подготовки студентов по данной дисциплине проведение дополнительных часов занятий является эффективным?

Решение. Рассматриваем нулевую гипотезу Я0: Fx(x) = F2(x)y или P(Z = =Х- Y > О) = 1/2, частость (относительная частота) w[Z > 0) = 38/60 = 0,633. Статистика критерия (при достаточно больших значениях п) (см. последнюю строку табл. 10.2)

Так как t > tx_a = t{_005 = ?0 95 = 1,96 (для нормального закона, двусторонний критерий), то на уровне значимости а = 0,05 гипотеза Я0 отвергается, т.е. имеющиеся данные свидетельствуют об эффективности проведения дополнительных часов занятий для подготовки студентов по данной дисциплине. ?

Замечание. При небольших значениях п используемый в примере 10.15 способ проверки гипотезы Я0 неприемлем. В этом случае рекомендуется построение по малой выборке с надежностью у = 1-а доверительного интервала и р2) для доли значений Zx с положительными знаками (см. параграф 9.7), и гипотеза Я0 будет отвергаться, если значение р = 1/2 окажется вне этого интервала.

К ранговым относятся также ряд критериев проверки гипотез о стохастической независимости элементов выборки, таких как: критерий серий, основанный на медиане выборки; критерий «восходящих» и «нисходящих» серий; критерий Аббе (см. [1]). Рассмотрение вышеназванных критериев выходит за рамки данной книги.

В заключение отметим, что при проверке ряда гипотез, например, гипотез о законе распределения на заданном уровне значимости, контролируется лишь ошибка первого рода, но нельзя сделать вывод о степени риска, связанного с принятием неверной альтернативной гипотезы, т.е. с возможностью совершения ошибки второго рода.

  • [1] Если в соответствии с формулой (10.23) в качестве значения статистики U взятьU = 69,5 — — -10• 11 = 14,5, то по формуле (10.25) получим t - -2,75.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >