Примеры проверки статистических гипотез

Ниже приводятся три примера проверки статистических гипотез. Необходимо строго придерживаться конкретных условий, которые даны, и формул, по которым проводится проверка. Гипотезы таковы: 1) гипотеза о равенстве средних величин при известных дисперсиях (большие независимые выборки); 2) гипотеза о равенстве дисперсий двух выборок (малые выборки); 3) гипотеза о равенстве двух выборочных долей (большие выборки).

Этапы работы:

  • • Выдвигаются нулевая и конкурирующая гипотезы, а также определяется, односторонняя или двусторонняя проверка будет применяться.
  • • Определяется ошибка I рода а (чаще всего от 1 до 10%) и в зависимости от характера проверки фиксируется критическая точка Гкр (например, при вероятности а = 0,05 при односторонней проверке Ткр = 1,65, а при двусторонней Ткр = 1,96) (таблица интеграла вероятностей).
  • • Рассчитываются фактические значения критерия 7ф.
  • • Сравниваются 7% и Гкр, и затем делается вывод. Возможны 3 ситуации:
    • а) 7’| >Гкр: 770 отклоняется;
    • б) Гф<Гкр: /70 принимается;
    • в) Тф~Ткр. необходимо продолжить исследование на другом материале и (или) увеличить объем выборки.

Пример 7.4. В двух случайных выборках работников численностью пх = 27 и п2 - 33 средняя выработка за смену составляет х,=10, х2 = 11,5ед. соответственно при дисперсиях с( =3,3 и о = 4,89. Можно ли считать такое расхождение случайным или же оно является следствием различных условий организации труда?

Решение

Ошибку I рода а принимаем на уровне 5%. Нулевая гипотеза Я0: .г, = х2; альтернативная //,: Г, фх2, т.е. либо хх2, либо х, < х2.

Выписываем формулу критической статистики и находим фактическое значение Гф:

Приняв уровень значимости а = 5%, мы тем самым определили критическую точку, разделяющую область принятия Я0 от области ее отклонения. По таблице интеграла вероятностей и при доверительной вероятности 1 - 0,05 = 0,95 находим Ткр = 1,96. Т^> Ткр, т.е. Гф = 2,88 попадает в критическую зону, отклоняя тем самым нулевую гипотезу. Сам факт отклонения гипотезы #0 не означает, что она является ложной. Напомним, что принятый нами уровень 5%, или 0,05, означает, что в 5 случаях из 100 мы рискуем допустить а, т.е. отвергнуть верную гипотезу (рис. 7.1 и 7.2).

Двусторонняя критическая область при а = 0,05

Рис. 7.1. Двусторонняя критическая область при а = 0,05

Односторонняя критическая область при а = 0,05

Рис. 7.2. Односторонняя критическая область при а = 0,05

Пример 7.5. Известны объемы и выборочные исправленные дисперсии двух выборок: п{ = 9; s2 = 1,4 и п2 = 12; s2 = 4,7. На уровне значимости 0,05 необходимо проверить гипотезу #о: o'=al против конкурирующей гипотезыЯр

Решение

Проверяем гипотезу #0: а^ = а^ генеральной совокупности.

Рассчитываем фактические значения критерия F Фишера — Снедекора (большая дисперсия всегда в числителе) и получаем

Из таблицы критических точек F-распределения Фишера (табл. П2.13) находим FKp = 3,31. При а = 0,05 FKp > F^. Вывод: нет основания отклонить Я0 о равенстве дисперсии, различия между дисперсиями несущественные, случайные.

Пример 7.6. Проводились клинические испытания нового лекарства. В выборке участвовало 830 мужчин и 945 женщин. У 36 мужчин и 60 женщин наблюдались неблагоприятные побочные явления. Можно ли утверждать, что у женщин побочные явления возникают чаще?

Решение

Введем обозначения: пм = 830; пж = 945.

Доля (%) мужчин с побочными явлениями ры = 36/830 = = 0,0433 (4,33%); доля (%) женщин с побочными явлениями рж = 65/945 = 0,0688 (6,88%). р — средняя доля мужчин и женщин, имеющих побочные явления: р = (36 + 60) /1775 = = 0,054; q = -p = 0,946; p-q = 0,051. Статистика имеет следующий вид:

Уровень значимости 0,03 (3%), проверка двусторонняя. Подставляем в формулу полученные значения и получаем Гф = 2,32. Учитывая выбранный нами уровень значимости 0,03, по таблице интеграла вероятности находим 1 - 0,03 = 0,97, Гкр = 2,17.

Вывод: Тф превышает Ткр и попадает в критическую зону (правее точки 2,17), тем самым отвергая Я0: рм = рж. Мы принимаем конкурирующую Яр рмж, т.е. мы вправе сделать вывод, что лекарство действует по-разному на мужчин и женщин и что различие нс является случайным, такой вывод сделан с вероятностью 0,97.

Заметим, кстати, что если бы мы сформулировали Яр Рж > Ры’ т0 вывод был бы тем же самым. При 3%-ном уровне значимости Гкр при односторонней проверке равно 1,89. Двусторонняя проверка более «строгая», нежели односторонняя. Рубеж 2,17 преодолеть труднее, чем 1,89. Будет ли проведена односторонняя или двусторонняя проверка — решается по смыслу самой задачи, т.е. нас интересует факт различия в обе стороны или только в одну.

В заключение приведем пример ситуации, когда Я0 нельзя отклонить.

Пример 7.7. По многолетним данным средний проходной балл составлял 50 с дисперсией 151,3. Многие эксперты считали, что величина балла несколько занижена (что ведет к набору слабо подготовленных школьников) и предлагали поднять планку до 54. Для проверки этого предположения была произведена случайная выборка п = 30 школьников, которые набрали хв = 54. Необходимо проверить, существенно ли различие хг - 50 и Зсв = 54 при уровне значимости а = 0,02 (2%), правосторонняя проверка; Я0: JB = Jr; Яр 3?вг:

Вывод: Я0 отклонить не удалось. Проходной балл остается х - 50. А что если на самом деле верна Яр хг = 54, т.е. школьники теперь лучше подготовлены? Если эго гак, то, принимая Я0, мы допускаем ошибку II рода р (вероятность принять неверную гипотезу). Ошибку Р и мощность критерия М = 1 - р можно посчитать по-разному. В нашем случае М = 0,5 - Ф (2,06 - 1,78) = 0,5 - Ф (0,28) = 0,39; р = 0,61. Это вероятность того, что нс будет ошибочно принята ложная гипотеза Я0: х = 50.

При одновременном фиксировании а и Р до проведения выборочного исследования необходимо определить требуемы й объем выборки, что может быть сделано применением к нашим условиям (а = 0,02; р = 0,61; п = 30). Если бы мы при-

апо о а< °2(fa-fB)2 151,3 (2,06 +1,29)2 ,Л?.

няли а = 0,02, р = 0,1, то п = ——=r!L— =--—--— = 106,

(%-*г)2 42

т.е. объем выборки следовало бы увеличить в 3,5 раза.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >