Проверка гипотез о параметрах распределения

Нулевая и конкурирующая гипотезы, выбор критической области

Статистическая гипотеза — это предположение о законе распределения выборки и отдельных параметров (статистик) этого распределения.

Например, можно выдвинуть гипотезу о том, что распределение производительности труда работников, выполняющих на данном предприятии одинаковую работу, имеет нормальный закон распределения. Выдвинутая гипотеза называется нулевой, обозначается через HQ. Если f(X, 0) — закон распределения случайной величины X, зависящий от параметра 0, то может быть выдвинута нулевая гипотеза о величине этого параметра, Н0: 0 = 0О.

Конкурирующей, или альтернативной, называется гипотеза, которая противоречит нулевой. Обозначается через Ни например, Нр 0 = 0а.

Задача состоит в проверке гипотезы Н0 относительно альтернативы Нх на основании выборки (ха, х2,..., хп) из п независимых наблюдений над случайной величиной X. Для конкретной задачи выбирают критерий Т (тест). Определяют так называемую критическую область К — множество значений критерия Т, при которых нулевую гипотезу Н0 отвергают в пользу альтернативы Hv

Принципы выбора области К были сформулированы в работах математиков Ю. Неймана и Э. Пирсона. Критическая область удовлетворяет условию Р(Т е К | Н0 верна) < а, а — заданный уровень значимости.

Метод проверки заключается в следующем. Для выборки определяется значение теста T=t. Если t лежит в критической области, то от гипотезы Н0 отказываются, так как осуществляется событие, имеющее малую вероятность а; если t не лежит в критической области, то данные наблюдения не противоречат выдвинутой гипотезе.

Статистика Т является случайной величиной, поэтому при проверке гипотезы Н0 можно допустить ошибки двух видов (табл. 7.1):

  • ошибку первого рода — отвержение гипотезы в случае, когда она в действительности верна. Ее вероятность а выбирается так, чтобы это событие было практически невозможно (обычно а = = 0,01, 0,02, 0,05, чем весомее потери от ошибочного отвержения Н0, тем а должна быть меньше);
  • ошибку второго рода — принятие гипотезы Н0, когда в действительности верна альтернатива Н1. Вероятность ошибки второго рода обозначается через (3. Область К обычно выбирают таким образом, чтобы при заданной а минимизировать ошибку второго рода (Р —» min).

Таблица 7.1

Типы ошибок при проверке гипотез

^''---Событие

Решение'--'^^

Н0верна

Н0 не верна (верна Hj)

Отвергнуть Н0

Ошибка 1-го рода, вероятность а

Верное решение, вероятность 1 - р (мощность критерия)

Принять Н0

Верное решение, вероятность 1 - а

Ошибка 2-го рода, вероятность (5

При уменьшении уровня значимости а критическая область К сужается. Например, пусть проверяется гипотеза Н0: р = 0 против Нр. р = pj > 0 (рис. 7.11). В данном случае Т = х, К: хкр. Может оказаться, что при начальном значении критерия t будет справедливо событие t е К, после уменьшения а (области К) станет верным событие t е. К, т.е. можно так уменьшить величину а (область К), что гипотеза Н0 не будет отвергнута. Действительно, чем меньше задается вероятность ошибки 1-го рода а, тем больше вероятность 1 - а того, что гипотеза Н0 не должна быть отвергнута.

Проверка гипотезы Н

Рис. 7.11. Проверка гипотезы Н0: р = 0 против Нр. р = рх > 0

На практике часто используют вычисленный уровень значимости Он равен вероятности ошибки 1-го рода, если за границу критической области принять вычисленное значение критерия t. Для случая, приведенного на рис. 7.11, авыч = Р(х > хВЬ1Ч | Н0 верна). Гипотеза Н0 отвергается при авыч < а.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >