Проверка гипотез о законе распределения

В предыдущем параграфе рассматривались гипотезы, относящиеся к отдельным параметрам закона распределения случайной величины. Но наиболее полной характеристикой любой случайной величины является ее закон распределения. Однако во многих практических задачах точный закон распределения неизвестен, т.е. является гипотезой, которая требует статистической проверки.

В настоящем параграфе рассмотрим некоторые методы проверки гипотез о законе распределения.

Глазомерные методы

Проверка нормальности обычно начинается с рассмотрения графика значений выборки в нормальной вероятностной шкале или висячих гистобар.

График значений выборки в нормальной вероятностной шкале строится в модифицированных осях. По горизонтальной оси откладываются значения xjt а по вертикальной — соответствующие значения аргумента теоретической функции стандартного нормального распределения Ф(г).

Для функции нормального распределения график имеет вид линейной зависимости z = (х - ц)/а. Если обозначить у = Ф(я), то 2 = Ф-!(у). Значения z откладываются в процентах. Выборочная функция распределения принимает значения Fn(x(i)) = = F„(z(i)), где z(i) = (х(|) - р)/а — нормированные варианты. Точки (x(i); Ф-1(ую)) на плоскости (х, z) соответствуют скачкам выборочной функции. По тому, насколько хорошо эти точки ложатся на теоретическую прямую линию, можно судить о нормальности выборки (рис. 7.13).

Нормальная вероятностная прямая для замеров обхвата груди школьников (скриншот Statgraphics)

Рис. 7.13. Нормальная вероятностная прямая для замеров обхвата груди школьников (скриншот Statgraphics)

Висячие гистобары позволяют по наличию пустот и провалов оценивать близость гистограммы частот с подобранным графиком плотности нормального распределения. Для этого середины верхних концов столбцов гистограмм накладывают на график плотности нормального закона. Если нижние концы столбцов лежат вблизи нулевого уровня, то данные хорошо согласуются с нормальным законом распределения (рис. 7.14).

Начать проверку на нормальность можно с вычисления выборочных коэффициентов асимметрии А и эксцесса Е и их значимости, поскольку для нормального распределения эти величины равны нулю. Их стандартные отклонения рассчитываются по формулам

где п — объем выборки.

Если выборочные коэффициенты удовлетворяют условиям

то случайная величина имеет распределение, близкое к нормальному.

Висячая гистобара для замеров обхвата груди школьников (скриншот Statgraphics)

Рис. 7.14. Висячая гистобара для замеров обхвата груди школьников (скриншот Statgraphics)

Для замеров обхвата груди школьников А = 0,064 и Е = -0,44. При п = 100 оба условия выполняются (0,064 < 0,359 и 0,499 < < 0,696).

Визуальная оценка для произвольного распределения. Насколько хорошо теоретическая кривая подобрана к выборочному распределению, можно оценить по графику гистограммы с изображенной теоретической кривой (рис. 7.15).

Гистограмма для замеров обхвата груди школьников (скриншот Statgraphics)

Рис. 7.15. Гистограмма для замеров обхвата груди школьников (скриншот Statgraphics)

В практических ситуациях, проведя, например, визуальное сравнение гистограммы с известными кривыми плотностей распределения, выдвигают гипотезу о том, что интересующий признак (случайная величина) X подчиняется теоретическому (гипотетическому) закону распределения F(x). Подобные гипотезы проверяют при помощи так называемых критериев согласия, которые характеризуют расхождение между эмпирической функцией распределения F„(x), построенной по выборке объема п, и теоретической функцией F(x). Таким образом, нулевая гипотеза может быть записана какН0: F„(x) =F(x). Это случай простой гипотезы, когда указаны конкретный закон распределения и его параметры. Если проверяется близость F„(x) к определенному множеству функций распределения — параметрическому семейству F(x; 0Х, 0,), говорят что имеет место сложная гипотеза.

К примеру, сложной является нулевая гипотеза: «X имеет нормальное распределение». Здесь 1 = 2 — два неизвестных параметра 0j = р и 02 = ст. Параметр может быть один — равный математическому ожиданию X, если проверяется сложная гипотеза о подчинении случайной величины закону Пуассона.

Существует несколько критериев согласия. Чаще всего используются критерии х2 Пирсона и Колмогорова — Смирнова.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >