Определение параметров закона распределения результатов наблюдений по статистическим критериям

Проверка нормальности распределения по критерию Пирсона

Проверка гипотезы о предполагаемом законе неизвестного распределения производится так же, как проверка гипотезы о параметрах распределения, т. е. при помощи специально подобранной случайной величины - критерия согласия.

Критерием согласия называют [2] критерий проверки гипотезы о предполагаемом законе неизвестного распределения.

Среди наиболее известных критериев следует отметить критерий Пирсона /2, критерий Колмогорова, составной критерий (I, критерий Мизсса - Смирнова 2.

Ограничимся описанием применения критериев Пирсона и составного критерия , применяемых в метрологической практике, для проверки гипотезы о нормальном распределении генеральной совокупности. Следует отметить, что критерий Пирсона применяется и для других распределений (в этом состоит его достоинство).

Критерий Пирсона отвечает на вопрос случайно (незначимо) или неслучайно (значимо) расхождение эмпирических и теоретических частот попаданий в заданный интервал. Случайность может быть объяснима либо малым числом наблюдений, либо способом их группировки, либо другими причинами. Однако возможно это расхождение неслучайно и объясняется тем, что теоретические частоты вычислены исходя из неверной гипотезы о нормальном распределении генеральной совокупности. Правда, как и любой другой критерий, он нс доказывает справедливость гипотезы, а лишь устанавливает на принятом уровне значимости ее согласие или несогласие с данными наблюдений.

В качестве критерия проверки нулевой гипотезы («генеральная совокупность распределена нормально») принимается случайная величина, определяемая по формуле:

где п1 - эмпирические частоты в некоторой выборке (серии результатов измерений);

п - теоретические частоты, вычисленные в предположении нормально-распределенной генеральной совокупности.

Для непрерывной случайной величины (какой может результат измерения) проверку принадлежности нормальному распределению по критерию Пирсона проводят, используя формулу:

где т1 - эмпирическая частота попадания исправленных результатов наблюдений в 1-й интервал;

/?•/>,-теоретическая (выравнивающая) частота попадания исправленных результатов наблюдений в этот же интервал;

Р/ - вероятность попадания X в /-й частичный интервал, вычисленная при допущении, что X имеет предполагаемое распределение.

Таким образом, выравнивающие частоты непрерывного распределения находят по равенству: п? =п -Рг

В частности если основания предположить, что непрерывной случайной величины принадлежат нормально распределенной генеральной совокупности, то выравнивающие частоты могут быть найдены по формуле:

где п - число испытаний (серия наблюдений при измерениях);

А - длина частичного интервала;

5 - выборочное среднее квадратическое отклонение (оценка СКО);

- ( X/ - середина /-го частичного интервала).

Методика представления вариационного ряда интервальным представлена в разделе 5 пособия. Напомним, что плотность общего нормального распределения /(х) и плотность нормированного распределения <р(и) связаны между собой следующей зависимостью:

В приложении Г (таблица Г. 1) приведены значения дифференциальной функции нормированного нормального распределения.

Таким образом, вероятность попадания результатов наблюдения в /-ый интервал длиной И приближенно равна произведению длины интервала на значение плотности распределения /(л) в любой точке интервала и, в частности, при х = хп т.е.:

Число степеней свободы находят по равенству:

где 5 - число групп (частичных интервалов выборки);

г - число параметров предполагаемого распределения, которые оценены по данным выборки.

В случае нормального распределения г-2 (математического ожидания и среднее квадратическое отклонение), тогда к = 5 -3.

При определении меры расхождения Пирсона исходные данные группируются как при построении гистограммы.

Однако, рекомендуется, что бы каждая группа содержала не менее 5-8 частот (вариант); малочисленные группы следует объединять в одну, суммируя эмпирические частоты.

Найденная мера расхождения сравнивается с табличной, найденной из таблицы Ж. 1 приложения Ж. Для этого задаются уровнем значимости а( 1 - р (рекомендуется выбирать = (0,1 -0,02), а число степеней свободы определяют как к —г- 3. Гипотеза о принадлежности эмпирического распределения подтверждается, если выполняется условие:

Следует отметить, односторонний критерий более «жестко» отвергает нулевую гипотезу, чем двусторонний, построим правосторонний, построим правостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в область в предположении справедливости нулевой гипотезы была в предположении справедливости нулевой гипотезы была равна принятому уровню значимости q.

Таким образом, правосторонняя критическая область определяется неравенством %2 > ^(^к), а область принятия нулевой гипотезы -

неравенством < Хкр (#; к).

Критерий х1 основан на группировке данных и нс учитывает порядка отклонений частот эмпирического и теоретического распределений.

Поскольку возможны ошибки первого и второго рода, в особенности, если согласование теоретических и эмпирических частот «слишком хорошее», следует проявлять осторожность в окончательной оценке принадлежности к нормальному закону распределения. При этом рекомендуется либо повторить измерительную процедуру (если установлена технико-экономическая целесообразность), увеличить число наблюдений, воспользоваться другими критериями, вычислить асимметрию и эксцесс. Некоторые из методов рассматриваются дальше.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >