Проверка гипотезы о нормальном распределении генеральной совокупности

1. Пусть случайная величина X задана в виде равноотстоящих вариант х, и соответствующих им частот т, (табл. 9.4).

Таблица 9.4. Табличное задание вариант и частот_

X

XI

XI

Хз

Хк

т

т

тг

т,

пн,

Требуется при заданном уровне значимости а проверить нулевую гипотезу Но о принадлежности генеральной совокупности нормальному закону распределения. Проверку гипотезы Но проводят следующим образом. За наблюдаемое значение критерия случайной величины принимают критерий Пирсона

где /и,0 = —(р(и,) - теоретические частоты; «-объем выборки; h- разность между двумя соседними вариантами; <р(и,) - функция

Л' — X

Гаусса (см. таблицу прил. 1); и, = ' в ; хв - выборочная средняя;

S - исправленное среднее квадратичное отклонение.

По выборке вычисляют хв и S. Затем рассчитывают теоретические частоты /и,0. Наблюдаемое значение критерия К^т вычисляют по формуле (9.6). По таблице прил. 10 при заданном уровне значимости а и числу степеней свободы к =1-3, где / - число пар (х,,т,), находят критическую точку /^„р . Если К^п то нулевая гипотеза о нормальном распределении

принимается, а если К^т > А^рпр — отвергается.

Объем выборки должен быть достаточно велик (п > 50). Каждая пара (х„т,) должна содержать число частот /и, >5, а малочисленные пары следует объединять в несколько пар, пока данное условие не будет выполнено. При этом частозы т, и т° суммируются, а число I следует принять равным числу пар после объединения.

Пример 9.13. Используя критерий Пирсона, при уровне значимости а = 0,05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности по результатам выборки объема п = 100 (табл. 9.5).

Таблица 9.5. Статистический ряд распределения частот

X

156

160

164

168

172

176

т

10

14

26

28

12

10

Решение. Сформулируем гипотезы согласно условию примера. Но'. Случайная величина генеральной совокупности X распределена по нормальному закону.

Н Случайная величина X генеральной совокупности не распределена по нормальному закону.

Вычислим выборочную среднюю

выборочную исправленную дисперсию

исправленное среднее квадратичное отклонение

Составим расчетную табл. 9.6, для этого:

  • а) запишем числовые значения х, выборки в первую графу;
  • б) используя параметры распределения (xt,S), вычислим значения и, = (дг, -xB)/S, которые поместим во вторую графу;
  • в) найденные из таблицы прил. 1 значения ip(а,) поместим в третью графу;
  • г) вычислим теоретические частоты по формуле т? = nhq(u,) / S, где и = 100 —объем выборки; h = 4 - ширина интервала;
  • д) поместим эмпирические т, и теоретические частоты /и,0 в четвертые и пятые графы соответственно.

Таблица 9.6. Расчетная таблица эмпирических и теоретических частот

=166

5 = 5,64, h = 4 и, =(х,-x,)/S

фОч)

т,

т°,

(т, - /и,0)2 ",°

156

-1,77

0,0833

10

5,9

2,85

160

-1,06

0,2275

14

16,1

0,27

164

-0,35

0,3752

26

26,6

0,01

168

0,35

0,3752

28

26,6

0,07

172

1,06

0,2275

12

16,1

1,04

176

1,77

0,0833

10

5,9

2,85

Сумма

Klen =7.09

Используя данные шестой графы табл. 9.6, найдем наблюдаемое значение критерия

По таблице прил. 10 при уровне значимости а = 0,05 и по числу степеней свободы к=1-3 = 6- 3 = 3 находим критическую точку правосторонней критической области

Наблюдаемое значение критерия меньше АГ~р |1р (А^,, =

= 7,09 < 7,80 = Klv ,ч, ) и попадает в область принятия нулевой гипотезы Но (рис. 9.14, а). Поэтому при уровне значимости а = 0,05 гипотезу о нормальном распределении случайной величины ^принимаем.

2. Пусть исследуемое распределение признака X задано в виде последовательности интервалов одинаковой длины (шага) и соответствующих им частот т,, а значениями вариант являются средние значения х, для каждого /-го интервала (табл. 9.7).

Таблица 9.7. Статистический интервальный ряд распределения

Интервалы группировки, (jt,,Xj+i)

[*0ДГ|)

1>1Д2)

[тзДз)

Wist)

Средняя, х

*1

*2

*3

**

Частота, т

т

т2

«3

т/с

Требуется установить при заданном уровне значимости а (доверительной вероятности у = 1-а) принадлежность статистической совокупности нормальному закону.

Подчеркнем, что объем исследуемой выборки должен быть достаточно велик (п > 50), а число интервалов не менее четырех. Малочисленные эмпирические частоты (т, < 5) рекомендуется объединить с соседним интервалом, при этом соответствующие им теоретические частоты ю,° также складываются, а число / следует принять равным числу интервалов после объединения.

Пример 9.14. При 54-кратном измерении радиуса эритроцита получили выборку, мкм: 3,70, 3,85, 3,7, 3,78, 3,60,4,45, 4,20, 3,87, 3,33, 3,76, 3,75, 4,03, 3,80, 4,75, 3,25, 4,10, 3,55, 3,35, 3,38, 3,05, 3,56,

4,05, 3,24, 4,08, 3,58, 3,98, 3,40, 3,80, 3,06, 4,38, 3,10, 3,15, 3,25, 3,35, 3,45, 3,40, 3,60, 3,65, 3,70, 3,80, 3,80, 3,95, 4,05, 4,20, 4,15, 4,20, 4,30, 4,35, 4,50, 4,55, 4,65, 4,70, 4,75, 4,30. Проверить при уровне значимости а = 0,05 справедливость гипотезы о нормальном распределении радиуса эритроцитов.

Решение. Сформулируем нулевую и конкурирующую гипотезы согласно условию примера.

Но: Радиус эритроцитов является случайной величиной X, подчиняющейся нормальному закону распределения.

Н Радиус эритроцитов является случайной величиной X, не подчиняющейся нормальному закону распределения

Составим интервальный ряд распределения. Наименьший радиус эритроцита равен 3,05, а наибольший - 4,75. Примем значения границ а = хтт = 3:Ь = х11т =4,8. Число интервалов определим по формуле /V>l + 3,321g« = 6, а их шаг И = = (*max -*min)/N = (4-8 - 3,0) / 6 = 0,3. Рассчитаем центры равноотстоящих вариант по формуле х, =(х,+х,л)/2 для каждого /'-го интервала. Найдем частоты пн, соответствующие каждому /-му интервалу. Результаты расчетов представлены в табл. 9.8.

Вычислим выборочную среднюю выборочную исправленную дисперсию

Таблица 9.8. Статистический интервальный ряд распределения ча- стот радиуса эритроцитов_____

Интервалы

группировки

[3,0;3,3)

[3,3;3,6)

[3,6;3,9)

[3,9;4,2)

[4,2;4,5)

[4,5;4,8]

Средняя, х

3,15

3,45

3,75

4,05

4,35

4,65

Частота, т

7

11

14

9

7

6

исправленное среднее квадратичное отклонение Рассчитаем теоретические частоты по формуле

где и = 54; й = 0,30.

Результаты вычислений представим в виде табл. 9.9, где эмпирические частоты т, помещены в четвертую графу.

Таблица 9.9. Расчетная таблица эмпирических и теоретических частот

X,

=3,84 S = 0,46 и,=(х,-xJ/S

Ч>(«,)

т,

3,15

-1,50

0,1295

7

4,6

1,25

3,45

-0,85

0.2780

11

9,8

0,15

3,75

-0,20

0,3910

14

13,8

0,00

4,05

0,46

0,3589

9

12,6

1,03

4,35

1,11

0,2155

7

7,6

0,05

4,65

1,76

0,0848

6

3,0

3,00

Сумма

5,48

По данным табл. 9.9 в последней графе путем суммирования находим наблюдаемое значение критерия

По таблице прил. 10 при уровне значимости а = 0,05 и числе степеней свободы к = 1- 3 = 6- 3= 3 найдем правостороннюю критическую границу

Так как К^а = 5,48 < 7,80 = K2f [ф [критическая точка „р попадает в область принятия Но (рис. 9.14, б)], то при заданном уровне значимости а = 0,05 нулевая гипотеза Н0 не противоречит опытным данным, т.е. значения радиуса эритроцитов распределены по нормальному закону.

Область принятия и отклонения нулевой гипотезы

Рис. 9.14. Область принятия и отклонения нулевой гипотезы

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >