Сравнение выборочной дисперсии с гипотетической генеральной дисперсией

Проверка гипотезы строится таким образом, что выборочная дисперсия S2 является несмещенной оценкой собственно генеральной дисперсии, которая определяется либо из предыдущего опыта, либо из неких теоретических соображений. Иными словами, имеем

Например, по данным выборки п = 15 получена исправленная выборочная дисперсия S2 = 7,1. Имеются сведения, что С7р = 8,2. В качестве критерия используется хи-квадрат

Число степеней свободы определяется как п - 1; уровень значимости как обычно, например 0,05. Подставляя конкретные значения в формулу, имеем

Фактическое значение критерия меньше табличного. Следовательно, делается вывод, что нет основания отклонить нулевую гипотезу, иными словами, расхождение между гипотетической (неизвестной) генеральной дисперсией и выборочной незначимо.

Критерий хи-квадрат широко используется в статистике для решения разных задач: в корреляционном анализе для измерения тесноты связи; при сравнении генеральной и выборочной дисперсии; в качестве критерия согласованности эмпирических и теоретических рядов и др.

Рассмотрим еще одно применение критерия хи-квадрат при сравнении частот двух вариационных рядов одинаковой численности, или, иначе, двух эмпирических распределений. При этом возможны два случая: а) с одинаковой суммой частот и б) с разной суммой частот. Рассмотрим пример по оценке подготовки школьников к математической олимпиаде в двух городах: А и Б (табл. 8.8).

Таблица 8.8

Данные но оценке подготовки школьников

Оценка в баллах

Количество школьников

в городе А, /а

в городе Б, /б

1

13

7

36

20

1,8

2

29

21

64

50

1,28

3

44

30

196

74

2,65

4

19

42

529

61

8,67

5

10

17

49

27

1,82

6

8

6

4

14

0,29

123

123

246

16,51

Критериальная статистика (случайная величина) имеет вид

Подставляя полученные значения из таблицы, получаем %факт = = 16,51. Проверим нуль-гипотезу о совпадении распределения школьников по полученным оценкам в двух городах. Количество степеней свободы определяется как п - 1. В нашем случае = 6 - 1 = = 5. По таблице распределения хи-квадрат находим х? 0 05 = И>07 и %i; o,oi = 15,09. Вывод: нулевую гипотезу об отсутствии различий в подготовке школьников следует отклонить в пользу альтернативной. Различие значимо.

Кстати заметим, что если бы в этом примере мы решили применить критерий для разности двух средних величин

то после соответствующих подсчетов мы бы получили хА = 3,07, хБ = 3,48, Од = 1,723, а| = 1,5 и соответственно Г(|)акт = 2,56. Табличное значение при односторонней проверке и а = 0,01 ГТабл = 2,33 (см. таблицу интеграла вероятностей), и вывод был бы тем же самым, различие в степени подготовки школьников городов А и Б существенное, школьники города Б подготовлены лучше.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >