Оценка достоверности различий между фактическими и теоретическими ожидаемыми данными методом хи-квадрат (χ2)

Критерий хи-квадрат («критерий соответствия», «критерий Пирсона») используется для проверки гипотез путем сравнения фактического распределения с теоретическим. Вычисление критерия соответствия также основано на принципах нулевой гипотезы, которая предполагает, что между сравниваемыми частотами сопоставляемых рядов нет достоверных различий. С помощью этого метода можно оценить, являются ли отклонения, наблюдаемые в опыте, случайными. Если отклонения оказываются неслучайными, эксперимент следует повторить, а также применить другие методы генетического исследования.

Метод х2 не может быть применен, если значения величин в опыте (количество объектов в классах) выражены в процентах или в относительных числах (долях), а также если в выборке число особей в каком- либо из теоретических классов меньше пяти (оптимальным считается число особей не менее 50).

Критерий х2 вычисляется по формулам

где Ф — фактическое число особей, Т — теоретически ожидаемое число особей; член 0,5 — поправка Йетса (на нее уменьшается абсолютная величина значения Ф-Т). Если п и ожидаемые величины велики, то пользуются первой формулой (без поправки).

Вычисление критерия соответствия основано на принципах нулевой гипотезы, которая предполагает, что между частотами сопоставляемых вариационных рядов нет достоверной разности, следовательно, оба вариационных ряда являются выборками из одной генеральной совокупности. Если же частоты сравниваемых рядов достоверно различаются между собой, то ряды принадлежат разным генеральным совокупностям, нулевая гипотеза отвергается и принимается альтернативная ей гипотеза.

Для доказательства достоверности разности между частотами двух рядов сопоставляют величину у}, вычисленную по конкретным данным (Хфакт), со стандартными значениями хи-квадрат (х?еор)> с учетом числа степеней свободы v (см. приложение 2). Если вычисленное нами значение Хфакт больше стандартного (х?еор) ПРИ значимости Р- 0,01 и Р = 0,001, то считают, что гипотеза не согласуется с полученными в опыте данными. В таких случаях нулевая гипотеза должна быть отброшена. Если вычисленная величина Хфакт < Хтеор ПРИ Р = 0,01, но больше нее при значимости Р = 0,05, то согласие наблюдаемых данных с ожидаемыми являются сомнительными. Однако это не дает права отбросить нулевую гипотезу. Если же Хфакт <Хтеор ПРИ Р = 0,05, то соответствие наблюдаемых данных с ожидаемыми считается установленным.

Величина х2 зависит от числа степеней свободы (v). Поэтому для каждого значения вероятности (Р) дано несколько значений у2, расположенных в приложении под определенным уровнем значимости.

Пример. Использование х2 при изучении наследования качественных признаков. В опыте по моногибридному скрещиванию изучали наследование нормальных и зачаточных крыльев у плодовой мушки Drosophila melanogaster. Анализировали F2 от скрещивания родительских форм, различающихся между собой по форме крыльев:

В Fj от реципрокных вариантов скрещивания наблюдалось единообразие: все мухи были с нормальными крыльями. При анализе F2 получены следующие результаты: 285 мух с нормальными крыльями и 91 — с зачаточными.

Найдем теоретически ожидаемые результаты. Предполагалось расщепление 3:1. Рассчитаем количество мух в каждом классе, которое бы точно соответствовало этому соотношению. Сложим общее количество объектов и разделим на 4, узнав, сколько объектов приходится соответственно на одну и на три части: 285 + 91 = 376. Ожидаемые результаты — 282 : 94. Все расчеты оформляются в таблицу (табл. 7.6).

Вычисление у2 при изучении наследования качественных признаков

Класс

Данные опыта (Ф)

Теоретически ожидаемые (Т)

(Ф-Т)

(ф _ Т)2

(Ф-Т)2

т

X2

Нормальные

крылья

285

282

+3

9

0,03

0,12

Зачаточные

крылья

91

94

-3

9

0,09

В рассматриваемом нами примере число степеней свободы (v) на единицу меньше числа классову = Z -1 = 2-1 = 1, где I — число классов. Следовательно, для решения задачи нужно использовать из приложения уровни «вероятности» и строку «V = 1». В этой строке стоят три значения %2абл {3,8—6,6—10,8}. Вычисленное значение у} значительно меньше табличных. Следовательно, наблюдаемое в опыте расщепление соответствует ожидаемому, поэтому нулевая гипотеза, т. е. расщепление в соотношении 3:1, остается в силе (0,12<3,8; разность недостоверна).

Пример. Использование критерия у2 при определении достоверности различий между двумя группами животных. Предположим, требуется оценить результаты испытания нового препарата для предупреждения инфекционного заболевания кроликов. Из 50 кроликов 20 получали профилактический препарат (опытная группа), а 30 — не получали (контрольная группа). В опытной группе заболело семь особей, а 13 остались здоровыми. В контрольной группе заболело 14 кроликов, остались здоровыми 16. Доказывают ли результаты опыта профилактическое действие препарата, или различие в числе заболевших кроликов зависит не от введения препарата, а от случайных причин? Обработка материала приведена в табл. 7.7.

Таблица 7.7

Расчет критерия у} при определении достоверности различия между двумя группами

Группа

животных

Число заболевших

Число здоровых

Всего

наблюдаемых (Ф)

теоретически ожидаемых (Т)

наблюдаемых (Ф)

теоретически ожидаемых (Т)

Опытная

7

8,4 (Тх)

13

11,6 (Т2)

20

Контрольная

14

12,6 (Т3)

16

17,4 (Т4)

30

Итого

21

21

29

29

50

Теоретически ожидаемые частоты Т для заболевших и здоровых животных в опытной и контрольной группах составляют:

[(ф — т) — 0 5]2

Подставив полученные данные в формулу х2 =--—1—, получим:

При расчетах по четырехпольным таблицам число степеней свободы равно единице. Сравнивая полученное значение х2 со стандартным, находим, что вычисленная величина (0,26) меньше стандартныхзначений в строке таблицы, соответствующей одной степени свободы. Следовательно, оснований для того, чтобы отбросить нулевую гипотезу, нет, т. е. профилактическое действие препарата не может считаться доказанным.

Пример. Применение критерия хи-квадрат при сравнении частот двух эмпирических рядов между собой. Требуется сопоставить методом х2 частоты распределения коров-матерей черно-пестрой породы и коров-дочерей помесного происхождения от отцов голштинской породы по форме вымени. Вариационные ряды по матерям и дочерям подразделяют на четыре класса в зависимости от формы вымени (чашевидное, ваннообразное, округлое и козье). Обследовано 200 коров- матерей и 210 их дочерей — помесей первого поколения от голштинских быков. Результаты обследования коров обеих групп приведены в табл. 7.8. Нулевой гипотезой для этого примера служит предположение, что скрещивание не приводит к улучшению формы вымени.

В этом случае следует использовать формулу

Здесь по каждому классу частоты первого ряда умножают на общее число наблюдений второго ряда (Рх п2), а частоты второго ряда — на общее число наблюдений первого ряда (Р2щ). Полученную разность возводят в квадрат и делят на сумму частот этого класса по обоим рядам (Pi • п22щ)2 : (Р1 + Р2). Сумма дробей по всем классам ряда умножают на коэффициент 1/п! + п2, получая в результате искомую величину у}.

Подставляя числовые значения в формулу получаем эмпирическую величину у2:

Число степеней свободы v = /-l = 4-l = 3. Табличное Хо,о5=7>81. Вычисленное х2 по конкретным данным примера равно 3,2, т. е. меньше теоретического (х2 = 7,81), следовательно, скрещивание с голштинскими быками несущественно повлияло на форму вымени коров- дочерей, т. е. сохраняется нулевая гипотеза (Н0).

Сравнение распределения коров по форме вымени методом у2

Форма вымени

Вариационные ряды (Р)

Pi *2

Р2 Щ

  • г п22 гц)2
  • (Pl+P2)

матери

дочери

Чашевидное

30

50

30-210 = 6300

50-200 = 10000

  • (6300-10 ООО)2
  • --— = 33390
  • 410

Ваннообразное

50

70

50-210 = 10 500

70-200 = 14000

(10 500-14000)2

= 29878

410

Округлое

100

80

100-210 = 21000

80-200 = 16000

(21000-16 000)2 410

Козье

20

10

20-210 = 4200

10-200 = 2000

  • (4200-200»*
  • 410

Всего

I Pi =200,

ХР2=2Ю;

число классов 1 = 4.

Задания для самостоятельной работы

Задание 1. В результате спаривания кур, имеющих листовидный гребень, с гетерозиготным петухом, гребень у которого розовидный, получено 106 цыплят с розовидным и 120 — с листовидным гребнем. При нулевой гипотезе, согласно которой данная пара признаков зависит от одной пары генов, в потомстве ожидается расщепление в соотношении 1:1. Вычислить критерий хи-квадрат и оценить соответствие между наблюдаемым и ожидаемым расщеплением.

Задание 2. Между собой спарены помеси первого поколения от черных гемпширских свиней и красного дюрок-джерсейского хряка. Среди помесного потомства был 81 поросенок черной масти и 26 — красной. При нулевой гипотезе (масть обусловлена одной парой генов) ожидается расщепление по масти в соотношении три особи черных и одна красная. Вычислить критерий хи-квадрат и оценить соответствие между наблюдаемыми и ожидаемыми данными.

Задание 3. При изучении защитного действия индол-3-пропио- гидросамовой кислоты и экспериментальном заражении кроликов болезнью Ауески из 20 особей выжило восемь, пало 12, а при изучении терапевтического эффекта из 17 кроликов выжило шесть, пало 11. Проверьте гипотезу об эффективности терапевтического и защитного действия этого препарата.

Задание 4. Имеются мыши двух линий: высоколейкозной (AKR) и низколейкозной (СС57Вг). В обычных условиях из 44 мышей в линии AKR выжило 22, пало 22; из 35 мышей линии СС57Вг выжило 29, пало шесть. Оцените методом хи-квадрат, достоверно ли различие между линиями.

Задание 5. При испытании нового антибиотика на кроликах, больных пневмонией, получены следующие результаты: из больных, принимавших антибиотик, выжило 65, пало 25 животных; из не получавших антибиотик выжило 35 пало 25. Оцените, достоверно ли лечебное действие препарата.

Задание 6. Определить с помощью критерия хи-квадрат соответствие между наблюдаемым и ожидаемым распределением коров красной степной породы по типам лактоглобулинов (Lg) молока. Наблюдаемое распределение: LgA был у 26 особей, LgB — у 271 особи и LgAB — у 202 особей. Ожидаемое распределение: LgA — 0,065; LgB — 0,555; LgAB — 0,380.

Задание 7. Определить соответствие между наблюдаемым и ожидаемым распределением буйволов по типам трансферринов (Tf) сыворотки крови. Наблюдаемое распределение: TfA найдено в сыворотке крови 21 животного, TfB — в сыворотке крови 135, a TfAB — в сывортке 105 животных. Ожидаемое распределение: TfA — 0,079; TfB — 0,517; TfAB — 0,404.

Задание 8. Изучено наличие антигенов системы группы крови С у зебувидного скота и у его гибридов со швицами:

  • 1) антиген Сх обнаружен у 11 из 23 зебувидных коров, а у гибридов — 43 из 68. Оценить с помощью критерия хи-квадрат, достоверно ли различие по сравниваемому антигену между этими популяциями;
  • 2) оценить на основании следующих данных различие по антигену С2: у зебувидного скота антиген С2 обнаружен у 12 из 33 коров, а у гибридов — у 43 из 48.

Задание 9. Вычислить критерий соответствия (хи-квадрат), если во втором поколении моногибридного скрещивания, состоящем из 8024 особей, получено 6023 особи с доминантным признаком и 2001 особь с рецессивным. Согласно теории, ожидается расщепление 3:1.

Задание 10. Для повышения оплодотворяемости коров, в сперму быка рекомендуют добавлять биостимулятор. Из 441 коровы, осемененной обработанной биостимулятором спермой, оплодотворилось 301. В контроле (сперма без биостимулятора) из 352 оплодотворилось 216 животных. Оцените методом хи-квадрат, достоверно ли действие биостимулятора.

Задание 11. У кур розовидная форма гребня доминирует над простой. При скрещивании кур с розовидной формой гребня между собой в потомстве получилось 705 — с розовидной формой гребня и 224 — с простой. Соответствует ли расщепление по фенотипу, полученное у потомков, теоретически ожидаемому?

Контрольные вопросы

  • 1. Что такое ошибки репрезентативности? Чем они отличаются от ошибок вычисления и измерения?
  • 2. Как вычисляют ошибку средней арифметической величины? Что она показывает?
  • 3. Приведите формулы вычисления ошибок a, cv, г, R, d.
  • 4. Как изменяется величина тх при изменении объема выборки и величины сигмы?
  • 5. Что такое доверительные вероятности? Какие доверительные вероятности используют в биологических, зоотехнических и ветеринарных исследованиях?
  • 6. Как определяется достоверность выборочных показателей?
  • 7. Как оценивается достоверность разности между средними величинами двух выборок?
  • 8. Как определяют доверительные границы при работе с большими и малыми выборками?
  • 9. Как определяют необходимый объем выборки?
  • 10. Что такое критерий соответствия (хи-квадрат) ?Как он используется в генетических исследованиях?
  • 11. От чего зависит величина ошибки средней арифметической?
  • 12. Какое существует правило записи статистической величины и ее ошибки?
  • 13. Что показывает td?
  • 14. Как определяют уровень достоверности?
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >