Множественные сравнения с контрольной группой

Иногда задача заключается в том, чтобы сравнить несколько групп с единственной — контрольной. Для этого существуют специальные методы сравнения — это модификация критерия Стьюдента с поправкой Бонферрони и критерий Даннета. Как и другие методы множественного сравнения, их применяют только после того, как с помощью дисперсионного анализа отвергнута нулевая гипотеза о равенстве всех средних.

Критерий Даннета:

где I — число всех групп, включая контрольную; RK0H — сумма рангов в контрольной группе.

Остальные величины определяются, как в формуле для q. Значение q' сравнивается с критическим (табличным) для бесконечного числа степеней свободы.

Критерий Даннета — это вариант критерия Ньюмена — Кейлса для сравнения нескольких групп с одной контрольной. Он вычисляется как

Число сравнений равно числу групп, не считая контрольной, и существенно меньше числа сравнений в исходном критерии Ньюмена — Кейлса. Соответственно меньше и критические значения, как и в критерии Ньюмена — Кейлса, сначала средние значения для всех групп упорядочиваются, но только теперь — по абсолютной величине их отличия от контрольной группы. Затем контрольную группу сравнивают с остальными, начиная с наиболее отличной от контрольной. Если различия с очередной группой не найдены, то вычисления прекращают. Параметр I постоянен и равен числу групп, включая контрольную. Число степеней свободы вычисляют как в критерии Ньюмена — Кейлса: v = N -т.

Анализ выживаемости

Под анализом выживаемости подразумевается изучение закономерностей появления ожидаемого события в наблюдаемой выборке во времени. При этом ожидаемым событием может быть рецидив заболевания или, наоборот, выздоровление. Точка отсчета — это дата (час) выполнения определенной процедуры и т. п.

Время ожидания — это период времени от начального события до итогового. Это может быть выздоровление или летальный исход.

Отличие анализа выживаемости от других статистических методов оценки ожидаемого события — в способе построения выборки, т. е. в анализе времени до события они могут меняться. Время до события становится определенным только среди тех объектов, у которых событие произошло. До наступления события этот показатель остается неизвестным для всех остальных объектов. При этом по различным причинам изучаемые объекты могут выбыть из анализа. В таких случаях применяются специальные методы, позволяющие учитывать и использовать неполную информацию, т. е. цензурированные данные. Они используются в тех случаях, когда наблюдаемый параметр является временем до наступления события, а период наблюдения ограничен.

При анализе выживаемости вся информация о выборке содержится в соответствующей ей функции распределения вероятности (в данном случае — времен ожидания). Она используется в виде функции выживания.

Кумулятивная функция распределения F(t) времен ожидания отражает вероятность того, что время ожидания события меньше t. Соответственно, функция выживания S(t) = 1 -F(t) равна вероятности того, что событие не состоится ранее, чем по истечении времени t. Наиболее распространенными описательными методами исследования цензурированных данных являются построение таблиц дожития и метод Каплана — Мейера.

Таблицы дожития — один из наиболее традиционных методов исследования данных о выживаемости (происхождение интересующего нас события).

В таблицах дожития время наступления события разбивается на интервалы, для каждого из которых определяется число и доля объектов:

  • 1) объекты, у которых событие не произошло на момент начала данного интервала времени;
  • 2) объекты, у которых событие произошло в течение данного интервала;
  • 3) объекты, которые были изъяты или цензурированы на данном интервале.

Таблица дожития является расширенной таблицей частот. Для получения надежных оценок основных показателей (функции выживания, плотности вероятности и интенсивности), размер группы должен быть не менее 30 объектов. На основании таблицы рассчитывается ряд индикаторов. Число изучаемых объектов — число объектов, у которых событие не произошло на момент начала данного интервала времени минус половина числа объектов, которые были изъяты или цензурированы. Доля «умерших» — отношение числа объектов, у которых событие произошло в течение данного интервала, к числу изучаемых объектов на данном временном интервале. Доля выживших — единица минус доля «умерших».

Функция выживания (выживаемость) — кумулятивная доля объектов, событие у которых не произошло на момент начала определенного интервала времени; ее рассчитывают как произведение долей выживших на всех предыдущих интервалах.

Плотность вероятности — оценка вероятности наступления события в каком-либо интервале; рассчитывается как отношение разности между значениями функции выживания на любом данном и последующем интервале к продолжительности данного интервала времени.

Функция интенсивности представляет собой вероятность того, что на данном интервале произойдет событие у того объекта, у которого оно еще не произошло на момент начала этого интервала. Эта функция вычисляется как отношение числа событий, происшедших в течение данного интервала, к числу объектов, у которых событие не произошло до момента времени, находящегося в середине этого интервала.

Медиана ожидаемого времени жизни — точка на оси времени, в которой значение функции выживания равна 0,5; медиана ожидаемого времени жизни совпадает с точкой выживания 50 % наблюдений только в том случае, если до этого момента времени цензурированных наблюдений не было (рис. 5.6).

Кривая выживаемости

Рис. 5.6. Кривая выживаемости

Метод Каплана — Мейера используется для оценки доли объектов наблюдения (пациентов), у которых событие не произошло (функция выживания, выживаемость) для любого момента времени в течение всего периода наблюдения. Поскольку разбиение данных по временным интервалам (группировка) не производится, суть метода Каплана — Мейера несколько отличается от таблиц дожития. В то же самое время результаты, получаемые с помощью этих двух методов, принципиально близки по смыслу.

Оценка функции выживания в методе Каплана — Мейера представляет собой произведение выживаемости в данный момент времени на выживаемость в следующий момент времени, когда событие произошло. Как и таблицы дожития, метод Каплана — Мейера полностью применим к цензурированным данным. Для расчетов используется истинное количество объектов, у которых событие еще не произошло в любой момент времени, для которого производится оценка.

Формула Каплана — Мейера:

где тj — моменты времени «умерших», наблюдаемые в выборке; d; — число умерших в момент т;-; г; — число объектов, умерших или цензурированных в момент Tj или позже.

При этом справедливы следующие соотношения:

где Cj — число цензурированных объектов в промежутке между ;-м и (j + 1) интервалами. Объекты, цензурированные в момент т;-, включаются В Су

В случае отсутствия цензурирования S(t) = S(t). S(?) имеет асимптотическое нормальное распределение. S(t) является асимптотически несмещенной оценкой S(t). Дисперсия S(t) вычисляется по формуле Гринвуда:

Метод Каплана — Мейера широко используется в клинических испытаниях, например с целью оценки эффективности нового лекарственного препарата в изучаемой группе по сравнению с контрольной группой.

Задания для самостоятельной работы

Задание 1. В стаде коров черно-пестрой породы численностью 6000 коров лимит жирномолочности составляет Xmin = 3,4 % и Хтах = = 4,2 % при средней жирномолочности 3,8 %. Следует определить теоретическую величину а, распределение животных по данному признаку в стаде и установить, какое количество коров можно выделить в племенную группу, если границей отбора считать показатель селекционного дифференциала, равный + 0,25а.

Задание 2. Найти среднюю арифметическую по показателю содержания белка в молоке коров неплеменной части стада (Хр) и племенной части (Xq), если Хобщ =3,30 %, а = 0,30 %, стандарт племенного класса — 3,60 % и t для этого стандарта равно 1,0.

Задание 3. По данным бонитировок в племенных хозяйствах удои коров черно-пестрой породы по высшей лактации варьируют в пределах от 3500 до 6500 кг, а средний удой составляет 5000 кг. Общее поголовье коров, по которым учтена высшая лактация, равно 6000 голов.

Имея эти данные, следует провести прогнозирование численности животных племенных стад с определенным уровнем их продуктивности. Для этого необходимо составить вариационный ряд с определением теоретических частот по классам удоя коров.

Задание 4. Определить теоретические частоты вариационного ряда по показателю настрига шерсти с тонкорунных овец, если эмпирические частоты вариационного ряда следующие:

W — середина классов

3,5

4,0

4,5

5,0

5,5

6,0

6,5

7,0

7,5

8,0

8,5

п

Р — эмпирические частоты

1

2

3

10

12

8

6

5

6

3

2

58

Задание 5. В популяции коров эйрширской породы численностью 5000 коров известен лимит жирномолочности (Xmin = 3,7 % и Хтах = = 4,5 % при средней жирномолочности 4,05 %).Следует определить теоретическую величину а, теоретическое распределение животных по этому признаку в популяции и установить, какое количество коров можно выделить в селекционную группу, если границей отбора взять показатель селекционного дифференциала, равный + 0,2а.

Задание 6. У пчел определенной породы длина хоботка X = 6,0 мм ио = 0,3 мм, а для того, чтобы легко опылять клевер, требуется хоботок длиной 6,6 мм. Какое количество пчел будет опылять этот сорт клевера?

Задание 7. Из большой партии яиц необходимо отобрать лучшую часть с весом 70 г и более и предусмотреть, какие средние веса будет в отобранной и оставшейся, худшей части. Известно, что эта партия получена от породы кур, которая в условиях данной птицефабрики обычно дает яйца со средней массой X = 70 г и а = 10 г.

Задание 8. Пчел, у которых длина хоботка X = 6,4 мм и а = 0,3 мм, перевели на такой сорт клевера, для опыления которого им достаточно иметь хоботок 6,1 мм. Какое количество пчел будет опылять этот сорт клевера?

Задание 9. Из большого стада овец со средним настригом шерсти X = 4,0 кг и а = 1,0 кг решено отобрать элитную часть овец, дающих 5,0 кг и более шерсти за год. Требуется предусмотреть, какой при этом можно ожидать средний настриг у отобранной и у оставшейся части овец.

Задание 10. При изучении соотношения полов жеребят у 231 матки орловской рысистой породы получено следующее распределение (по Н. А. Плохинскому):

Число жеребчиков р

0

1

2

3

4

5

6

7

8

9

10

Число кобылок q

10

9

8

7

6

5

4

3

2

1

0

Число матерей щ

0

4

3

33

45

56

44

28

14

3

0

Всего маток = 231

Используя формулу бинома Ньютона (р + q)n, определить теоретическое распределение жеребчиков и кобылок в потомстве (приплоде) 231 матки.

Задание 11. В одном хозяйстве изучено распределение семейств по количеству больных маститом коров. Распределение семейств по количеству больных маститом коров следующее:

Количество больных (х)

5

4

3

2

1

0

к = 5

Число семейств (р)

1

1

3

12

5

3

Ер = 25

Вычислить теоретическую частоту распределения семейств по комплексу больных маститом коров.

Задание 12. Изучить распределение 25 потомков кроликов по доминантной окраске шерсти. Каждый помет состоит из четырех крольчат. Возможные варианты числа доминантно окрашенных крольчат будут следующими: нет доминантных крольчат (О); один крольчонок; два, три, четыре доминантных крольчонка. Ниже приведен вариационный ряд фактического распределения пометов по числу крольчат с доминантной окраской:

Число доминантных крольчат в помете (х)

0

1

2

3

4

к = 4

Число пометов (р)

2

4

5

10

4

Ер = 25

Установить по биному Ньютона теоретические частоты распределения окролов по окраске крольчат.

Задание 13. Обследовано 50 пометов норок с равным числом щенков — по пять голов. Среди пометов могли быть следующие варианты: 0 — отсутствие щенков с рецессивной окраской — 11 пометов; с одним рецессивным щенком — 10; с двумя — 25 пометов; с тремя — два помета; с четырьмя — один помет и один помет, в котором все пять щенков были рецессивного типа. Определить теоретическую вероятность рождения рецессивных щенков в количестве пяти, четырех, трех, двух, одного на помет или ноль и абсолютные числа теоретических частот.

Задание 14. В группе из 100 коров каждая корова имела по четыре отела. Среди них двойневые отелы имели всего 10 коров. Вариационный ряд распределения коров по количеству двойневых отелов имеет следующий вид:

Число двойневых отелов (х)

0

1

2

3

Число коров (п)

90

6

3

1

Определить теоретическое распределение коров по количеству двойневых отелов.

Задание 15. В популяции бестужевской породы вероятность появления наследственного уродства р = 0,002. Определить вероятность появления среди 200 телят 3; 2; 1; 0 уродств.

Задание 16. Исследовано 200 групп лошадей. В 109 группах не было зарегистрировано ни одной смерти от удара лошадью, в 65 группах было по одному такому случаю, в 22 группах — по два случая, в трех группах — по три и в одной группе — четыре случая смерти от удара лошади. Составить эмпирическое и теоретическое распределение числа смертей от удара лошади.

Задание 17. Пробонитировано 100 больших групп коров симментальской породы. В 55 группах не было обнаружено ни одного случая наличия трехсосковых коров, в 30 группах было по одному такому случаю, в 11 группах — по два случая, в трех группах — по три и в одной группе — четыре коровы с тремя сосками.

Составить теоретическое распределение числа коров с тремя сосками.

Контрольные вопросы и задания

  • 1. Какие закономерности характеризуют нормальную кривую?
  • 2. Какие три функции нормального распределения вы знаете? Что они показывают?
  • 3. Какой вид имеет теоретическая кривая нормального распределения?
  • 4. Какие параметры позволяют определить закономерности и три функции нормального распределения варьирующего признака?
  • 5. Для каких целей используется распределение Пуассона?
  • 6. Какую форму имеет распределение Пуассона при графическом изображении?
  • 7. Дайте характеристику асимметричного и эксцессивного распределения вариационного ряда.
  • 8. Что понимается под биноминальном распределением?
  • 9. Дайте характеристику биноминального распределения.
  • 10. Что такое треугольник Паскаля? Как его можно применить в биологических исследованиях?
  • 11. Какие параметры служат характеристикой биноминального распределения?
  • 12. Что такое трансгрессивное распределение? Как оно применяется в селекции растений и животных?
  • 13. Какие особенности трансгрессии вариационных рядов вы знаете?
  • 14. Как выглядит графически трансгрессивное распределение?
  • 15. Какую формулу используют для определения степени трансгрессии?
  • 16. Назовите основные свойства вероятностей. Какова их характеристика?
  • 17. Перечислите типы статистических распределений вариационных рядов. Какова их характеристика?
  • 18. Что понимается под анализом выживаемости?
  • 19. Что характеризует время ожидания при анализе выживаемости?
  • 20. Что такое таблицы дожития при анализе выживаемости?
  • 21. Как выглядит кривая выживаемости?
  • 22. В каких случаях используется метод Каплана — Мейера?
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >