Понятие о двухфакторном дисперсионном анализе

Предположим, что в рассматриваемой в параграфе 11.1 задаче о качестве различных (т) партий изделия изготавливались на разных (/) станках и требуется выяснить, имеются ли существенные различия в качестве изделий по каждому фактору: А — партия изделий, В — станок. В результате мы приходим к задаче двухфакторного дисперсионного анализа.

Все имеющиеся данные представим в виде табл. 11.4, в которой по строкам — уровни А, фактора А, но столбцам — уровни фактора В, а в соответствующих клетках, или ячейках, таблицы находятся значения показателя качества изделий (г = 1, 2,..., m;j = 1, 2,..., /; k = 1, 2,..., п).

Таблица 11.4

8

А

в2

й,

в,

Л,

*111> Xk

х2> •••» x2k

...

Xjy •••> xjk

...

X1IV xIk

Л2

Х2и> •••> х

•'"221’ •••> х22к

Х2)Ь •••> x2jk

...

x2ll> •••> x2lk

Л'

Хцу —у Xik

Х21 ’ —у xi2k

...

Xij у •••> xijk

XUy •••» XUk

Ат

xmll> •”» ^тк

хт2> •••» хт'1к

xmi> — > xmjk

xml» •••» xmlk

Двухфакторная дисперсионная модель имеет вид

где xijk — значение наблюдения в ячейке ij с номером k; р — общая средняя; Fj — эффект, обусловленный влиянием г-го уровня фактора Л; Gу — эффект, обусловленный влиянием у-го уровня фактора В; — эффект, обусловленный взаимодействием двух факторов, т.е. отклонение от средней по наблюдениям в ячейке у от суммы первых трех слагаемых в модели (1115); к — возмущение, обусловленное вариацией переменной внутри отдельной ячейки.

Полагаем, что ?jjk имеет нормальный закон распределения N(0; а2), а все математические ожидания F.t,G*,Ijt, Itj равны нулю.

Групповые средние находятся по формулам:

в ячейке —

по строке — по столбцу —

Общая средняя

Таблица дисперсионного анализа имеет вид (табл. 11.5).

Таблица 11.5

Компоненты

дисперсии

Сумма

квадратов

Число

степеней

свободы

Средние

квадраты

Межгруп-

повая

(фактор А)

! 2

Qi = in X

мv '

m - 1

Ё

II

Межгрупповая

(фактор В)

1 / 2 Q> = mnJj [xtJt - хт j

/=1

/- 1

s2 - Q‘2

$2~l- 1

Взаимодействие (Л В)

<2з =

ml. .2 = «SS №. - - Xtj, + ) |=U=1

(m- 1)(/- 1)

9 Q-i 53 "(-!)(/-!)

Окончание табл. 11.5

Компоненты

дисперсии

Сумма

квадратов

Число

степеней

свободы

Средние

квадраты

Остаточная

т In ч2 i=ij=k=l

min - ml

Л _

i min-ml

Общая

ml п . .2

Q=Zi?(x,yk-x***)

1=1 у=1 Л-=1

min - 1

Можно показать, что проверка нулевых гипотез НА, Нв, НАВ об отсутствии влияния на рассматриваемую переменную факторов А, В и их взаимодействия Л В осуществляется сравнением отношений sf/sf, s|/s|, s|/s| (для модели I с фиксированными уровнями факторов) или отношений si /4 ’ 4 Аз > 4/4 (для случайной модели 11) с соответствующими таблич- ными значениями /^-критерия Фишера — Снедекора. Для смешанной модели III проверка гипотез относительно факторов с фиксированными уровнями проводится так, как в модели II, а факторов со случайными уровнями — как в модели I.

Если п = 1, т.е. при одном наблюдении в ячейке, то не все нулевые гипотезы могут быть проверены, так как выпадает компонента Q3 из общей суммы квадратов отклонений, а с ней и средний квадрат sj, ибо в этом случае не может быть речи о взаимодействии факторов.

О Пример 11.2. В табл. 11.6 приведены суточные привесы (г) отобранных для исследования 18 поросят в зависимости от метода содержания поросят (фактор А) и качества их кормления (фактор В).

Таблица 11.6

Количество голов в группе (фактор Л)

Содержание протеина в корме, г (фактор В)

В, = 80

В2= 100

О

со

II

530, 540, 550

600, 620, 580

ю

и

о

о

490, 510, 520

550, 540, 560

л3=зоо

430, 420, 450

470, 460, 430

Необходимо на уровне значимости а = 0,05 оценить существенность (достоверность) влияния каждого фактора и их взаимодействия на суточный привес поросят.

Решение. Имеем т = 3, / = 2, п = 3. Определим (в г) средние значения привеса:

в ячейках — по формуле (11.16):

530 + 540 + 550 _ _

х =-= 540 и аналогично х12„=Ь00;

3

по строкам — по формуле (11.17): по столбцам — по формуле (11.18):

Общий средний привес — по формуле (11.19):

Все средние значения привеса (г) поместим в табл. 11.7.

Таблица 11.7

Количество голов в группе (фактор А)

Содержание протеина в корме,

г (фактор В)

В, = 80

В2 = 100

Л, = 30 А2= 100

л3=зоо

хи„ = 540,0 х21, =506,7 хзи =433,3

х12* - 600,0 х22<, =550,0 ^32* = 453,3

хх =570,0 *2»* =528,4 х3ад = 443,3

•Л* у*

= 493,3

**2* =534,4

х,** =513,9

Из табл. 11.7 следует, что с увеличением количества голов в группе средний суточный привес поросят в среднем уменьшается, а при увеличении содержания протеина в корме — в среднем увеличивается. Но является ли эта тенденция достоверной или объясняется случайными причинами? Для ответа на этот вопрос по формулам табл. 11.5 вычислим необходимые суммы квадратов отклонений:

Средние квадраты находим делением полученных сумм на соответствующее им число степеней свободы т - 1=2,/ - 1 = 1; (/и - 1)(/ - 1) = 2; min - ml = 18 - 6 = 12; min - 1 = 18 - 1 = 17.

Результаты расчета сведем в табл. 11.8.

Таблица 11.8

Компонента дисперсии

Суммы квадратов

Число степеней свободы

Средние

квадраты

Межгрупповая (фактор А)

Q, = 50 011,1

2

s2 - 25 005,5

Межгрупповая (фактор В)

?>2 = 7605,6

1

sf = 7605,6

Взаимодействие

(АВ)

<2з= 1211,1

2

sj = 605,6

Остаточная

04 = 3000,0

12

= 250,0

Общая

(2 = 61 827,8

17

Очевидно, данные факторы имеют фиксированные уровни, т.е. мы находимся в рамках модели I. Поэтому для проверки существенности влияния факторов А, В и их взаимодействия АВ необходимо найти отношения:

s2 6056

Fab =2=-— = 2,42 и сравнить их с табличными значениями (см. табл.

л ^ 250,0

VI приложений) соответственно fo,05;2;i2= 3,88; F0,o5;i;i2 = 4,75; F0l05;2;i2 = 3,88. Так как FA>F005.2;12 и FB > FQ()ryl.V2, то влияние метода содержания поросят (фактора А) и качества их кормления (фактора В) является существенным. В силу того что Fab < /'о,о5;2;12 > взаимодействие указанных факторов незначимо (на 5%-ном уровне).

3 а м е ч а н и е. С точки зрения техники вычислений для нахождения сумм квадратов Qt, Q2, Q3, Q4, Q целесообразнее использовать формулы:

Так, в рассматриваемом примере 11.2: и по формулам (11.20)—(11.24):

В заключение отметим, что при решении реальных задач методом дисперсионного анализа используются статистические программные пакеты (см., например, [ 341).

Отклонение от основных предпосылок дисперсионного анализа — нормальности распределения исследуемой переменной и равенства дисперсий в ячейках (если оно не чрезмерное) — не сказывается существенно

на результатах дисперсионного анализа при равном числе наблюдений в ячейках, но может быть очень чувствительно при неравном их числе. Кроме того, при неравном числе наблюдений в ячейках резко возрастает сложность аппарата дисперсионного анализа. Поэтому рекомендуется планировать схему с равным числом наблюдений в ячейках, а если встречаются недостающие данные, то возмещать их средними значениями других наблюдений в ячейках. При этом, однако, искусственно введенные недостающие данные не следует учитывать при подсчете числа степеней свободы.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >