Двухфакторный дисперсионный анализ

Двухфакторный дисперсионный анализ как метод анализа результатов эксперимента при изучении причинно-следственных отношений

Предположим, что выявляя зависимости (независимости) успехов студентов от формы обучения, мы пришли к выводу о неполноте такой постановки задачи: например, поняли, что эффективность формы обучения зависит от пола студента. Исходная матрица ячеек становится двумерной. Покажем, как она строится.

Пусть величина Yi/t — значение главного интересующего нас признака К, вычисленное для /-го по счету (счет ведется внутри ячейки) объекта, помещенного в ячейку с номером (/, к), гдеу —отвечающее рассматриваемой ячейке значение первого фактора X1, а к — отвечающее той же ячейке значение второго фактора X2.

Рассмотрим упрощенный вариант, когда число объектов во всех ячейках одинаково и равно п (табл. 15.1, п = 3). Фактор X' — значения 1, 2,... , У (в примере У = 2), а фактор АТ2 принимает значения 1,2,..., К (в нашем примере К= 3).

Модель двухфакторного дисперсионного анализа

Общая модель двухфакторного дисперсионного анализа имеет

вид:

где У — значение зависимого признака для конкретного респондента, помещенного в ячейку, отвечающуюу'-му уровню первого фактора и к-му уровню второго фактора (скажем, обучающемуся по второй форме юноши, тогда у—2, к=1), имеющему номер / в соответствующей ячейке;Х.^— вкладу-го уровня (нижний индекс) первого

Уровень фактора X

Уровень фактора X1

Численность групп, отвечающих уровням Л^1

Среднее арифметическое значение К для фиксированного уровня фактора Л1

1

2

3

1

Г...-*.

П„-з.

Г,,."4

П,Г9.

П,Г4

Г„,=2.

Г,„=4.

У,,Г4

я, =л/= 3 • 3=9

У 2+3+4+I+9+4+2+4+4 9

2

Т-5.

П.,=6.

Г,»-'-

у»г*>

Г«Г4

V*.

V’-

Пг,=7

л2 =я/=3 • 3=9

К,.-5,6

Численность групп, отвечающих уровням X2

л., =nJ=3 • 2=6

rt.=nJ= =3•2=6

n,=nJ- =3•2=6

я..=л=18

р 2+3+4+5+6+4 ^

Р ,-4,2

?„> - 5.6

Р.. -4,6

фактора (верхний индекс) X1 в формирование значения Y(в нашем примере первый фактор — форма обучения; упомянутый вклад определяется тем, что студент обучался либо по первой форме обучения (/=1), либо по второй (/=2), либо по третьей (/= 3));Х[1] — вклад к-го уровня второго фактора Л'2 в формирование значения К(в нашем примере второй фактор — пол студента; соответствующий вклад определяется тем, является ли студент юношей ил и девушкой); — вклад, определяющийся взаимодействием /'-го уровня первого фактора и у-го уровня второго; zljk — поправочный коэффициент (остаточный член), говорящий о различии между реальным значением Кдля рассматриваемого респондента и тем его значением, которое должно получиться для любого респондента, вошедшего в рассматриваемую ячейку (с номером (j,k)) согласно нашей модели.

Особое внимание следует уделить понятию взаимодействия. Именно наличием этого элемента принципиально отличается двухфакторный дисперсионный анализ от однофакторного. Наличие взаимодействия двух признаков (в отношении некоторого зависимого признака Y) говорит о том, что вид связи первого признака с Кзависит от того, какое значение принимает второй признак. Например, по отдельности и форма обучения, и пол могут в среднем (статистически) не влиять на качество обучения, но, скажем, вторая форма обучения применительно к девушкам может давать очень высокий положительный эффект. Другими словами, действие формы обучения зависит от того, для кого она используется — для девушек или юношей. Когда в принципе уровень Кзависит от сочетаний конкретных значений X1 и X2, имеют в виду наличие взаимодействия между рассматриваемыми факторами. Иногда в том же смысле говорят о синергетическом эффекте, вызванном сочетанием значений факторов, а также о нелинейности воздействия факторов на зависимую переменную. Иногда взаимодействием называют само сочетание значений факторов, обусловливающее некий конкретный уровень К86.

Выборочные оценки всех формирующих модель составляющих вычисляются так же, как это делалось для однофакторного дисперсионного анализа.

Таблица 15.2. Выборочные оценки для двухфакторного дисперсионного анализа

Название элемента модели

Обозначение

Выборочная оценка

Общий средний уровень

И

Y...

Вклад /-го уровня фактора Xх

К

Вклад А:-го уровня фактора X1

Ь*.

Вклад, определяющийся взаимодействием /'-го уровня фактора X' и /-го уровня фактора Х}

у.^~у.г+у...

Остаточный член

Определенную сложность представляет л ишь оценка взаимодействия. Зададимся вопросом, каким образом можно оценить наличие (или отсутствие) взаимодействия в конкретной ячейке с номером (j,к). Наличие некоего среднего уровня, совокупное воздействие,/-го уровня фактора X и ?-го уровня фактора X2 в отдельности, а также вкупе с взаимодействием указанных уровней приводят к тому, что средний уровень успеваемости для объектов рассматриваемой ячейки оказывается равным У Он состоит из общего среднего уровня У..., вкладау-гоуровняпервого фактора (У.у.- У...), вклада/:-го уровня второго фактора (У.#4 — У...) и вклада упомянутого взаимодействия. Как же получить оценку последнего? Естественно, путем «вытаскивания» из среднего уровня, типичного для рассматриваемой ячейки, названных вкладов. Другими словами, выборочная оценка взаимодействия равна

Аналогичные рассуждения справедливы и для генеральной совокупности.

ются взаимодействиями. В этом — суть того, что иногда в литературе называется гуманитарным измерением. Подробнее см.: Толстова ЮМ. Анализ социологических данных.

  • [1] Поиск взаимодействий — принципиальная задача для социолога. К такомувыводу можно придти, если учесть, что в социологии в качестве результата измерения зачастую имеет смысл считать не найденные каким-то образом значения непрерывных латентных переменных, а сочетания значений номинальных признаков,детерминирующих то или иное поведение респондента. Такие сочетания и называ-
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >