Меню
Главная
Авторизация/Регистрация
 
Главная arrow Психология arrow Математические методы в психологии

Практический пример

В качестве иллюстрации конкретных практических шагов, связанных с применением стандартных процедур дисперсионного анализа для сравнения нескольких выборок, рассмотрим еще раз пример, приведенный в начале гл. 3, когда была сформулирована задача сравнения нескольких выборок (см. табл. 3.3).

Вспомним, что тогда речь шла об оценке эффективности трех различных методов овладения учебной дисциплиной. С помощью этого примера были проиллюстрированы лишь общие принципы однофакторного дисперсионного анализа для несвязных выборок. Теперь же рассмотрим конкретные вычислительные процедуры как аналитического характера, так и те, которые предполагают использование современных вычислительных средств.

Если нет возможности использовать серьезные статистические пакеты (например, компании IBM SPSS Statistics), несложно проделать базовые шаги, связанные с дисперсионным анализом имеющихся данных. Для этого воспользуемся вычислительными процедурами, которые были описаны в подпараграфе 3.3.2.

Прежде всего необходимо вычислить три суммы, которые станут элементами вычислительных формул:

Подставляя в эти формулы имеющиеся у нас данные (см. табл. 3.3), получаем: (1) = 782,0417; (2) = 919; (3) = 832,125.

Теперь, руководствуясь общими принципами "ручных" вычислений, отраженными в табл. 3.4, посчитаем суммарные квадраты и оценим степени свободы. Для оценки суммарного квадрата экспериментальной ошибки вычтем из суммы (2) сумму (3). Получаем 86,875. Для оценки суммарного квадрата экспериментального воздействия из суммы (3) вычитаем сумму (1). В результате имеем приблизительно 50,083. Наконец, можно оценить совокупный суммарный квадрат, вычитая из суммы (2) сумму (1). Результат оказывается приблизительно равным 136,958. Степени свободы для оцениваемых статистик, как мы уже знаем, составляют соответственно 21, 2 и 23.

Теперь осталось только оценить средние квадраты, разделив их значения на соответствующие им числа степеней свободы. Для эффекта экспериментальной ошибки средний квадрат оказался приблизительно равным 4,137, для эффекта экспериментального воздействия – 25,042, для совокупного эффекта – 5,94. Результаты этих вычислений представлены в табл. 3.6. Там же приведено значение F-статистики, которое получается в результате деления среднего квадрата экспериментального воздействия на средний квадрат экспериментальной ошибки.

Таблица 3.6

Результаты вычисления суммарных квадратов, степеней свободы и средних квадратов в задаче сравнения трех методов обучения

Источник дисперсии

Суммарный

квадрат

Степень

свободы

Средний

квадрат

F

Экспериментальное

воздействие

50,083

2

25,042

6,05

Экспериментальная

ошибка

86,875

21

4,137

Общий

136,958

23

5,94

Теперь посмотрим, как тот же результат может быть получен с помощью компьютера.

Как уже указывалось, самый простой способ выполнить дисперсионный анализ с помощью компьютера состоит в использовании пакета анализа, представляющего собой надстройку MS Excel.

Прежде всего представим полученные в эксперименте данные с помощью таблицы, столбцы которой – наши экспериментальные группы. Обозначим эти группы соответствующими заголовками, например Метод 1, Метод 2, Метод 3 или Группа 1, Группа 2, Группа 3 (рис. 3.3). Заметим, что те же данные можно представить и в виде строк. Пакет анализа MS Excel это позволяет.

Результаты эксперимента для трех групп испытуемых в MS Excel

Рис. 3.3. Результаты эксперимента для трех групп испытуемых в MS Excel

Теперь переходим на вкладку "Данные" и выбираем пункт "Анализ данных". При этом предполагается, что пакет анализа уже установлен на компьютере, иначе прежде нужно установить соответствующее дополнение. Если все сделано правильно, открывается окно пакета анализа данных (рис. 3.4), в котором выбираем первый пункт – "Однофакторный дисперсионный анализ".

Окно пакета анализа данных MS Excel 2013

Рис. 3.4. Окно пакета анализа данных MS Excel 2013

Выбрав необходимый модуль обработки данных, нажимаем "ОК". Открывается новое окно (рис. 3.5). В нем необходимо указать интервал данных, которые будут подвергнуты дисперсионному анализу, обозначить, в столбцах или строках они группируются, нужно ли использовать первую строку в качестве меток групп, а также указать требуемый уровень значимости Альфа (по умолчанию используется значение 5%-ного квантиля) и куда будут выводиться результаты ANOVA.

Рисунок 3.6 отражает результаты проведенной обработки данных. Как видим, эти результаты в точности соответствуют тем, что были получены при "ручных" вычислениях. Несомненным преимуществом такого способа обработки является то, что он значительно экономит силы и время исследователя. Кроме того, уже нс нужно заглядывать в статистические таблицы, чтобы оценить статистическую надежность полученного результата. Результаты содержат указание на значение F, соответствующее заданному 5%-ному квантилю, а также значение вероятности, которому соответствует полученное значение F-статистики для эталонного F-распределения. Таким образом, можно немедленно сделать вывод о принятии или отвержении выдвинутой нами нулевой гипотезы.

Недостаток использования пакета анализа MS Excel заключается в том, что он предоставляет только основные результаты ANOVA. К сожалению, такой способ обработки не обеспечивает оценки гомогенности дисперсии во всех группах и не дает возможности выделить контрастные группы. Для этих целей можно использовать возможности "ручной" обработки, но такой анализ может быть слишком утомительным. Поэтому оптимальным выглядит использование специальных модулей дисперсионного анализа (ANOVA) или общих линейных моделей (GLM) специализированных статистических пакетов.

Однофакторный дисперсионный анализ в MS Excel

Рис. 3.3. Однофакторный дисперсионный анализ в MS Excel

Результаты однофакторного дисперсионного анализа в пакете анализа MS Excel 2013

Рис. 3.6. Результаты однофакторного дисперсионного анализа в пакете анализа MS Excel 2013

Посмотрим, как наши данные могут быть обработаны с помощью статистического пакета IBM SPSS Statistics.

Прежде всего, как уже указывалось, мы должны правильно подготовить данные. Простая и наглядная таблица, с помощью которой мы представили наши данные в MS Excel, здесь не годится. Данные должны быть описаны на языке экспериментального плана.

Запустим статистическую программу, создадим новый файл данных и перейдем на вкладку "Переменные". Здесь мы должны определить две переменные – независимую и зависимую. Независимой переменной является "Группа". Укажем конкретные значения этой переменной: 1 – Группа 1; 2 – Группа 2 и 3 – Группа 3. Зависимой переменной будет переменная "Оценка". Ее значения мы указываем, перейдя на вкладку "Данные" и используя полученные в эксперименте результаты. Там же каждое значение зависимой переменной мы сопоставляем со значением независимой переменной, которые были использованы в эксперименте (рис. 3.7).

Данные для дисперсионного анализа в IBM SPSS Statistics

Рис. 3.7. Данные для дисперсионного анализа в IBM SPSS Statistics

Теперь у нас все готово, чтобы начать статистический анализ. Самый простой вариант в меню "Анализ" выбрать пункт "Сравнение средних", а в нем – "Однофакторный дисперсионный анализ...". Открывается окно выбора независимой (она обозначается здесь как "Фактор") и зависимых переменных (рис. 3.8). Несмотря на то что можно указать в этом окне не одну, а несколько зависимых переменных, статистический анализ будет проводиться отдельно для каждой из них. Эти зависимые переменные, таким образом, рассматриваются лишь как концептуальные репликации одной виртуальной зависимой переменной и являются по сути различными способами ее операционализации.

Окно настройки однофакторного дисперсионного анализа в IBM SPSS Statistics

Рис. 3.8. Окно настройки однофакторного дисперсионного анализа в IBM SPSS Statistics

Перенесем переменную "Группа" в поле "Фактор", а переменную "Оценка" – в "Список зависимых переменных". Если теперь немедленно нажмем кнопку "ОК", программа выдаст уже известные нам результаты ANOVA. Однако, как было сказано выше, специализированные статистические пакеты могут предоставить нам большой объем дополнительной информации.

Для начала выберем пункт "Апостериорные множественные сравнения" для того, чтобы выбрать интересующие нас тест post hoc. В открывшемся окне, для примера, выберем "Шеффе", "Тьюки" и "Дункан" (рис. 3.9). После этого нажимаем "Продолжить".

Выбор тестов post hoc в статистическом пакете IBM SPSS Statistics

Рис. 3.9. Выбор тестов post hoc в статистическом пакете IBM SPSS Statistics

Для оценки априорных контрастов необходимо выбрать пункт "Контрасты..." (рис. 3.10). Если бы наша независимая переменная была представлена в метрической шкале, в открывшемся окне можно было бы отметить "Полином" и выбрать "Степень". В нашем случае мы должны сами настроить коэффициенты контраста. Исследуя эффективность методов обучения в первых двух группах и сравнивая ее с эффективностью метода обучения в третьей группе, логично предположить, что третий метод явно контрастирует с первыми двумя, эффективность которых оказывается, по всей видимости, идентичной. Вспомним, что коэффициенты контраста должны быть подобраны таким образом, чтобы их сумма оказалась равной нулю. В связи с этим выберем для первых двух групп коэффициенты, равные -1, а для третьей группы – +2. Действительно, (-1) + (-1) + (+2) = 0 (см. рис. 3.10). Указав эти значения контрастов, нажимаем "Продолжить".

Настройка априорных контрастов в IBM SPSS Statistics

Рис,. 3.10. Настройка априорных контрастов в IBM SPSS Statistics

В окне настройки однофакторного дисперсионного анализа также можно выбрать пункт "Параметры...". Это дает возможность дополнительно получить описательную статистику для наших трех групп, оценить однородность внутригрупповой дисперсии и построить график средних значений (рис. 3.11). Данный пункт также дает возможность определить, как будут обрабатываться пустые ячейки, не содержащие значений зависимых переменных. Нажав кнопку "Продолжить", снова попадаем в меню однофакторного дисперсионного анализа.

Настройка дополнительных параметров однофакторного дисперсионного анализа в IBM SPSS Statistics

Рис. 3.11. Настройка дополнительных параметров однофакторного дисперсионного анализа в IBM SPSS Statistics

Выбрав необходимые настройки, нажимаем кнопку "ОК" и попадаем в окно вывода. Оно содержит большой объем информации, часть которой нам уже известна. Это значения средних для каждой группы, суммарных квадратов, соответствующих им степеней свободы, средних квадратов, а также значение F-статистики и оценка ее надежности. Также в таблице описательной статистики можно найти величины стандартного отклонения, стандартную ошибку, минимальное и максимальное значения зависимой переменной в каждой экспериментальной группе. Здесь же представлены доверительные интервалы для средних значений.

Кроме этого окно вывода информирует нас о результатах теста Ливиня, проверяющего гипотезу об однородности дисперсии в трех группах. В рассматриваемом случае они свидетельствуют о необходимости принятия нулевой гипотезы, предполагающей отсутствие каких-либо статистически надежных отличий – F< 1.

Наконец, в окне вывода можно найти данные оценки априорных и апостериорных контрастов. Что касается заданной нами модели априорных контрастов, то наша гипотеза подтверждается с высокой степенью достоверности, величина контраста, оцененного по заданным нами коэффициентам, оказалось равной 6,125 – – t(21) = 3,48; р < 0,01. Этот же результат подтверждают и выбранные нами апостериорные тесты: Дункан, Шеффе и Тьюки. Все они свидетельствуют об однородности групп 1 и 2. Видно, что эти группы попадают в одно и то же подмножество и контрастируют надежным образом с группой 3 (табл. 3.7).

Таблица 3.7

Однородные подмножества в задаче оценки эффективности трех методов обучения

Оценка

Тест

Группа

Подмножество для а = 0,05

1

2

ДЗР Тьюки

Группа 2

8

4,6250

Группа 1

8

4,7500

Группа 3

8

7,7500

Знч.

0,992

1,000

Дункан

Группа 2

8

4,6250

Группа 1

8

4,7500

Группа 3

8

7,7500

Знч.

0,903

1,000

Шеффе

Группа 2

8

4,6250

Группа 1

8

4,7500

Группа 3

8

7,7500

Знч.

0,992

1,000

Примечание. Визуализируются средние по группам в однородных наборах. Для всех тестов объем выборки, вычисленный как гармоническое среднее, равен 8,000. ДЗР – критерий достоверно значимой разности.

 
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 

Популярные страницы