Практический пример

Оценка времени реакции в задачах семантического решения

Каждый список предъявлялся одной из двух групп испытуемых по шесть человек в каждой. Испытуемые одной группы должны были, оценивая пары слов по категориальному принципу, как можно быстрее ответить на вопрос, существует ли между словами категориальная связь. Испытуемые другой группы должны были как можно быстрее оценить наличие тематической связи. Время реакции испытуемых фиксировалось. Учитывались только правильные ответы испытуемых.

Предъявлению пар слов предшествовало предъявление стимула-преднастройки, или прайма. Использовалось три варианта преднастройки: категориальная, тематическая и нейтральная. В первом случае в качестве стимула-преднастройки использовалось название категории, к которой могло относиться первое слово пары, во втором – соответствующий этой категории тематический контекст. Нейтральная преднастройка представляла собой абстрактное слово "процесс". Тип преднастройки для каждой пары слов балансировался между испытуемыми по схеме латинского квадрата.

Таким образом, в качестве зависимой переменной в эксперименте использовалось время реакции для каждой из 90 пар стимулов, предполагавших положительные и отрицательные ответы, усредненное по двум испытуемым в каждой группе, заданной схемой латинского квадрата, с тем чтобы получить примерно нормальное распределение этой величины. В качестве независимых переменных использовались показатели типичности, продуктивной частотности и категориальной доминантности слов. Эти характеристики часто рассматриваются исследователями в качестве значимых предикторов времени реакции испытуемых в подобного рода задачах. На основе результатов такой оценки исследователя строят модели, описывающие хранение семантической информации в долговременной памяти человека.

Оценка влияния трех независимых переменных на время реакции испытуемых осуществлялась в соответствии со стандартными процедурами сложного регрессионного анализа. Посмотрим, как такой анализ может быть осуществлен для одного из двенадцати условий, заданных экспериментальным планом: два типа оценки х три варианта преднастройки × два варианта ответа. Будем исследовать положительные категориальные ответы испытуемых в условиях категориальной преднастройки[1].

Для осуществления регрессионного анализа воспользуемся соответствующим модулем статистического пакета IBM SPSS Statistics.

Для начала, как обычно, необходимо подготовить данные. Такая подготовка в принципе ничем не отличается от подготовки данных для дисперсионного или ковариационного анализа. Перейдем на вкладку "Переменные" и создадим четыре переменные: "Реакция", "Типичность", "ПЧ", "КД". Для того чтобы не забыть, что означают названия переменных, укажем для них соответствующие метки (рис. 9.2).

Определение переменных в IBM SPSS Statistics для оценки сложной регрессии трех семантических характеристик на время реакции испытуемого в задаче семантического решения

Рис. 9.2. Определение переменных в IBM SPSS Statistics для оценки сложной регрессии трех семантических характеристик на время реакции испытуемого в задаче семантического решения

Теперь перейдем на вкладку "Данные" и введем результаты, полученные в эксперименте. У нас получится матрица, состоящая из четырех столбцов, соответствующих только что определенным переменным, и девяноста строк, которые соответствуют примерам десяти семантических категорий, исследуемых в эксперименте (первые 20 строк представлены на рис. 9.3).

Выберем в меню "Анализ" пункт "Регрессия" и далее "Линейная...". Откроется окно настройки линейной регрессии (рис. 9.4). В левом поле мы видим список всех наших переменных. Выберем переменную "Реакция" – в этом окне она обозначена как "Время реакции" в соответствии с той меткой, которую мы ей присвоили при определении переменных, – и перенесем ее в поле "Зависимая переменная". Оставшиеся три переменные – "Типичность", "Продуктивная частотность" и "Категориальная доминантность" – перенесем в поле "Независимые переменные". Обратим внимание, что это поле расположено в отдельном блоке. Он содержит также кнопку выбора метода включения переменных и кнопки "Предыдущий" и "Следующий". Выбор метода означает, что сама статистическая программа может оценивать важность наших независимых переменных и исключать те переменные, которые оказываются избыточными или неинформативными. Кнопки перехода к следующему и предыдущему блоки позволяют вручную выбрать несколько наборов независимых переменных, для того чтобы осуществить их независимый анализ. Кроме того, окно линейной регрессии содержит несколько кнопок и полей, которые, в частности, позволяют отбирать значения зависимой и независимых переменных по какому-либо признаку, выводить дополнительные статистические характеристики и строить различные графики. Так, при нажатии на кнопку "Статистики..." можно задать вывод таких статистических показателей, как частные корреляции и корреляции части (здесь они обозначены как частичные корреляции).

Данные для регрессионного анализа трех семантических характеристик на время реакции испытуемого в задаче семантического решения

Рис. 9.3. Данные для регрессионного анализа трех семантических характеристик на время реакции испытуемого в задаче семантического решения

Осуществив необходимые настройки линейной регрессии, нажимаем кнопку "ОК". Появляется окно вывода результатов регрессионного анализа. Оно, как обычно, может содержать большой объем информации. Нас же в первую очередь интересуют данные, касающиеся основных результатов регрессионного анализа: коэффициент детерминации, коэффициенты регрессии, различные бивари- ативные коэффициенты корреляции и их статистическая оценка. Эти данные содержатся в двух таблицах.

Настройка линейной регрессии в IBM SPSS Statistics

Рис. 9.4. Настройка линейной регрессии в IBM SPSS Statistics

Первая таблица обозначается в окне вывода IBM SPSS Statistics как Сводка для модели (табл. 9.1). В этой таблице для каждого из исследуемых наборов независимых переменных указаны значения коэффициента детерминации R2, соответствующее ему значение статистики F, число степеней свободы для этой статистики в числителе и знаменателе, а также ее статистическая надежность. В пашем случае мы видим, что коэффициент детерминации оказывается чуть больше 0,20. Это значит, что наши три переменные могут описывать чуть больше 20% дисперсии зависимой переменной. Оставшиеся 80% дисперсии времени реакции определяются какими-то другими факторами, не включенными нами в анализ. Несмотря на то что наша регрессионная модель описывает всего 1/5 всей дисперсии зависимой переменной, этот результат оказывается высоконадежным. Таким образом, вычисленный нами коэффициент детерминации отличается от предсказываемого нулевой гипотезой нулевого значения: F(3,86) = 7,27; р < 0,0001.

Таблица 9.1

Оценка статистической надежности использованной модели регрессионного анализа Сводка для модели*

Модель

Изменения статистик

Изменение R квадрат

Изменения F

Число степеней свободы 1

Число степеней свободы 2

Знч. изменения F

1

0,202"

7,274

3

86

0,000

* Предикторы: (конст.) Типичность, Категориальная доминантность, Продуктивная частотность. Зависимая переменная: Время реакции.

Другая интересующая нас таблица обозначается в IBM SPSS Statistics как Коэффициенты (табл. 9.2). В этой таблице в крайнем левом столбце представлен список всех независимых переменных для каждой из рассматриваемых нами моделей. В нашем случае присутствует лишь одна определенная нами модель, включающая все три интересующих нас независимых переменных: категориальную доминантность, продуктивную частотность и типичность. Далее указаны коэффициенты линейной регрессии, выраженные в первоначальной шкале, и стандартизированные коэффициенты β, отражающие результаты регрессионного анализа для переменных, трансформированных в стандартную шкалу единичного нормального распределения – 2-оценки. Вспомним, что коэффициенты регрессии показывают, насколько должна измениться зависимая переменная при изменении независимой переменной на единицу. Поскольку переменные "Продуктивная частотность" и "Категориальная доминантность" изменяются в значительно большем диапазоне по сравнению с переменной "Типичность", есть смысл сразу обратиться к столбцу, содержащему стандартизированные коэффициенты регрессии. Они позволяют нам оценивать вклад каждой переменной в сопоставимых единицах.

Мы видим, что вклад типичности оказывается более важным. Стандартизированный коэффициент линейной регрессии β для этой переменной оказывается равным примерно 0,33. Это в три раза превышает коэффициент регрессии для продуктивной частотности и более чем в шесть раз – вклад категориальной доминантности. Оценка статистической надежности полученных коэффициентов представлена в следующих двух столбцах табл. 9.2. Они содержат значения t-статистики и оценку ее статистической значимости. Мы видим, что только вклад типичности почти достигает уровня значимости, необходимого для принятия альтернативной гипотезы, утверждающей ненулевой вклад этой переменной. Два других коэффициента оказываются статистически ненадежными.

Наконец, в крайней правой части табл. 9.2 указаны бивариативные коэффициенты корреляции для трех наших переменных. Обратим внимание, что обычные корреляции между исследуемыми переменными и временем реакции не сильно отличаются друг от друга. В то же время частные корреляции и корреляции части (в русской версии SPSS они обозначаются как "частичные корреляции") в случае типичности оказываются значительно более выраженными. Это также доказывает значимость типичности как предиктора времени реакции в задачах семантического решения, хотя предиктивные возможности этой переменной и не слишком велики. Возведя в квадрат корреляцию части, указанную в последнем столбце, можно обнаружить, что только 3,6% дисперсии времени реакции определяется дисперсией показателей типичности и одновременно не зависит от дисперсий двух других показателей.

Попробуем теперь исключить категориальную доминантность и продуктивную частотность из модели регрессионного анализа на том основании, что их статистический вклад оказывается практически нулевым. Таким образом, мы получаем вариант простого регрессионного анализа. Исключение двух переменных, однако, меняет коэффициент детерминации лишь незначительно. Теперь он оказывается равным 0,195. Зато оценка вклада типичности в скорректированной модели резко возрастает (табл. 9.3). Статистика t становится высоконадежной.

Таким образом, проведенный регрессионный анализ позволяет сделать вывод о том, что в данных экспериментальных условиях время реакции испытуемых в значимой, хотя и незначительной, степени определялось именно типичностью стимула, а не их продуктивными показателями, определяющими соотношения семантических единиц в иерархической структуре понятия.

Следует обратить внимание также на тот факт, что различные регрессионные модели дают нам несколько различающиеся результаты. Это важно иметь в виду, когда исследуются эффекты большого числа независимых переменных, высококоррелирующих друг с другом, но слабокоррелирующих с критерием – зависимой переменной. В этом случае отбор независимых переменных может представлять самостоятельную проблему статистического анализа. Именно поэтому пошаговые модели регрессии в последнее время приобретают все большую популярность. Такой отбор также может быть осуществлен на основе различных процедур многомерного анализа данных, в частности факторного анализа. Эти процедуры обсуждаются в гл. 10.

В завершение обсуждения отметим, что простейший вариант сложной линейной регрессии также возможно осуществить, имея в распоряжении только электронные таблицы MS Excel с установленным "Пакетом анализа данных". Для этого в MS Excel переходим на вкладку "Данные" и выбираем "Анализ данных" (см. рис. 3.4). В открывшемся окне выбираем "Регрессия". Откроется окно настройки регрессионного анализа (рис. 9.5).

Указываем входные интервалы для зависимой и независимых переменных. Если выбранные интервалы содержат названия самих переменных, указываем это, отмечая поле "Метки". Также пакет анализа данных даст нам возможность получить значения остатков и построить некоторые графики.

Таблица 9.2

Основные результаты регрессионного анализа

Коэффициенты"

Модель

Нестандартизированные коэффициенты

Стандартизированные коэффициенты

t

Знч.

Коррелят

И

В

Стандартная

ошибка

Бета

Нулевой порядок

Частная

Частичная

1

(Константа)

2999,911

175,403

17,103

0,000

Категориальная доминантность

-1,007

2,416

-0,052

-0,417

0,678

-0,313

-0,045

-0,040

Продуктивная частотность

-1,366

1,840

-0,109

-0,742

0,460

-0,382

-0,080

-0,071

Типичность

69,052

34,987

0,327

1,974

0,052

0,442

0,208

0,190

Зависимая переменная: Время реакции.

Таблица 93

Результаты регрессионною анализа в скорректированной модели

Коэффициенты"

Модель

Нестандартизированные коэффициенты

Стандартизированные коэффициенты

t

Знч.

Корреляции

В

Стандартная ошибка

Бета

Нулевой порядок

Частная

Частичная

1

(Константа)

2868,097

66,671

43,019

0,000

Типичность

93,459

20,210

0,442

4,624

0,000

0,442

0,442

0,442

Зависимая переменная: Время реакции.

Окно настройки регрессионного анализа в MS Ехсеl 2013

Рис. 9.5. Окно настройки регрессионного анализа в MS Ехсеl 2013

Следует иметь в виду, что пакет анализа MS Excel, в отличие от полноценных статистических пакетов, не обеспечивает возможности оценки всех деталей регрессионного анализа. Он дает нам возможность оценить лишь в целом исследуемую каузальную модель, вычисляя коэффициенты множественной корреляции R, детерминации R2 (в том числе скорректированный для генеральной совокупности – "усохший"), а также выдает значения коэффициентов регрессии В и соответствующие им значения статистики t с оценкой их надежности. Оценки стандартизированных коэффициентов регрессии β и бивариативных коэффициентов корреляции пакет анализа не дает, и их в случае необходимости придется вычислять вручную.

  • [1] В целях большей наглядности представленный далее статистический анализ несколько отличается от того, что был использован в работе И. Е. Высокова [2, с. 95–101]. Поэтому результаты такого анализа незначительно отличаются оттого, что было опубликовано ранее.
 
< Пред   СОДЕРЖАНИЕ     След >