Психологические гипотезы и статистические выводы

Статистические гипотезы и статистические решения

Проверка статистических гипотез является принятым нормативом анализа эмпирических данных в психологии, если получаемые эффекты или связи не очевидны и требуется оценка достоверности утверждений об их наличии или отсутствии. Без этого не может быть установлен экспериментальный эффект. Другое дело, что эффект влияния НП па ЗП может быть столь сильным по величине, что, казалось бы, не требует специальной статистической оценки.

Уровень статистических гипотез — это необходимый компонент проверки психологических гипотез, если исследователь претендует на признание полученных результатов в качестве достоверных, или значимых, и готов количественно оценить вероятность ошибок при принятии решений об экспериментальных фактах.

Это обычно решения о том, имело ли место значимое различие между показателями ЗП в разных экспериментальных условиях, установлена ли значимая связь между уровнями НП и ЗП, каковы конкретно различия или связи установлены на уровне статистически значимых закономерностей.

В статистических гипотезах уже нет утверждения о каузальном характере влияния НП.

Статистические гипотезы — это гипотезы о выборочных значениях психологических показателей (в эксперименте это показатели зависимых переменных).

Статистическая гипотеза основана па представлениях о распределении вероятностей в некотором "выборочном пространстве" событий. Статистическая проверка гипотезы состоит в выяснении того, насколько совместимы полученные (наблюдаемые) результаты с теми, которым будет соответствовать гипотеза об их "случайном" характере.

Статистическому оцениванию в психологическом исследовании подлежит следующий аспект: принятие исследователем решений об отвержении или неотвержении статистических нуль-гипотез как основание утверждения о полученном экспериментальном эффекте (основном результате действия НП, или кратко ОРД). Психологу необходимо узнать, достоверным ли является вывод о наличии или отсутствии эффекта воздействия НП на ЗП. Но статистические гипотезы таких утверждений не содержат, а формулируются как высказывания о показателях выборочных совокупностей (ЗП или не имеющих такого статуса психологических переменных). И здесь психолог должен учитывать знания из области статистики, чтобы на основании статистических выводов делать валидные выводы о проверяемых психологических гипотезах.

Различают формулировки нуль-гипотезы (Я0) — как гипотезы об отсутствии различий между значениями переменной в разных условиях (или отсутствии связи между переменными) и направленной гипотезы (//,). Утверждение об отвержении нуль-гипотезы служит одним из оснований такой оценки эмпирических данных, что они проявляют ОРД экспериментального фактора (если вид зависимости или установленных различий свидетельствует в пользу выдвинутого в ЭГ).

Необходимо различать также обнаруженные различия и действительные различия. Ранее на примере суда присяжных уже указывалось, что "улики", по которым судят о вине человека, могут быть не "действительными", а "артефактными". Аналогично в эксперименте установленное различие может быть не истинным, а артефактным. То же касается и случаев необнаружения предполагаемых в ЭГ различий: возможно, различие между выборками ЗП в экспериментальном и контрольном условиях существует (НП действительно оказывает влияние на ЗП), но оно было затулено присутствием "третьей" переменной (побочной, или артефактной). Или действительное различие не было обнаружено в силу ненадежности данных — недостаточности числа наблюдений (испытуемых или проб). В статистических выводах не проводится содержательного анализа указанных совпадений и несовпадений обнаруженных фактов и действительного положения дел.

Статистические решения проясняют степень уверенности в принимаемых решениях относительно экспериментальных фактов. И это выражается в вероятностных оценках возможности ошибиться при проверке #0. Случаи возможных правильных и ошибочных статистических решений представлены на схеме в табл. 3.1. В ней показано соотношение обнаруживаемых эффектов (например, обнаружено различие в ЗП или нет) и действительного положения дел, описываемого через утверждения "Я0— истинна" "Н0 — ложна".

Уверенность находит формальное выражение в уровне значимости — р. Эту оценку не следует путать с уровнем а как вероятностью ошибки 1-го рода.

Выбор уровня значимости произволен. Однако есть ряд правил для ориентировки в степени возможного произвола. Уровень значимости связан с оценкой количества опытов, или величиной выборок. Обычно указывается минимальный уровень значимости, на котором можно отвергнуть гипотезу. С этим уровнем связано установление того минимального экспериментального эффекта, который будет признан экспериментатором достаточным для суждения: "в экспериментальных и контрольных условиях наблюдалось такое-то различие между выборочными значениями переменной".

На основании полученных данных Н{) может быть отвергнута или нет, но не может быть "доказанной". При любом решении об #0 следующим шагом является возврат к уровню психологических гипотез — о принятии ЭГ, КГ или непринятии ни одной из них.

При отвержении нулевой гипотезы на уровне значимости р (например, при р = 0,05) принимается противоположная статистическая гипотеза Я, о наличии различий в значениях ЗП между экспериментальным и контрольным условиями. Такой результат означает, что 95%-й доверительный интервал вокруг установленного эффекта (разницы в средних, коэффициента корреляции и т.д.) не включает 0, т.е. эффект не равен нулю. Само понятие интервала отражает оценку эффекта не как единичного значения, но как потенциального разброса значений, прямо связанного с точностью измерения, "чистотой" и надежностью полученных данных (в частности, контролируемой и размером выборки).

Слово "доверительный" обращается к оценке уверенности и вероятности, связанной не столько с интервальным значением, сколько с процедурой его получения: доверительный интервал (confidence interval) определяется как интервал вокруг полученного результата (значения статистического критерия), который включает определенный процент ожидаемых результатов при многократном проведении исследования на большом количестве случайных выборок данной величины.

Допустим, проверялась гипотеза о связи нескольких уровней НП с ЗП, и тогда Н0 звучит как отсутствие значимой связи между уровнями одной и другой переменной. Предположим далее, что в исследовании получен коэффициент корреляции г =.30, а его 95%-й доверительный интервал от -.10 до .40. Это говорит о том, что при многократном проведении измерений на схожих случайных выборках из той же популяции в 95% случаев обнаруженный эффект будет лежать в пределах от -.10 до .40.

Если же изначально была сформулирована не На а направленная гипотеза Я, о наличии различий — например, между двумя выборочными средними, полученными в экспериментальном и контрольном условиях и обозначенными как М. и М2, и они полагались в пользу одного из условий (М, > М2), — то уровень значимости будет характеризовать вероятность ошибки выбора этого решения по сравнению с другим утверждением — о противоположной направленности экспериментальных различий, что обозначается как Н2 (для данного случая М2 > М,).

В зависимости от сформулированных статистических гипотез (о различиях или о связи с направленной или ненаправленной противоположной гипотезой) отличается логика статистических решений. Рассмотрим, как соотносятся в табл. 3.1 действительные различия между выборочными значениями ЗП и отвержение либо неотвержение нуль-гипотезы в подходе, предполагающем установление двух ошибок — первого и второго рода (а и ß).

Таблица 3.1. Статистические решения об отвержении нуль-гипотезы

Статистические решения об отвержении нуль-гипотезы

Итак, На может быть отвергнута с определенной вероятностью ошибки.

Относительно отвержения нуль-гипотезы оценивается ошибка 1-го рода — это случай, когда действительных различий не существует, т.е. Н0 истинна, но в исследовании обнаружены различия между выборочными значениями ЗП (между экспериментальным и контрольным условиями).

Вероятность а указывает процент для случайного обнаружения различий, когда в действительности их нет (Н0 истинна). Обычно значение а принимается как уровень 0,05; это 5% возможного неверного отвержения #0, а = 0,01 — 1% этой ошибки первого рода.

Правильным является и решение отвергнуть #0, когда она ложна (т.е. действительных различий нет). Это путь к принятию экспериментальной гипотезы.

Случай, когда Нм не была отвергнута, но па самом деле она ложна (т.е. действительные различия есть, но не обнаружены), обозначается как ошибка второго рода — р. Эта ошибка связана с мощностью статистического критерия.

На мощность влияют и величина а, и величина выборки — п, и величина минимального эффекта, который принимается как свидетельствующий о различии. О последнем понятии будет говориться в другом параграфе — при переходе к проблемам формального планирования.

Теперь же обратим внимание на другое. Логика статистических решений развивалась в разных традициях понимания их связи с выбором между ЭГ и контргипотезой. В старом (фишеровском, по фамилии автора сэра Р. Фишера) подходе формулировка КГ как отрицания предполагаемой зависимости не требовала формулировки направленной статистической гипотезы — Нх достаточно было решения о том, что Н0 отвергается или нет. Данные рассматривались с этой точки зрения как свидетельствующие или нет в пользу ЭГ.

В новом нейман-пирсоновском подходе (по фамилиям двух его авторов) были введены ошибки первого и второго рода (а и Р), а формулировка Нх предполагала противоположную направленность связи, чем Н0. Кроме того, теперь можно было предполагать выбор между двумя противоположно направленными статистическим гипотезами, которые можно обозначить как статистические гипотезы Н{ и Нт Это соответствует уже не просто утверждению о том, что эффект есть (данные в пользу ЭИ) или нет (данные в пользу КГ как отрицания ЭГ). КГ могла теперь быть сформулирована как утверждение о другом виде связи. Например, в старом варианте утверждению "с увеличением НП увеличиваются значения ЗП" КГ соответствовало бы утверждение "связи между изменениями НП и ЗП не наблюдается". В новом подходе КГ может звучать уже иначе: "с увеличением НП ожидается уменьшение значений ЗП" (другой вид экспериментального эффекта).

Таблица 3.2. Две традиции проверки статистических гипотез

Две традиции проверки статистических гипотез

В какой бы традиции ни осуществлялось статистическое оценивание, сама психологическая гипотеза не может считаться "доказанной". Она остается открытой для дальнейшей проверки в других исследованиях, другими методическими средствами или на основе переформулирования входящих в нее гипотетических конструктов.

Статистические решения основаны на вероятностных суждениях. С этим связан один из парадоксов развития экспериментального метода: детерминистски сформулированные утверждения о каузальных зависимостях оцениваются вероятностно. Это также один из "парадоксов К. Поппера", который специально обсуждается в отношении к проверке психологических гипотез [Налимов, 1980]. Этот парадокс заключается в том, что научная гипотеза включает обычно детерминистски сформулированное объяснение отношения между НП и ЗП (при определенном уровне других, побочных или дополнительных — третьих переменных). Но предполагается, что в реальных условиях устанавливаемая зависимость должна пробить себе дорогу сквозь цепь случайностей или незапланированных влияний со стороны этих побочных переменных. Вероятностно оценивается не само гипотетическое отношение между переменными и не истинность психологического объяснения, а достоверность того, что ожидаемая зависимость эмпирически установлена.

Специальная фиксация на постоянном уровне "третьих" переменных по отношению к НП и ЗП имеет еще одну функцию, важную в психологическом исследовании. Они задают или ограничивают широту распространения выводов из эксперимента на другие ситуации, в которых новый уровень третьей переменной (например, мотивации людей) вызовет изменение отношения между X и У. Такие переменные входят обычно в гипотезу в качестве условий, для которых сохраняется зависимость, и называются дополнительными (ДП). Статистически влияние этих дополнительных переменных не оценивается, если только они не рассматриваются в факторных схемах в качестве самостоятельной 1111.

К нормативам и традициям оценки статистических гипотез вернемся в главах 6 и 7. Пока отметим только, что в исследовании возможно также получение результатов, когда уровень значимости недостаточен для суждения о том, можно или нет отвергнуть нуль-гипотезу. Этот случай рассматривается иногда как требование искать третье объяснение (рассматривать эффект за рамками контекста ЭГ и КГ).

 
< Пред   СОДЕРЖАНИЕ     След >