Понятия надежности и дисперсии

Проблема надежности результатов психологического исследования прямо связана с планированием выборок исследования — их репрезентативностью и количеством входящих в них лиц (или случаев наблюдений). Однако раскрывается эта проблема по-разному в зависимости от того, обсуждается ли экспериментальное исследование, выполненное методом наблюдения, выборочное или связанное с разработкой психодиагностического инструментария (на базе классической теории тестов или иной методологии). Наметим три линии, вокруг которых группируется соответствующая информация о достижении надежности результатов исследования (применительно к психологическому эксперименту).

Первая линия — надежность понимается как контроль вариабельности, т.е. несистематической изменчивости самих переменных и их несистематических смешений с побочными переменными; эта надежность связана с оценкой внутренней валидности — в аспекте приближения эксперимента к такому мысленному образцу, как бесконечный эксперимент.

Ненадежность данных определяется часто именно как их вариабельность при повторном проведении опытов. В соответствующем разделе 8.2.2 размер выборок (п) будет рассмотрен в контексте обсуждения величины устанавливаемых экспериментальных эффектов и мощности критериев.

Вторая линия — надежность методик в психологическом эксперименте; это аспект операциональной валидности исследования; психометрическая оценка диагностической методики с точки зрения надежности — необходимый элемент знаний по психодиагностике (что выходит за рамки данного учебника).

Третья линия — надежность как устойчивость и воспроизводимость результатов для других условий и других выборок; этот аспект надежности включает уже обсуждение внешней валидности (репрезентативности выборок в том числе).

Обозначим для этих аспектов надежности некоторые общие предпосылки и проблемы. Необходимо различать интраиндивидуальную вариабельность и межиндивидуальную. В первом случае речь идет о ненадежности данных, получаемых от одного и того же испытуемого, который как бы не равен себе самому в разные промежутки опытов. Он может то заметить сигнал, то пропустить его (например, из-за флуктуации порога чувствительности или колебаний внимания, в зависимости от значимости для него сигнала или самочувствия в тот или иной момент времени и т.д.). В результате ЗП в эксперименте оказываются подверженными влиянию не только НП, но и разных источников смешений (других переменных) с действительными изменениями ЗП.

Межиндивидуальная вариабельность может создать проблему неэквивалентности экспериментальной и контрольной групп, когда даже случайно отобранные группы оказались "не равны" по составу участников. Другой аспект межиндивидуальной вариабельности — возможно меньшее различие между испытуемыми, отобранными в группы (скажем, в силу их доступности или в силу селективного характера выборки) и не отобранными; тогда у выборок в исследовании будут отличия по сравнению с вариабельностью в тех же свойствах у всей популяции.

Надежность как понятие в классической теории тестов предполагает, что измеренные различия между людьми, т.е. различия тестовых баллов, являются функцией действительных различий между ними по измеряемому свойству (тревожности, интеллекта и т.д.). Валидность теста неразрывно связана с его надежностью: чем более надежным инструментом измерения выступает психологическая методика, тем более надежные результаты будут получены и в экспериментальном исследовании с ее использованием.

Однако здесь есть существенный подвох: надежное измерение может означать, что тестом как стандартизованной методикой для измерения стабильного личностного свойства не учитываются ситуационные флуктуации переменной, в результате именно эффекты экспериментального воздействия — как ситуационные — могут оказаться пропущенными. Это специальная проблема — оценка приемлемости психодиагностического инструментария для проявления экспериментальных эффектов. Пока отметим только необходимость различать надежность как процедурный компонент оценивания методики и надежность результатов, включающую и другие аспекты.

Формально вариабельность или флуктуации переменных учитываются в показателе дисперсии. Дисперсия является одним из ключевых понятий психометрики и оценивания надежности. Из курсов математической статистики студентам уже известны меры центральной тенденции и меры разброса эмпирических данных. Совокупность полученных значений ЗП — в каждом из условий НП — или популяционного признака можно представить в виде частотного распределения, которое описывается средним арифметическим (X) и отклонением от среднего (X - Х^, где г — номер испытуемого, а N — число испытуемых в выборке (при оценке межиндивидуальной вариабельности) или N- — число наблюдений, т.е. число ответов испытуемого при оценке интраиндивидуальной вариабельности. Для подсчета дисперсии это отклонение возводится в квадрат и называется квадратичным отклонением (X - X.)2. Значение дисперсии обозначается как 52 и подсчитывается как среднее суммы всех квадратичных отклонений:

Стандартным отклонением 5 называется корень квадратный, извлеченный из дисперсии:

На величину дисперсии влияют два фактора:

  • - действительные различия в значениях измеренной переменной;
  • — единицы измерения, выбранные для переменной.

Величины разброса для переменной, изменяющейся от 1 до 14 баллов, будут существенно ниже по отношению к величине, полученной для переменной с изменениями от 65 до 140 баллов, хотя оба распределения отклонений от среднего могут быть сопоставимыми.

Дисперсию как формальное выражение изменчивости переменной в каждом исследовании необходимо измерять, но не следует в этот показатель помещать источники ненадежности.

Наконец, укажем тот элемент оценивания надежности данных, который также связан с дисперсией, но характеризует определенный аспект — ошибку измерения переменной. Предполагается, что наблюдаемое или эмпирически полученное значение переменной складывается из двух величин — истинного значения переменной и ошибки измерения:

Тогда общая дисперсия наблюдаемых значений переменной равна сумме дисперсий предполагаемых истинных значений и ошибок измерения:

Иногда надежность в психометрике трактуют как отсутствие дисперсии ошибки измерения. Тогда предполагается, что отношение дисперсии наблюдаемых значений переменной к дисперсии истинной вариабельности переменной может представлять надежность:

Чем больше ошибка измерения, тем больше будет показатель вариабельности переменной и тем меньше надежность (поскольку увеличение будет увеличивать знаменатель в последней формуле, то будет уменьшаться как показатель надежности).

К проблеме надежности мы еще будем возвращаться не раз, но уже не в аспекте надежности измерения переменной.

 
< Пред   СОДЕРЖАНИЕ     След >