Проблема адекватности математического метода

Интуиция подсказывает, что, чем выше тип шкалы, тем шире круг методов применим для анализа соответствующих шкальных значений. Понятно, что к числам, полученным по номинальной шкале, многие традиционные математико-статистические методы не применимы. Это можно представить, рассмотрев две возможные номинальные шкалы из третьего столбца табл. 2.1. Кроме того, многие методы будут давать разные результаты в зависимости оттого, проанализируем ли мы с помощью выбранного метода числа (5,5, 10,185, 15) или числа (25,25,3,30,1). Сравним, например, средние арифметические значения первых трех объектов и последних двух объектов для каждой из номинальных шкал (см. табл. 2.1, столбец 3):

Вывод таков: первое среднее меньше второго. Проделаем то же для второй шкалы:

В этом случае вывод противоположный: первое среднее больше второго.

Если мы используем номинальную шкалу, два рассмотренных набора шкальныхзначений содержат абсолютно одинаковую информацию! Значит, и результаты нашего анализа этих наборов должны быть одинаковые. Естественно, у нас могут зародиться сомнения в целесообразности использования среднего арифметического для сравнения средних уровней двух рассматриваемых групп объектов.

Существуютли методы, результаты применения которых не зависят от того, какую из двух рассмотренных шкал мы выберем? Да. Этому условию будут удовлетворять все методы, опирающиеся на подсчет частот. Скажем, модальным значением в первом случае будет то, которым обладают первый и второй объект (например, если цифрой «5» закодирована национальность «татарин», в рассматриваемом случае татар у нас больше всего). То же и во втором случае (снова «татар» у нас больше всего). Выводы не изменились. И вроде бы нет причин считать моду неподходящей статистикой для номинальной шкалы.

Напротив, для интервальной шкалы большинство методов применимо. Попробуем, например, решить ту же задачу путем сравнения средних для первых трех объектов и последних двух объектов для каждой из интервальных шкал, приведенных в третьем столбце табл. 2.1.

Для первой шкалы имеет место:

Другими словами, наш содержательный вы вод состоит в том, что первое среднее меньше второго. Теперь попробуем проделать то же для второй интервальной шкалы из третьего столбца табл. 2.1:

Вывод тот же. Рассмотренный пример не дает оснований для возникновения сомнений в допустимости сравнения средних арифметических для интервальной шкалы. Разумно полагать, что аналогичные соображения будут справедливы и насчет моды. Более того, интуитивно ясно, что методы, подходящие для номинальной шкалы, будут подходить и для интервальной. Все сказанное не случайно.

Попытаемся выразить те же соображения в более строгом виде.

Математический метод называется формально адекватным, если результаты его использования не зависят от применения к исходным данным допустимых преобразований тех шкал, по которым эти данные получены. Если задействовать это определение, становится ясным, почему нельзя использовать среднее арифметическое для национальностей. Мы показали, что сравнение двух средних арифметических формально не адекватно относительно номинальных шкал.

Покажем теперь, почему с формальной точки зрения нельзя рассчитывать средние для номинальной шкалы. Вернемся к нашему примеру. Напомним, что полученный содержательный вывод звучал так: «среднее между русским и украинцем равно татарину». Смысл этого утверждения изменится, если мы применим к набору исходных шкальных значений, скажем, следующее допустимое (для номинальной шкалы) преобразование: русским будем ставить в соответствие число 12, татарам — 5, украинцам — 10, чукчам — 11. Тогда среди ее меж-

ду русским и украинцем будет равно—-— = 11, т.е. чукче (а не татарину, как выше). Говоря формально, содержательный результат изменился вследствие допустимого преобразования исходных (номинальных) шкал. Метод (подсчетсреднегоарифметического)формально не адекватен.

Напротив, наш результат, полученный с помощью расчета среднего арифметического для дихотомической шкалы, использованной при измерении пола, останется неизменным, если мы будем правильно его формулировать. А формулировку возьмем такую: среднее арифметическое делит интервал между числом, соответствующим женщине, и числом, соответствующим мужчине, в отношении 4:6 (что имело место выше и по существу говорило о доле единичных значений, равной 0,4). Покажем неизменность этого отношения на примере. Перекодируем произвольным образом значения пола: мужчинам припишем значение «48», а женщинам — «40». Нетрудно проверить, что тогда совокупность наших десяти шкальных значений превратится в 40, 40, 48, 40, 48, 40, 40, 48, 48, 40, а среднее арифметическое будет

43 2 - 40 3 2 4

равно 43,2, и будет верно соотношение: —1-- -— - Отноше-

48-43,2 4,8 6

ние, говорящее о доле значений «48», осталось тем же.

Поясним, почему выше мы дали определение не просто адекватности метода, а формальной адекватности. Дело в том, что формальная адекватность того или иного метода не позволяет решить социологическую задачу соответствующего плана. Требуется другая адекватность, которую можно назвать содержательной — соответствие заложенной в методе модели сути решаемой задачи, априорным гипотезам исследователя (при классификации объектов задействованная в алгоритме функция расстояния может быть формально адекватна типу используемых шкал, но содержательно не отвечать представлениям исследователя о похожести классифицируемых объектов).

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >