Коэффициент ранговой корреляции Спирмена

В математической статистике для любой измеряемой величины можно вычислить числовые характеристики. Они помогают произвести интерпретацию данных, записанных в числовом виде. Однако с их помощью не представляется возможным описать связь между двумя величинами. Существует ряд способов, позволяющих определить параметры связи нескольких измеряемых величин. Наиболее простым среди них можно назвать метод, использующий понятие ранговой корреляции. Для применения данного метода на практике регистрируют два показателя на одной выборке испытуемых, предварительно их проранжировав.

Коэффициент ранговой корреляции — это число, по которому можно определить характер и силу связи.

Предположим, что у группы испытуемых с помощью некоторой методики оценивались такие качества, как аккуратность и вежливость. По характеру связь может быть либо прямой, либо обратной.

Прямая связь показывает, что высокий уровень одной измеряемой величины (например аккуратности) соответствует достаточно высокому уровню другой измеряемой величины (в данном случае вежливости). Таким образом, прямая связь между аккуратностью и вежливостью показывает, что от аккуратного человека следует ожидать, что он окажется вежливым. Обратная связь, напротив, демонстрирует, что наиболее высоким значениям первой величины соответствуют наиболее низкие значения второй измеряемой величины. То есть наличие обратной связи между аккуратностью и вежливостью показало бы, что наиболее аккуратные люди данной выборки являются наименее вежливыми, и наоборот — вежливым людям несвойственна аккуратность.

Однако знать только характер связи величин недостаточно для полноценного описания этой связи. Важным является также понятие силы. Чем сильнее связь, тем ярче выражена зависимость измеряемых величин.

Коэффициент ранговой корреляции позволяет выявить как силу, так и характер связи. В определении рангового коэффициента корреляции ключевую роль играет понятие ранга. Расположим значения xit х2, хп величины X в порядке возрастания (или убывания), т.е. х{< х2< ... < хп (или х{> х2> ... > хп). Тогда в имеющейся выборке значение Х-, величины X можно заменить рангом i этого значения. При наличии равных показателей у записанных значений им присваивается общий ранг, равный среднему арифметическому соответствующих вариантных мест. Замена значений величины X на соответствующие ранги называется ранжированием. Проранжировав значения величин X и К, мы получим новые выборки, по которым можно вычислять ранговые коэффициенты корреляции.

Среди ранговых коэффициентов корреляции следует выделить коэффициент Спирмена, определяющийся по формуле

где dj — разность соответствующих рангов величин X и У; п — объем выборки.

Коэффициент корреляции Спирмена обладает следующими свойствами.

  • 1. Коэффициент корреляции может принимать значения от минус единицы до единицы, причем при rs = 1 имеет место строго прямая связь, а при rs -1 — строго обратная связь.
  • 2. Если коэффициент корреляции отрицательный, то имеет место обратная связь, если положительный, то - прямая связь.
  • 3. Если коэффициент корреляции равен нулю, то связь между величинами практически отсутствует.
  • 4. Чем ближе модуль коэффициента корреляции к единице, тем более сильной является связь между измеряемыми

величинами. Связь принято считать сильной, если |г5|>0,7,

средней силы, если 0,3 < |rj < 0,7, и слабой, если |г5|" 0,3. Заметим, что существует и более тонкая градация силы связи, представленная шкалой Чертока, отображенной в табл. 7.16.

Таблица 7.16

Шкала Чертока

Коэффициент корреляции

Характеристика силы связи

И < 0,1

Связь практически отсутствует

0,1 < IrJ < 0,3

Слабая связь

0,3 < |rj < 0,5

Умеренная связь

0,5 < jrj < 0,7

Связь средней силы

0,7 < |rj < 0,9

Сильная связь

0,9 < |rj < 1

Очень сильная связь

Пример 7.5. Проиллюстрируем, как рассчитывается коэффициент корреляции Спирмена. Определим характер и силу связи между результатами ЕГЭ но математике и физике, используя данные из табл. 7.17.

Таблица 7.17

ЕГЭ по физике и математике для 10 учеников

Ученик

1

2

3

4

5

6

7

8

9

10

ЕГЭ, физика

95

90

86

82

75

75

64

60

57

50

ЕГЭ, математика

92

94

83

80

55

60

45

72

61

70

Проранжируем имеющиеся данные в порядке их убывания и найдем квадраты разностей соответствующих рангов. Особое внимание следует обратить на то, что пятое и шестое место по физике делят два ученика, набравшие по 75 баллов. В этом случае для данных испытуемых следует присвоить ранг 5,5 (т.е. среднее арифметическое значение между 5 и 6) (табл. 7.18).

Таблица 7.18

Ранжирование ЕГЭ по физике и математике

Физика, ранг

1

2

3

4

5,5

5,5

7

8

9

10

Математика, ранг

2

1

3

4

9

8

10

5

7

6

d?

1

1

0

0

12,25

6,25

9

9

4

16

Объем выборки п = 10. Тогда

Следовательно, имеет место прямая связь средней силы.

Использование коэффициента ранговой корреляции Спирмена очень удобно в силу относительной простоты его расчета. Однако в математической статистике показано, что коэффициент корреляции Спирмена применим не во всех случаях. Эффективность и качество оценки методом Спирмена снижается, если разница между различными значениями какой-либо из измеряемых величин достаточно велика. Не рекомендуется использовать коэффициент Спирмена, если имеет место неравномерное распределение значений измеряемой величины.

В примере 7.5 значения измеряемой величины изменяются практически равномерно, без явных «скачков». То есть если расположить оценки в порядке убывания, то каждая последующая оценка отличается от предыдущей примерно одинаково. Кроме того, отличие значений двух оценок по сравнению с самими оценками относительно невелико. Поэтому в данном примере целесообразно использовать коэффициент Спирмена.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >