Кросс-табуляция

Принцип формирования таблиц кросс-табуляции

В маркетинговых исследованиях часто возникает необходимость выяснить, существует ли связь, зависимость между ответами на разные вопросы.

Пример 12.5

Различается ли продолжительность пребывания в помещениях фитнес-центра у клиентов разного возраста

Для ответа на вопросы такого рода применяются таблицы кросстабуляции, иначе называемые таблицами (матрицами) сопряженности. Они показывают совместное распределение ответов респондентов на два и более вопросов анкеты.

В анкету опроса бывших клиентов фитнес-центра был включен вопрос о типичной продолжительности пребывания в фитнес-центре со следующими вариантами ответа: менее 2 ч, 2-2,5 ч и более 2,5 ч. Наряду с этим анкета содержала вопрос о возрасте, по ответам на который респонденты были разбиты на две возрастные группы: 26-35 лет и 36-46 лет.

В результате расчета в пакете SPSS (меню Analyze → Descriptive Statistics → Crosstabs) была получена следующая таблица кросстабуляции (табл. 12.11).

Таблица 12.11. Распределение респондентов в зависимости от продолжительности их пребывания в фитнес-центре и возраста, человек

Продолжительность пребывания в фитнес-центре

Возраст

Все

опрошенные

26-35 лет

36-46 лет

менее 2 ч

18

36

54

2-2,5 ч

47

57

104

более 2,5 ч

25

28

53

Всего

90

121

211

В каждой клетке таблицы указано число респондентов, обладающих определенным сочетанием рассматриваемых признаков. Например, 47 респондентов относятся к возрастной группе 26-35 лет и продолжительность их пребывания в фитнес-центре составляла 2-2,5 ч.

Анализировать представленные выше данные достаточно сложно, поскольку указанные в клетках числа зависят сразу от двух факторов. Чтобы исключить влияние численности клиентов разного возраста, рассчитаем доли респондентов с различной продолжительностью пребывания в помещениях фитнес-центра в процентах от численности респондентов в каждой из возрастных групп (табл. 12.12).

Таблица 12.12. Доли респондентов с разной продолжительностью пребывания в фитнес-центре в процентах от числа лиц в каждой возрастной группе, %

Продолжительность пребывания в клубе

Возраст

Все

опрошенные

26-35 лет

36-46 лет

менее 2 ч

20

30

26

2-2,5 ч

52

47

49

более 2,5 ч

28

23

25

Всего

100

100

100

Таблица демонстрирует, что градация "менее двух часов" ярче представлена в возрастной группе 36-46 лет (30 против 26% в целом по выборке). Остальные градации продолжительности чуть сильнее выражены в группе относительно молодых бывших клиентов фитнес-центра. Таким образом, чем старше человек, тем меньше времени он был склонен проводить в фитнес-центре.

Заметим, что с формальной точки зрения можно было бы поступить иначе: рассчитать процент не по столбцу, а по строке. Но тогда вывод из анализа таблицы был бы очень странным: с ростом продолжительности пребывания в фитнес-центре уменьшается возраст людей. Бессмысленность этого вывода - результат того, что мы необоснованно поменяли местами независимую и зависимую переменные. На самом деле в качестве независимой переменной здесь может рассматриваться только возраст бывших клиентов, а продолжительность пребывания в фитнес-центре - зависимая переменная, так как она меняется под воздействием независимой переменной. Правило анализа таблиц кросс-табуляции гласит: рассчитывать следует распределение значений зависимой переменной при каждом значении независимой. Тогда появляется возможность сравнивать между собой распределения по категориям зависимой переменной при прочих равных условиях. В данном случае появляется возможность сопоставлять не зависящие от возрастного состава выборки данные о типичной продолжительности пребывания лиц разного возраста в фитнес-центре.

 
< Пред   СОДЕРЖАНИЕ     След >