Проверка гипотезы о независимости классификационных признаков

Обозначим наблюдаемые частоты п^ через Н, теоретические — через Т. В качестве меры, характеризующей близость наблюдаемых и рассчитанных по модели частот, используется критерий Пирсона — Фишера

Если гипотеза Н0 о независимости признаков неверна, то величина X2 оказывается большой, при п —> °° X2 —> Критическая область^2 > х«, где х« — критическое значение распределения хи-квадрат с числом степеней свободы г = (m - 1)(/с - 1).

Статистика X2 имеет распределение у} лишь при п— для независимых признаков. Эта аппроксимация применима

на практике, если теоретическая частота в каждой ячейке

не меньше 5. При увеличении числа степеней свободы это ограничение можно снизить до 3.

Пример 9.1

В двух различных регионах проводились две различные рекламные кампании (тип I и тип II) для одной и той же марки обуви. Случайным образом были выбраны 100 магазинов, в каждом из которых было выяснено, увеличился ли объем продаж этой марки обуви более, чем на 5%, или менее. Результаты опроса приведены в табл. 9.3.

Таблица 9.3

Результаты рекламной кампании

Реклама

Объем продаж, %

Менее 5

Более 5

Тип I

40

10

Тип II

30

20

Определим, есть ли существенное различие в эффективности этих двух рекламных кампаний. Какая из них эффективнее?

Решение. Объем продаж как номинальный (классификационный) признак А подразделяется на две градации квантованием по уровню относительно порога, равного 5%.

Результатами анализа таблицы сопряженности (см. табл. 9.2) являются значения статистики Пирсона — Фишера X2, ее число степеней свободы и вычисленный уровень значимости:

Статистика Пирсона — Фишера — 4,76190; степеней свободы — 1;

«выч — 0,0290963.

Высокое значение величины X2 и низкий уровень значимости, авыч < < 0,05, позволяют предположить, что второй тип рекламной кампании показал значительное увеличение объема продаж обуви (гипотеза о независимости признаков должна быть отвергнута).

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >