Меню
Главная
Авторизация/Регистрация
 
Главная arrow Математика, химия, физика arrow БИЗНЕС-СТАТИСТИКА

Испытание гипотез

В бизнесе часто возникают вопросы: позволит ли новое оборудование повысить производительность труда? Снизится ли при этом себестоимость и будет ли значимым это снижение? Будет ли стимулом для рабочих повышение заработной платы на 10%? И так далее. Вопросов всегда бесконечно много. Ответить на них помогает статистика. Каждый из приведенных вопросов может быть сформулирован в виде гипотезы нулевой гипотезы, Н0. Эта гипотеза утверждает, что нет различий между наблюдаемой величиной и гипотетической. Например, что среднее значение равно некоторому числу а, а те различия, которые наблюдаются, — это лишь следствие ограниченности той выборки, с которой приходится иметь дело. Нулевая гипотеза будет записана как Н0: р = а. Двоеточие заменяет слова «состоит в том, что»; р — среднее значение бесконечно большой генеральной совокупности (гипотетической), включающей все возможные реализации рассматриваемого явления. В противовес Н0 выдвигается альтернативная гипотеза Н1. В результате проверки Н0 может быть либо принята, либо отвергнута в пользу принятия Hv Заключения и о нулевой и об альтернативной гипотезах могут содержать ошибку. На рис. 4.1 представлены варианты решения при испытании гипотез.

Рис. 4.1. Решение при испытании гипотез

Вероятность появления ошибки I-го рода (когда истинна нулевая гипотеза) обычно ограничивается на уровне 5% (а = 0,05). Поскольку Н0 формулируется конкретно, то вероятность появления ошибки 1-го рода контролируется в отличие от вероятности ошибки Н-го рода. Правило проверки Н0 называется критерием для проверки предположения о параметре генеральной совокупности: значении средней, дисперсии, коэффициента корреляции и др. Критерии проверки гипотез о параметрах называются параметрическими. В зависимости от формулировки Hj проверка Н0 может быть односторонней и двусторонней:

1) Н0: р = а, Нх: р > а или Яр р < а — односторонняя;

2) Н0: р = а, Яр р ^ а — двусторонняя.

Ошибку I-го рода называют уровнем значимости. Я0 проверяют на уровнях значимости 10, 5, 1 и даже 0,1, 0,01%. Чем ниже уровень значимости (вероятность ошибочного отклонения Я0), тем более доказательным будет вывод. Результат считается высоко значимым, если заключение сделано при значимости на уровне 1% или ниже.

Если сравниваются две совокупности, то Я0: pj = р2, Яр рх Ф р2, или Hv Pi •> Рг> Яр Р] < р2.

Обобщим процедуру проверки (тестирования) гипотезы:

1) записываются нулевая и альтернативная гипотезы;

2) выбирается уровень значимости теста (чаще всего а = 0,05);

3) находится по таблице критическое значение теста (например, z*);

4) вычисляется тестовая статистика z;

5) сравнивается тестовая статистика с критическим значением, принимается решение: если z > z Я0 отклоняется, если z < z Я0 не отклоняется.

В принципе можно испытывать значимость любой статистики, имеющей любое вероятностное распределение. Обычно проводится проверка следующих выборочных статистик: средняя, доля и дисперсия, которые подчиняются либо нормальному, либо t-, F- или ^-распределениям.

1. Проверка на основе нормального распределения, z-критерий используется для испытания среднего значения выборки (х) по отношению к среднему значению генеральной совокупности (р). Такой критерий применяется при любой величине выборочной совокупности (п), когда дисперсия генеральной совокупности (а2) известна.

2. t-критерий. Используется для испытания гипотезы о среднем значении при любой величине выборочной совокупности при неизвестной генеральной дисперсии. Для больших выборок t-распределение приближается к нормальному распределению.

3. F-критерий. Используется для сравнения генеральных дисперсий. Размер выборки может быть любым при условии, что выборка взята из нормальной генеральной совокупности.

4. Критерий %2. Это непараметрический критерий, т.е. значения выборочной статистики не требуются. Этот критерий основан на частоте появлений значений случайных переменных. Может быть

использован для испытания гипотезы о связи между характеристиками или о согласии наблюдаемого частотного распределения с некоторым стандартным распределением (см. гл. 3).

Проверка односторонней гипотезы

Пример 4.4

Предположим, предприниматель намерен приобрести франшизу для малого бизнеса. Владелец франшизы утверждает, что недельный оборот франшизы составляет 450 000 руб. Выбрав случайным образом данные по 26 франшизам, был рассчитан средний оборот, который составил 441 000 руб./неделю со стандартным отклонением 25 200 руб.

Нулевая гипотеза заключается в том, что средний недельный оборот составляет 450 000 руб.; альтернативная гипотеза, что оборот составляет менее 450 000 руб. Можно записать это следующим образом:

Н0: ц = 450 000 руб.;

450 000 руб.

Нужно проверить, правильно ли утверждение владельца франшизы. При этом возможны два типа ошибок:

ошибка I рода — отклонить Н0, хотя в действительности она верна; ошибка II рода — не отклонять Н0, хотя в действительности она не верна. Отклонение Н0 означает отсутствие хороших возможностей для бизнеса. Неотклонение Н0 означает возможность покупки бизнеса, который на самом деле не так привлекателен. Полностью избежать вероятности ошибки невозможно.

Рис. 4.2. Односторонняя проверка гипотезы

Уменьшение ошибки первого рода приводит к увеличению ошибки второго рода. Правило принятия решения сводится к выбору точки xD (разделительной линии по горизонтали на рис. 4.2). Если х имеет значение выше точки принятия решений xD, то Н0 не отклоняется, а если х лежит ниже точки принятия решения xD, то Н0 отклоняется. Так что слева от xD лежит область отклонения Н0, справа — принятия Н0. Перемещение линии решения вправо или влево регулирует баланс этих вероятностей. Перемещение линии вправо увеличивает вероятность ошибки I-го рода, но уменьшает вероятность ошибки Н-го рода. Перемещение линии влево дает противоположный эффект.

Определим вероятность ошибки I-го рода:

Принимая вероятность ошибки I-го рода при одностороннем тестировании равной 0,05 (5%), находим по таблице интеграла вероятностей критическое значение 2табл = 1,64.

Поскольку 2факт > 2та6л, Н0 отклоняется с 95%-й уверенностью. В данном случае мы включаем левый хвост распределения.

Пример 4.5

По данным выборки 100 рабочих установлено, что среднее число часов, отработанных сверхурочно на предыдущей неделе, составило 7,8 ч со стандартным отклонением 4,1 ч. Требуется проверить гипотезу о том, что среднее значение сверхурочных для всех рабочих составляет 5 ч или меньше:

Н0: р < 5 ч;

Я,: р > 5 ч.

Уровень значимости а = 5%. Критическое значение z* = 1,64. Тестовая статистика

Решающее правило: 6,8 > 1,64, следовательно, Н0 отклоняется в пользу Ну В данном случае включается правый хвост распределения.

Проверка двусторонней гипотезы

Финансовый директор занимается продажей франшизы. На рекламе указано, что оборот бизнеса составляет 450 000 руб. в неделю. Для продажи важно, чтобы оборот был не выше и не ниже этой величины:

Н0: р = 450 000 руб.;

Яр р Ф 450 000 руб.

На рис. 4.3 показана область отклонения Я0.

Рис. 4.3. Проверка двусторонней гипотезы

Получаем значение меньше критического, 1,27 < 1,96. Следовательно Н0 не отклоняется.

Испытание гипотезы на основе выборочной средней: генеральная дисперсия известна

Методика испытания гипотезы может изменяться в зависимости от того, известна или нет генеральная дисперсия.

Пример 4.7

Рафинированный сахарный песок упаковывается в пакеты весом в среднем 1,0 кг (р) со стандартным отклонением (о), равным 0,01 кг. Случайная выборка п = 16 пакетов готовой продукции выявила средний вес х = 1,01 кг. Можно ли считать, что настройка фасовочной машины не нарушена?

Решение

Можно предположить, что вес пакетов с сахарным песком соответствует приблизительно нормальному распределению. Нулевой гипотезой является то, что настройка машины не отклонилась от нормального состояния, Н0: р =1,0 кг.

Альтернативной гипотезой является Нг: д Ф 1,0 кг.

Из Н0 следует, что выборочное распределение выборочных средних является тоже нормальным распределением со средней, равной 1,0 кг, и стандартной ошибкой, равной (0,01 />/Тб) кг. Проверим нулевую гипотезу на 5%-м уровне значимости, используя нормальное распределение с двумя границами (рис. 4.4).

По таблице стандартного распределения находим, что Z-, и z2 равны 1,96 стандартным ошибкам расстояния от генеральной средней.

Рис. 4.4. Критические значения стандартного нормального распределения для 5%-го уровня значимости выше средней р.

Значение стандартизованной переменной 4,0 больше, чем граничная (критическая) величина 1,96. Это означает, что Р (стандартизованная переменная > 4,0) < 0,025, так что результат существенен на 5%-м уровне значимости. Если нанести значение z = 4,0 на рис. 4.4, то оно попадет в область отклонения Н0. Поскольку результат существенен на 5%-м уровне, делается заключение о том, что выборочная средняя не согласуется с нулевой гипотезой, которая отклоняется в пользу альтернативной. Вероятность появления выборочной средней, равной 1,01 кг или больше, из-за случайных колебаний результатов выборочного исследования в случайной выборке величиной 16 единиц, взятой из нормальной генеральной совокупности, меньше чем 5%. Поэтому делается вывод о том, что наблюдаемые колебания неслучайны, фасовочная машина работала при нарушении нормальной настройки.

Испытание гипотезы на основе выборочной средней — генеральная дисперсия неизвестна

Пример 4.8

Компания «Светлана» производит электрические лампочки. Для определенного типа лампочек установлен нормативный срок использования р = = 2000 ч. Для испытания новой партии была взята выборка п = 10 лампочек.

Среднее время пользования лампочкой в выборке равно 1810 ч со стандартным отклонением 5 = 90 ч. Можно ли считать, что ожидаемый срок использования лампочки сократился по сравнению с 2000 ч?

Решение

Нулевой гипотезой является предположение о том, что выборка была взята из генеральной совокупности со средней 2000 ч:

Н0: р = 2000 ч;

Нг: р ^ 2000 ч.

Из Н, следует, что следует проводить двустороннее испытание; из Н0 — что выборочное распределение выборочных средних также является нормальным распределением со средней 2000 ч и стандартной ошибкой (ст/VlO) ч. Поскольку а неизвестна, то для испытания гипотезы используем стандартное t-распределение с числом степеней свободы, равным (10 -1) = 9. Примем решение на 5%-м уровне значимости. Используя таблицу t-распределения, находим, что t (0,05;9) = ± 2,26.

Проверочной статистикой является t:

Отклонение выборочной средней от генеральной средней выразим через количество стандартных ошибок:

Поскольку

Отсюда:

Получим:

Полученное значение проверочной статистики -6,3, меньше критического значения -2,26. Это означает, что вероятность Р (стандартизованная переменная < -6,3) < 0,025.

Результат значим на 5%-м уровне. Вероятность появления выборочной средней, равной 1810 ч или менее, из-за случайностей отбора при выборке 10 единиц, взятой из нормальной генеральной совокупности со средней 2000 ч, меньше чем 5%. Принимается следующее заключение: есть все основания утверждать, что срок горения лампочек сократился.

Проверка гипотезы на основе данных о выборочной доле (относительной величине)

Рассмотренная процедура испытания гипотез может быть использована для проверки гипотезы о выборочной доле. Доля имеет биномиальное распределение, но при большом объеме выборки в качестве аппроксимации биномиального может быть использовано нормальное распределение:

где w — выборочная доля; со — гипотетическая доля; alv = ^ —

стандартная ошибка доли.

Производители автомобилей утверждают, что не более 10% машин могут потребовать ремонта в первые три года их использования. Случайная выборка 50 автомобилей с трехлетним сроком эксплуатации показала, что у восьми из них был проведен ремонт, т.е. w = 8: 50 = 0,16; п = 50.

Н0: ш = 0,10 Нг: ш > 0,10

z” (критическое значение) = 1,64 (а = 0,05, правосторонняя проверка), z < z*,

Н0 не отклоняется, т.е. утверждение производителей обоснованно.

Проверка разности двух выборочных средних

Две фабрики производят мечи для тенниса. Оборудование обеих фабрик стандартное, различие может быть лишь в стиле управления. Руководство фабрик решило выяснить, каково различие между фабриками, нужно ли его принимать во внимание. На основе данных за 30 дней была построена следующая таблица (табл. 4.4).

Таблица 4.4

Данные по двум фабрикам за 30 дней

Показатели

Фабрика 1

Фабрика 2

Среднедневной выпуск, шт.

2560

2490

Стандартное отклонение, шт.

89

104

Генеральные дисперсии могут быть заменены их выборочными оценками Si и s%. Проверяемая гипотеза записывается следующим образом: но- Й1 — Й2 = 0 НТ- Hi — Иг * о

Примем уровень значимости 1%. Выбор этого уровня значимости связан с тем, чтобы придать большую доказательность вывода для менеджеров фабрик.

Критическое значение z* = 2,57.

Тестовая статистика равна

Значение тестовой статистики попадает в область отклонения нулевой гипотезы. Поэтому различие между фабриками с вероятностью 0,99 следует признать значимым. [1] [2]

3

Лучшая оценка дисперсии (по сравнению с использованием одной или другой по отдельности) достигается сложением двух выборочных дисперсий (s? и sf).

Лучшая оценка генерального стандартного отклонения вычисляется по формуле

Тогда лучшей оценкой стандартной ошибки является где

В случае малых выборок: где

Проверочная статистика для испытания гипотез по двум выборочным средним подчиняется стандартному t-распределению с (nj + п2 - 2) степенями свободы: [3]

Проверочная статистика для испытания гипотезы по двум выборочным средним находится по формуле

Эта статистика не подчиняется ни нормальному распределению, ни t-распределению. Можно использовать в качестве приближения {-распределение. Если объем выборки большой, п > 30, распределение этой статистики приблизительно нормальное, т.е. можно пользоваться таблицей стандартного z-распределения.

Испытание гипотезы по двум выборочным долям

Если две большие выборки взяты независимо из двух биномиальных генеральных совокупностей, то статистика (vvj - w2) нормально распределена со средней (iVj — w2) и стандартной ошибкой:

где w — выборочная статистика; w — параметр генеральной совокупности и обе выборки большие, т.е. п2 и п2 больше или равны 30.

Проверяется: взяты ли или нет две выборки из биномиальных генеральных совокупностей с одинаковой долей случаев, т.е. = ю2. Проверочная статистика приблизительно нормально распределена при больших размерах выборки

Внутренние аудиторы фирмы проверяют систему обработки счетов доходов по данным случайной выборки объемом пх = 50 закрытых счетов. Четыре из них оказались дефектными. Для повышения достоверности аудиторского заключения аудиторы привлекли дополнительные платежные документы, т.е. несколько модифицировали процедуру. Пользуясь новой методикой, аудиторы провели случайную выборку объемом п2 = 60 завершенных счетов. Теперь было обнаружено три неисправных счета. Имеется ли какое-либо основание считать, что данные содержат меньше ошибок?

Решение

ojj = w2 — со;

Н11 > ю2.

Поскольку предполагается, что новая выборка имеет меньшую долю ошибок, приемлемо одностороннее испытание.

Будем принимать решение на 5%-м уровне значимости. Приемлемо нормальное распределение, поскольку размеры обеих выборок большие. По таблице нормального распределения находим: z0 05 = 1,645; ivx = 4/50 = = 0,08 и w2= 3/60 = 0,05.

Лучшая оценка доли дефектных счетов в генеральной совокупности достигается комбинированием долей двух выборок: семь дефектов из 110 случаев.

Так что лучшей оценкой генеральной доли является w = 7/110 = 0,0636.

Поскольку

получим

Проверочная статистика равна

Поскольку 0,64 < z0 05 = 1,645, результат не значим на 5%-м уровне. Наблюдения согласуются с Н0 на данном уровне значимости, поэтому нет причины

предполагать, что вторая выборка показала уменьшение ошибок.

Испытание гипотезы о двух генеральных дисперсиях

Отношение двух дисперсий подчиняется распределению F-статистики:

Оценка дисперсии генеральной совокупности вычисляется по формуле

Отсюда отношение двух дисперсий имеет вид

Нулевая гипотеза состоит в том, что две выборки независимы и взяты из нормальных генеральных совокупностей с одинаковыми дисперсиями, of = ст|. В этом случае F = 1. Даже если нулевая гипотеза верна, то вряд ли можно ожидать, что of будет иметь точно такое же значение, что и (хотя бы из-за случайных колебаний отбора). Поэтому маловероятно, что F-статистика будет равна единице. Мы должны ответить на вопрос, будет ли истинная величина F достаточно близка к единице для того, чтобы подтвердить: что выборочные совокупности были взяты из нормальных генеральных совокупностей с одинаковой дисперсией.

F-распределение зависит от числа степеней свободы в обеих сравниваемых выборках: для каждой выборки остаются (п - 1) степени свободы.

Таблица для F-распределения содержит только значения F > 1, т.е. для проверки с одной границей. При расчете проверочной статистики F делим большую дисперсию на меньшую.

Финансовый директор фирмы сравнивает две инвестиции —А и В. Инвестиция А планируется на срок 10 лет с ожидаемой годовой прибылью в течение этого периода 17,8%. Инвестиция В рассчитана на срок 8 лет также с такой же годовой прибылью. Среднеквадратическое отклонение относительной годовой прибыли от инвестиций составляет для первого проекта 3,21%, для второго проекта — 7,14%. Можно ли считать, что риски инвестиций А и В не равны? Предполагается, что распределения годичных прибылей на инвестиции подчиняются нормальному распределению.

Решение

Проверим нулевую гипотезу, используя В-критерий с двумя границами, на 5%-м уровне значимости, что соответствует 2,5%-му уровню значимости с одной границей. Поэтому находим критическое значение В-статистики, используя а = 0,025. Оценки двух генеральных дисперсий могут быть получены на основе выборочных дисперсий:

при девяти степенях свободы;

при семи степенях свободы.

Согласно полученным результатам, о| 2А. Отсюда проверочная статистика равна

Таблица В-распределения построена так, что степени свободы большей дисперсии (vj = 7 степеней свободы) приводятся вверху таблицы, а степени свободы меньшей дисперсии (v2 = 9 степеней свободы) — внизу, по столбцу. При 2,5%-м уровне значимости табличное (критическое) значение В равно Во,05/2; 7,9 = 4,197, что эквивалентно значению В на 5%-м уровне значимости при двусторонней проверке с семью и девятью степенями свободы.

По данным выборки, проверочная статистика равна

Поскольку 5,09 > В0 05/2.7 9, принимается заключение о том, что различие между инвестициями (проектами) существенно на 5%-м уровне значимости. Поэтому есть основания считать, что риски (которые измеряются величинами дисперсий годовых прибылей) двух инвестиций не равны: проект В более рисковый, значит, нужно отдать предпочтение проекту А.

Менеджер компании Energizer, производящей батарейки, утверждает, что в среднем срок службы их батареек больше, чем батареек их конкурента — компании Duracell. Ассоциация потребителей произвела случайную выборку

n1 = 35 батареек производства компании Energizer и испытала их на долгосрочность. Средний срок службы оказался равным 198 ч (*i) со стандартным отклонением 8,7 ч (sj). Аналогичная проверка была сделана по батарейкам компании Duracell (п2 = 30 батареек). Средний срок службы оказался равен 193,8 ч (х2) со стандартным отклонением 5,8 ч (s2). Подтверждают ли результаты выборочных обследований заявление представителя компании Energizer?

Нулевая гипотеза состоит в том, что обе выборки взяты из нормальной совокупности с общей средней:

Альтернативная гипотеза состоит в том, что батарейки Energizer служат дольше, поэтому проводится односторонняя проверка. Поскольку генеральные дисперсии неизвестны, используем F-критерий, чтобы проверить, можно ли допустить что две генеральные дисперсии равны:

Произведем проверку нулевой гипотезы на 5%-м уровне значимости, используя двустороннюю проверку:

Поскольку of является большей, то F-статистика равна F = 77,92 / 43,80 = 2,24.

Из таблицы F-распределения для уровня значимости 0,025 с одной границей при 34 степенях свободы по столбцу и 29 степенях свободы по строке таблицы находим F0>025,30,29 = 2,092.

Полученное значение F-статистики больше этого значения, поэтому результат существенен на 5%-м уровне и не согласуется с нулевой гипотезой. Следовательно, делается вывод, что of * of.

Можно провести тестирование на основе значений двух выборочных средних. При этом использование t-статистики в данном случае не подходит. Поскольку размеры выборки большие (П) и п2) > 30, можно использовать нормальное распределение. Испытаем гипотезу на 5%-м уровне, используя одностороннюю проверку. Из таблицы нормального распределения находим, что z0 05 = 1.645. Поскольку был сделан вывод, что of Ф of,

Проверочная статистика равна

Следовательно, 2,28 > z0 05 =1,645.

Результат существенен на 5%-м уровне. Данные наблюдений не согласуются с нулевой гипотезой, так что Н0 отклоняется на этом уровне. Остается предположить, что альтернативная гипотеза Я] верна. Средний срок службы батареек Energizer больше, чем батареек Duracell.

  • [1] Испытание гипотезы по выборочным средним — генеральныедисперсии неизвестны В этом случае стандартная ошибка разности между двумя выборочными средними находится по формуле I Если и неизвестны, то они могут быть оценены посредствомвыборочных дисперсий. Возможны два случая:
  • [2] Если генеральные дисперсии равны между собой, то of и = а3.Тогда среднеквадратическая ошибка разности двух выборочныхсредних определяется по формуле 142
  • [3] Если генеральные дисперсии не равны друг другу, то каждая генеральная дисперсия должна быть оценена соответствующей выборочнойдисперсией: Следовательно: где Или где
 
Посмотреть оригинал
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Предыдущая   СОДЕРЖАНИЕ РЕЗЮМЕ ПОХОЖИЕ СТАТЬИ   Следующая >
 
Предметы
Агропромышленность
Банковское дело
БЖД
Бухучет и аудит
География
Документоведение
Журналистика
Инвестирование
Информатика
История
Культурология
Литература
Логика
Логистика
Маркетинг
Математика, химия, физика
Медицина
Менеджмент
Строительство
Педагогика
Политология
Политэкономия
Право
Психология
Религиоведение
Риторика
Социология
Статистика
Страховое дело
Техника
Товароведение
Туризм
Философия
Финансы
Экология
Экономика
Этика и эстетика