Меню
Главная
Авторизация/Регистрация
 
Главная arrow Математика, химия, физика arrow БИЗНЕС-СТАТИСТИКА

ВЫБОРКА. ПРОВЕРКА ГИПОТЕЗ

В результате изучения главы 4 студент должен:

знать

• методы формирования выборки, виды выборки;

• основные задачи, решаемые при применении выборочного метода;

• правила проверки основных статистических гипотез;

уметь

проектировать выборку, обеспечивающую требуемую точность результатов;

• рассчитывать объем выборки; формировать выборку;

• рассчитывать доверительные интервалы для генеральной средней и относительной величины;

• оценивать статистическую значимость различия между двумя выборками;

• проводить одностороннюю и двустороннюю проверку основных статистических гипотез;

владеть

• методами прикладной статистики для проектирования репрезентативной выборки и оценки генеральных параметров с заданной доверительной вероятностью;

• методами проверки статистических гипотез.

Применение выборочного метода

Выборка с давних времен является инструментом бизнеса. Купец, прежде чем принять решение о закупке партии зерна, брал пробу из наугад взятого мешка и по ее качеству делал вывод обо всей партии зерна. То же можно сказать о проверке любого насыпного или наливного товара. Выборочная проверка проводилась и при закупке древесины, шерсти, хлопка и пр. В современном бизнесе выборки (выборочные обследования) проводятся, чтобы выявить предпочтения потребителей и оперативно учесть их в бизнесе. На основе выборки делается вывод о качестве продукции (см. гл. 6). Выборка финансовых документов применяется в аудите с целью обнаружения ошибок, на основе чего делается вывод относительно доли финансовых документов, содержащих ошибку. Все эти и подобные работы служат принятию решений в бизнесе.

Выборка производится из совокупности, которая определяется как генеральная. Характеристики генеральной совокупности называются параметрами; характеристики выборки называются статистиками. Принято статистики обозначать латинскими буквами, а параметры — греческими (табл. 4.1).

Таблица 4.1

Принятые обозначения

Показатель

Генеральная совокупность

Выборка

Объем совокупности

N

п

Средняя

Д

X

Доля

СО

W

Дисперсия

а2

S 2

Коэффициент корреляции

р

г

Цель выборки: на основе выборочных характеристик оценить генеральные параметры:

Информация, полученная по выборке —> Вывод о генеральных параметрах,

N

Отношение — — шаг отбора. Например, из 600 единиц нужно ото- п

брать 60. Тогда шаг отбора 600 : 60 = 10, т.е. в выборку попадает каждая 10-я единица.

Рекомендуется начинать отбор с полушага, т.е. первой отобрать в выборку пятую единицу, затем 15-ю и т.д.

Отношение — — доля выборки в генеральной совокупности.

Многие выборочные процедуры предполагают равную вероятность попадания в выборку, но возможна и неравная вероятность отбора. Например, автомобили Porsche должны иметь больший шанс быть включенными в выборку, чем Ford. В этом случае оценка генеральной средней должна быть вычислена по выборке как взвешенная средняя с большим весом для Ford.

Для оценки генеральных параметров строится доверительный интервал (с принятой доверительной вероятностью):

• для генеральной средней

• для генеральной доли

Оба интервала основаны на выборочной характеристике и ошибке выборки.

Для больших выборок (л > 30):

где z — коэффициент, соответствующий принятой доверительной вероятности Ф(г); определяется по таблице интеграла вероятностей; Л* — предельная ошибка выборочной средней; Avv — предельная ошибка выборочной доли.

Для малых выборок (п < 30):

где t — коэффициент, соответствующий принятой доверительной вероятности Ф(0; определяется по таблице распределения Стьюдента для (п - 1) степеней свободы.

Средняя квадратическая ошибка выборочной средней, ст*, определяется как

где — генеральная дисперсия переменной х.

Средняя квадратическая ошибка выборочной доли, ctw, определяется по формуле (4.6):

Как правило, величина генеральной дисперсии неизвестна. Тогда используют выборочную оценку дисперсии sj.

Если s* неизвестна, то принимают вероятную оценку, используя

1

соотношение для нормального распределения: s «— • размах вариации.

6

Если распределение заведомо скошенное, то • размах. Если есть сведения о среднем значении, то среднее квадратическое отклонение можно принять 5 *^х. Если неизвестна дисперсия относительной величины, то принимается ее максимальное значение, =w(l-iv) = 0,25. При малом числе наблюдений, п < 30, формула (4.5) имеет вид

В приведенных формулах не учитывался объем генеральной совокупности. На практике применяется корректировка на конечность генеральной совокупности (fpcfinite population correction):

129

где N — численность генеральной совокупности; п — численность выборки.

В табл. 4.2 представлены примеры корректировки на конечность генеральной совокупности.

Таблица 4.2

Корректировка на конечность генеральной совокупности

Дисперсия выборочной средней при условии бесконечности генеральной совокупности

Дисперсия выбором- ной средней при условии конечности генеральной совокупности

Примеры fpc

п = 20 N=50

25

100

50

1000

100

10000

sL

п

fH)

0,6

0,75

0,95

0,99

Корректировка на конечность генеральной совокупности обеспечивает получение более узкого доверительного интервала, т.е. дает меньшую неопределенность в оценке генерального параметра. В том случае, когда выборка составляет малую долю генеральной совокупности (5% или меньше), корректировкой на конечность генеральной совокупности можно пренебречь.

Расчет численности выборки для обеспечения результатов заданной точности. Если принимается решение о проведении выборочного наблюдения, то, во-первых, определяется объем выборки (sample size). Поскольку предельная ошибка выборки

отсюда

где п — объем выборки; z — значение, соответствующее принятой доверительной вероятности (определяется по таблице нормального распределения); а2 — генеральная дисперсия (или ее оценка); Д2 — квадрат допустимой ошибки выборки

Чем ниже требуемая точность, тем меньше численность выборки. Как следует из формулы (4.9), ошибка выборки прямо пропорциональна дисперсии. Поэтому чем меньше дисперсия изучаемого признака х, тем меньше будет величина ошибки, т.е. однородность данных способствует уменьшению ошибки выборки.

Для обеспечения однородности нередко приходиться разделять генеральную совокупность на однородные части (страты). Такое разделение называется стратификацией. Формирование выборки проводится путем отбора из страт. Объем выборки п некоторым способом распределяется по стратам. Можно распределить общий объем выборки пропорционально численности единиц в каждой страте:

где п — объем выборки (число единиц в выборке); п; — объем выборки, приходящийся на j-ю страту; Nj — число единиц в j-й страте в генеральной совокупности; N — число единиц в генеральной совокупности.

Другой способ распределения объема выборки по стратам основан на учете не только числа единиц, но и однородности страт (измеряемой величиной дисперсии). Чем более однородна страта, тем меньше единиц объема выборки придется на нее:

где — генеральная дисперсия в j-ой страте.

При стратифицированной выборке оценка генеральной средней будет равна

где х — выборочная средняя; к — число страт.

Проектируя выборку, нужно иметь в виду, что объем выборки можно рассчитывать исходя из характеристик и требуемой точности для разных переменных: например, выработки в час или день, доли рабочих с детьми дошкольного и школьного возраста, заработной платы и т.д. Пусть при расчете объема выборки по выработке оказалось достаточным обследовать 100 рабочих, а для обеспечения точности в оценке доли рабочих с детьми дошкольного и школьного возраста потребуется обследовать 200 человек — требуемый объем выборки увеличился в два раза. Если объем выборки увеличился в пять раз и более, нужно предложить краткую программу обследования для максимальной выборки (птах), а из этой численности выделить единицы, которые соответствуют более редким характеристикам (скажем, наличие несовершеннолетних детей). Такая конструкция выборки соответствует многофазовому отбору.

После проведения выборочного обследования нужно оценить репрезентативность выборки. Это делается с помощью расчета предельной ошибки выборки Дх, Aiv и сравнения этих величин с допустимой величиной погрешности, которая закладывалась в расчет объема выборки. Если предельная ошибка выборки равна допустимой погрешности или меньше нее, то выборка считается репрезентативной. В противном случае приходится проводить расчет вероятности, с которой можно принять результаты выборки, путем деления предельной ошибки выборки на среднюю ошибку выборки:

Строительная фирма совместно с проектировщиками жилых квартир решила провести выборочное обследование для установления среднего размера домохозяйств и выявления желаемого размера и планировки квартир. В населенном пункте, где планируется строительство, проживает 4000 домохозяйств. Решено, что предельная ошибка выборки при определении среднего размера домохозяйства не должна превышать 0,5 чел. с вероятностью 0,95 при среднем квадратическом отклонении 1,1 чел.

Определим объем выборки:

Округлим объем выборки до 20 домохозяйств. Доля выборки в генераль-

4000

ной совокупности составит (20 : 4000) • 100% = 0,5%. Шаг отбора =

= 200-е домохозяйство. Имея списки домохозяйств, начинают отбор с полушага, т.е. с 100-го домохозяйства, которое первым отбирается для обследования. Следующим будет 300-е, затем — 500-е и т.д., пока не отберем 20 домохозяйств. Выборка малая, поэтому распределение выборочных характеристик подчиняется распределению Стьюдента.

Доверительный интервал для генеральной средней:

Среди опрошенных 100 сотрудников фирмы (общее число работников — 400 чел.) оказалось, что доля сотрудников, арендующих жилье, составляет 20% (20 чел.). Доверительный интервал для доли сотрудников, арендующих жилье, имеет вид

где Д,„ — предельная ошибка выборки для доли,

Отсюда доля сотрудников фирмы, арендующих жилье, составляет не менее 14% и не более 26% (с вероятностью 0,95).

Мясоперерабатывающий комбинат ежедневно выпускает 800 батонов колбасы «Докторская» массой 1200 г для дальнейшей реализации в сети супермаркетов «Лента». Отдел контроля качества комбината осуществляет проверку готовой продукции по нескольким параметрам, в том числе по весу батона. В соответствии с требованиями службы закупок сети «Лента» отклонение веса одного батона колбасы более чем на ±20 г от заявленного в договоре поставок считается недопустимым. По данным контрольного взвешивания пяти батонов колбасы, средний вес одного батона составил 1200 г при среднем квадратическом отклонении 18 г. С какой вероятностью можно утверждать, что вес батонов колбасы в партии будет не менее 1180 г и не более 1220 г?

Поскольку предельная ошибка выборки равна Д* = t х стх, отсюда

Согласно условию, Дх = ±20 г.

Средняя ошибка выборки составит

Рассчитанному значению t соответствует вероятность 0,963 (по таблице распределения Стьюдента при четырех степенях свободы).

 
Посмотреть оригинал
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Предыдущая   СОДЕРЖАНИЕ РЕЗЮМЕ ПОХОЖИЕ СТАТЬИ   Следующая >
 
Предметы
Агропромышленность
Банковское дело
БЖД
Бухучет и аудит
География
Документоведение
Журналистика
Инвестирование
Информатика
История
Культурология
Литература
Логика
Логистика
Маркетинг
Математика, химия, физика
Медицина
Менеджмент
Строительство
Педагогика
Политология
Политэкономия
Право
Психология
Религиоведение
Риторика
Социология
Статистика
Страховое дело
Техника
Товароведение
Туризм
Философия
Финансы
Экология
Экономика
Этика и эстетика