Основные способы формирования выборочной совокупности

Достоверность рассчитанных по выборочным данным характеристик в значительной степени определяются репрезентативностью выборочной совокупности, которая, в свою очередь, зависит от способа отбора единиц из генеральной совокупности. В каждом конкретном случае в зависимости от целого ряда условий, а именно сущности исследуемого явления, объема совокупности, вариации и распределения наблюдаемых признаков, материальных и трудовых ресурсов, выбирают наиболее предпочтительную систему организации отбора, которая определяется видом, методом и способом отбора.

По виду различают индивидуальный, групповой и комбинированный отборы.

В выборочную совокупность отбираются отдельные единицы генеральной совокупности при индивидуальном отборе и группы единиц при групповом отборе. При комбинированном отборе сочетаются групповой и индивидуальный отборы.

Метод отбора определяет возможность продолжения участия отобранной единицы в процедуре отбора.

Бесповторным называется отбор, при котором попавшая в выборку единица не возвращается в совокупность, из которой осуществляется дальнейший отбор.

При повторном отборе попавшая в выборку единица после регистрации наблюдаемых признаков возвращается в исходную (генеральную) совокупность для участия в дальнейшей процедуре отбора. При этом методе отбора объем генеральной совокупности на всем протяжении процедуры выборки остается неизменным, что обусловливает постоянную вероятность попадания в выборку всех единиц совокупности.

Повторный метод отбора применяется в тех случаях, когда характер исследуемого явления предполагает возможность повторной регистрации единиц. Такая возможность, прежде всего, может иметь место в выборочных обследованиях населения в качестве покупателей, пациентов, избирателей, абитуриентов и т.д. К повторному приравнивается отбор из совокупности, значительно превышающей объем выборки, а также из совокупности, границы которой не определены, например вследствие непрерывного производственного процесса. В подобных случаях значения отобранных единиц рассматривают как гипотетические величины, не исключающие возможности многократного повторения.

Способ отбора определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности. В практике выборочных обследований наибольшее распространение получили следующие выборки:

  • • собственно-случайная;
  • • механическая;
  • • типическая;
  • • серийная;
  • • комбинированная.

Собственно-случайная выборка заключается в отборе единиц из генеральной совокупности наугад или наудачу, без каких-либо элементов системности. Однако, прежде чем производить собственно-случайный отбор, необходимо убедиться, что все без исключения единицы генеральной совокупности имеют абсолютно равные шансы попадания в выборку, в списках или перечне отсутствуют пропуски, игнорирования отдельных единиц и т.п. Следует также установить четкие границы генеральной совокупности таким образом, чтобы включение или не включение в нее отдельных единиц не вызывало сомнений. Так, при обследовании студентов необходимо указать, будут ли приниматься во внимание лица, находящиеся в академическом отпуске, студенты негосударственных вузов, военных училищ и т.п.; при обследовании торговых предприятий важно определиться, включит ли генеральная совокупность торговые павильоны, коммерческие палатки и прочие подобные объекты.

Технически собственно-случайный отбор проводят методом жеребьевки или по таблице случайных чисел.

Для жеребьевки необходимо подготовить достаточное количество карточек, фишек, шаров, соответствующее объему генеральной совокупности. Каждая карточка должна содержать информацию об отдельной единице совокупности — номер, фамилию лица или адрес, название или какой-либо иной отличительный признак. Необходимое в соответствии с установленным процентом отбора количество карточек извлекается из общей их совокупности в случайном порядке.

При отборе по таблицам случайных чисел каждая единица генеральной совокупности должна иметь порядковый помер. Таблицы случайных чисел получаются с помощью датчика случайных чисел на ЭВМ и представляют собой абсолютно произвольные столбцы цифр.

Собственно-случайный отбор может быть как повторным, так и бес- повторным. Для проведения бесповторного отбора в процессе жеребьевки выпавшие жребии обратно в исходную совокупность не возвращаются и в дальнейшем отборе не участвуют. Бесповторный отбор при использовании таблиц случайных чисел достигается пропуском чисел в случае их повторения. После проведения отбора рассчитываются средняя и предельная ошибки выборочных характеристик х и w.

При повторной собственно-случайной выборке стандартная ошибка

средней х и относительной частоты w = — определяются по формулам

п

а предельные ошибки этих характеристик с вероятностью у по формулам

где ty находят по табл. П.1 из условия Ф(?у) = у.

При бесповторном отборе в формулу выборочной средней квадратической ошибки средней (х) и относительной частоты (w) необходимо ввести поправки на численность генеральной совокупности. После этого формулы преобразуют к виду

Пример 8.1

Предположим, что на основе 5%-го выборочного обследования домохозяйств города (собственно-случайная повторная выборка) получены следующие данные о расходах на оплату жилищно-коммунальных услуг (табл. 8.1):

Таблица 8.1

Расходы на ЖКУ

Расходы на оплату жилищно- коммунальных услуг (ЖКУ)

100-200

200-300

300-400

400-500

500-600

Число домохозяйств

86

175

436

113

40

Определите с доверительной вероятностью 0,95:

  • а) предельную ошибку выборочной средней х и интервал, в котором может находиться математическое ожидание средних расходов домохозяйств на ЖКУ (р);
  • б) предельную ошибку относительной частоты (w) — доли домохозяйств, оплата которых составляет более 400 руб., и интервал, где эта доля может находиться с указанной вероятностью.

Рассчитаем предварительную стандартную ошибку средней s?. С этой целью найдем среднюю арифметическую х и выборочную дисперсию по данным табл. 8.2.

5

Учитывая, что п = ^dmj = 850, где 1=5 — число интервалов, получим

i=i

отсюда S = 94,75 руб.

Расчетная таблица

Таблица 8.2

Границы

интервалов я + а

Число жителей

щ

Середина интервала х{

х>Щ

х)щ

100-200

86

150

12 900

1 935 000

200-300

175

250

43 750

10 937 500

300-400

436

350

152 600

53 410 000

400-500

ИЗ

450

50 850

22 882 500

500-600

40

550

22 000

12 100 000

Итого

200

X

282 100

101 265 000

Тогда стандартная ошибка средней

Для вычисления предельной ошибки х из условия Ф(/у) = у = 0,95 по табл. П.1 найдем ?у = 1,96, а затем, согласно (8.14),

Тогда интервальная оценка генеральной средней (8.12) будет а с учетом полученных значений

Таким образом, с вероятностью 0,95 можно утверждать, что средний размер оплаты домохозяйств за ЖКУ в целом по городу находится в пределах от 325,4 до 338,4 руб.

При расчете стандартной ошибки собственно-случайной бесповторной выборки, согласно (8.15), имеем

Предположив, что данные табл. 8.1 — результат 5%-го бесповторного отбора (следовательно, генеральная совокупность включает 17 000 единиц), то стандартная ошибка х будет несколько меньше:

Соответственно уменьшится и предельная ошибка выборки, что вызовет сужение границ генеральной средней р. Особенно ощутимое влияние поправки на бес- повторность отбора имеют место при большом проценте выборки.

Теперь решим задачу определения доли домохозяйств, расходы которых на ЖКУ составляют свыше 400 руб. в месяц. Согласно табл. 8.1, численность таких домохозяйств составляет т = 113 + 40 = 153, а относительная частота w = — = = 0,18.

п 850

Тогда стандартная ошибка относительной частоты, согласно (8.8),

а предельная ошибка относительной частоты с вероятностью 0,95 Найдем интервальную оценку генеральной доли: а с учетом полученных значений или

Следовательно, с вероятностью 0,95 можно утверждать, что доля домохозяйств, ежемесячная оплата которых за жилье превышает 400 руб., по городу в целом находится в пределах 15,5—20,5%.

будет равен (k + 1 )/2, если k — нечетное, и k/2 или (k + 2)/2 при четном значении к. Например, при 5%-й выборке интервал отбора составит 20 единиц, тогда номер единицы, служащей началом отбора, будет 20 / 2 = 10 или (20 + 2) / 2 = 11, т.е. отбор можно начинать с 10 или 11 единицы. В первом случае в выборку попадут 10, 30, 50, 70 и с таким же интервалом последующие единицы; во втором случае — единицы с номерами 11,31,51,71 и т.д.

Опасность систематической ошибки при механической выборке также может появиться вследствие случайного совпадения выбранного интервала и циклических закономерностей в расположении единиц генеральной совокупности. Так, при переписи населения в ходе 25%-го выборочного обследования семей имела место опасность попадания в выборку квартир только одного типа (например, только однокомнатных или только трехкомнатных), так как на лестничных площадках многих типовых домов располагаются именно по четыре квартиры. Чтобы избежать систематической ошибки, в каждом новом подъезде счетчик менял начало отбора.

Сформированная механическим способом выборка всегда будет беспов- торная. Для определения ее средней ошибки используется формула, применяемая при собственно-случайном бесповторном отборе.

Типическую выборку целесообразно применять в тех случаях, когда все единицы генеральной совокупности объединены в несколько крупных типических групп. Такие группы также называют стратифицированными, или расслоенными. При обследованиях населения такими группами могут быть, например, районы, социальные, возрастные или образовательные группы, при обследовании предприятий — отрасль и подотрасль, форма собственности и т.п.

Отбор единиц в выборочную совокупность из каждой типической группы осуществляется собственно-случайным или механическим способом. Поскольку в выборочную совокупность в той или иной пропорции обязательно попадают представители всех групп, типизация генеральной совокупности позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки. В то же время, в выделенных типических группах обследуются далеко не все единицы, а только включенные в выборку. Следовательно, на величине полученной ошибки будет сказываться различие между единицами внутри этих групп, т.е. внутригрупповая вариация. Поэтому ошибка типической выборки будет определяться величиной не общей дисперсии, а только ее части — средней из внутригрупповых дисперсий.

Различают типическую выборку, пропорциональную объему типических групп, и типическую выборку, пропорциональную внутригрупповой вариации (дифференциации) признака.

При выборке, пропорциональной объему типических групп, число единиц, подлежащих отбору из каждой группы, рассчитывается следующим образом:

где Nj — объем j-й группы, N— объем генеральной совокупности N = ^ N.;

м

I — число типических групп; rij — объем выборки изу-й группы, п — объем

I

суммарной выборки п = ^пг

м

Тогда выборочная средняя квадратическая ошибка средней (т) вычисляется так: повторный отбор —

где Т2 — средняя арифметическая групповых дисперсий;

где Xjj — результат г-го наблюдения, полученного по выборке изу-й группы; бесповторный отбор —

Выборочная средняя квадратическая ошибка относительной частоты

со = — определяется по формулам:

V п

повторный отбор —

где s = —-—, со. — относительная частота, полученная из j-и группы;

J п J

)

бесповторный отбор —

Пример 8.2

С целью изучения уровня цен на молоко в грех районах области было выполнено 10%-е типическое обследование торговых предприятий. При этом отбор проводился пропорционально числу торговых предприятий в каждом районе (табл. 8.3).

Результаты обследования торговых предприятий

Район

Число торговых предприятий Nj

Объем выборки flj

Средняя (Xj)

Дисперсия (5?)

А

580

58

20

1,44

Б

350

35

25

3,61

В

420

42

22

2,25

Определите (с вероятностью 0,945):

а) среднюю и предельную ошибку выборочной средней х

б) границы интервала средней цены 1 л молока в целом по трем районам. Решение. Предварительно вычислим среднюю из внутригрупповых дисперсий (8.19)

Тогда средняя квалпатическая ошибка составит (8.19V

Для расчета предельной ошибки средней но табл. П.1 из условия Ф(?у) = 0,954 найдем t = 2,0.

Тогда

Интервальная оценка генеральной средней р (8.12)

где х = я = —(20 • 58 + 25 • 35 + 22 ? 42) = 21,92. п j-1 7 135

Отсюда

и окончательно

Таким образом, с вероятностью у = 0,954 можно утверждать, что средняя цена молока в целом по трем районам находится в интервале 21,68—22,16 руб.

Серийная выборка заключается в собственно-случайном либо механическом отборе групп единиц (серий), внутри которых проводится сплошное обследование. Единицей отбора при этой выборке считается группа или серия, а не отдельная единица генеральной совокупности, как это имело место в рассматриваемых ранее выборках.

Данный способ отбора удобен в тех случаях, когда единицы генеральной совокупности изначально объединены в небольшие более или менее равновеликие группы или серии. В качестве таких серий могут выступать

упаковки с определенным количеством готовой продукции, партии товара, студенческие группы, бригады и другие подобные объединения.

В отдельных случаях серийная выборка имеет не столько методологические, сколько организационные преимущества перед другими способами формирования выборочной совокупности — нет необходимости проведения выборки внутри реально существующих групп. Например, значительно проще провести сплошной контроль знаний всех учащихся попавших в выборку классов, чем отбирать для обследования отдельных школьников внутри этих классов.

В связи с тем, что при серийном отборе внутри отобранных групп обследуются все без исключения единицы, внутригрупповая вариация признака не отразится на ошибках выборочного наблюдения. В то же время обследуются не все группы, а только попавшие в выборку. Следовательно, на ошибках получаемых характеристик будут отражаться различия между группами, которые определяются межгрупповой дисперсией.

Пусть генеральная совокупность состоит из R серий одинакового объема п, из которых случайным образом отобрано г серий. Тогда оценка средней квадратической ошибки средней определяется по формулам: повторный отбор

1 Г | и

где s2 =—^J(xj-x)2 межгрупповая дисперсия; х, = — ^х.. — средняя

Г j=1 П ;=1

арифметическая j-й серии; х* — результат i-ro наблюдения в j-й серии;

- *v- к

х = -Zjxj — общая средняя;

г м

бесповторпый отбор

Комбинированная выборка. В практике статистических обследований помимо рассмотренных выше способов отбора применяется и их комбинация.

Так, серии отбираются в установленном порядке из нескольких типических групп. Возможна также комбинация серийного и собственно случайного отборов, при которой отдельные единицы отбираются внутри серии в собственно-случайном порядке. Ошибка такой выборки определяется ступенчатостью отбора.

Многоступенчатым называется отбор, когда из генеральной совокупности сначала извлекаются укрупненные группы, потом — более мелкие, и так до тех пор, пока не будут отобраны те единицы, которые подвергаются обследованию.

Многофазная выборка предполагает сохранение одной и той же единицы отбора на всех этапах его проведения. При этом отобранные на каждой стадии единицы подвергаются обследованию (на каждой последующей стадии отбора программа обследования расширяется).

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >