Нерепрезентативные выборки

Нерепрезентативные выборки, как правило, относятся к целевым и используются при глубоком исследовании отдельных объектов в так называемых качественных исследованиях. Этот тип выборок наиболее близок к журналистским способам отбора объектов для публикации. Опишем виды нерепрезентативных выборок.

Стихийная выборка, не претендующая на репрезентативность, — эго выборка первого встречного. Таким правилом часто пользуются журналисты, когда опрашивают несколько человек на улице и выясняют их мнение по какой-то злободневной проблеме.

Стихийны все выборки в интерактивных опросах на телевидении, прессовые опросы, а также опросы в Интернете. Конечно, результаты таких исследований никак не могут считаться репрезентативными и точными, но дают некоторую информацию или конкретные аргументы для демонстрации какой-либо позиции. Они могут быть использованы как разведочные исследования. Стихийная выборка в таких случаях формируется самими опрошенными, и, как правило, это обычно бывают люди, наиболее заинтересованные в теме исследования, а также имеющие время ответить на предлагаемые вопросы.

Типологической выборка называется тогда, когда выделяются типические объекты и проводится глубокое их изучение. С такой выборкой часто имеют дело журналисты, когда пишут, например, о типичном колледже с эстетическим направлением, типичном предпринимателе, имеющем небольшое дело, и т.п. Вообще журналисту полезно при всех вариантах в ходе выбора объекта думать о том, насколько этот объект представляет (репрезентирует) аналогичные типы объектов.

Выборка максимальной вариации предполагает исследование объектов, обеспечивающих максимальное разнообразие информации, которая позволит изучить проблемы с разных сторон. Например, при изучении беспризорничества для журналистского материала мы будем выбирать детей из разных семей, с разной судьбой, разного возраста и образования.

Выборка однородных (гомогенных) объектов означает, что в фокус исследования попадают люди с однородными признаками и ставится цель как можно более глубоко изучить их ориентации или другие характеристики. Например, фокус-группа студенческой молодежи, зрителей канала СТС.

Цепная выборка по типу «снежного кома» обычно используется в экспертных опросах, при исследовании респондентов, которых нелегко найти. В таком случае опрашиваемых просят назвать имена, адреса, места пребывания тех, кто еще мог бы участвовать в данном исследовании. Обычно поиск завершают в том случае, если респонденты начинают повторяться и уже не приносят новой информации. Данный тип выборки гоже полезно знать журналисту, потому что ему часто приходится по этому методу разыскивать компетентных или причастных к изучаемой проблеме людей, чтобы всесторонне изучить ситуацию.

Однако на самом деле в настоящем репрезентативном исследовании выборка обычно бывает не одноступенчатая, а многоступснчатая, особенно если это касается широких общероссийских исследований. В таком случае сначала отбираются для исследования регионы, затем населенные пункты, потом места поиска респондентов, наконец, сами респонденты. Ниже приведены примеры многоступенчатых выборок.

Пример

Приведем классический вариант многоступенчатой общероссийской выборки. На сайте социологической организации «Левада-Центр» подробно описаны принципы, принятые в этом центре, который отделился от ВЦИОМ (напомним, что Ю. В. Левада долгое время был руководителем ВЦИОМ, который зародился в рамках РАН).

Выборка строится по многоступенчатой стратификационной схеме.

Первая ступень — отбор городских населенных пунктов и сельских административных районов, выступающих в качестве первичных единиц отбора. Сначала проводится предварительная стратификация первичных единиц отбора по 10 экономико-географическим регионам России: Северный и Северо-Западный; Центральный; Волго-Вятский; Центрально-Черноземный; Поволжский; Северо- Кавказский; Уральский; Западно-Сибирский; Восточно-Сибирский; Дальневосточный.

Внутри каждого экономико-географического региона единицы отбора стратифицируются по численности проживающего в них населения. Всего выделяется 66 страт. Общий объем выборки (2100 респондентов) распределяется между выделенными 66 стратами пропорционально доле взрослого населения каждой страты во взрослом населении России.

В каждой страте случайным образом отбираются по одному или несколько городских населенных пунктов или сельских районов из числа всех населенных пунктов и районов, принадлежащих этой страте, с вероятностью, пропорциональной численности взрослого населения, проживающего в этих пунктах. Всего в выборку «Мониторинга» включается 103 населенных пункта и сельских района (из них 35 областных центров, 38 городских населенных пунктов и 30 сельских районов в 38 республиках (краях, областях) России).

Вторая ступень — отбор избирательных участков. В городских населенных пунктах производится случайный отбор избирательных участков из числа всех избирательных участков этого населенного пункта; для сельских районов производится случайный отбор сел из общего списка всех сел этого района. Всего опрос проводится в 200 точках.

Третья ступень — отбор домохозяйств. Производится с использованием случайного маршрутного метода.

Четвертая ступень — отбор респондента в домохозяйстве. На данной ступени используется метод ближайшего дня рождения. В случае отсутствия необходимого человека интервьюер делает до трех повторных визитов. Исследование проводится на дому у респондента методом самозанолнения последним опросника. Некоторые разделы опросника могут быть заполнены в режиме личного интервью. В ходе работы интервьюеров осуществляется контроль маршрутных карт, а также выборочный 10%-й контроль проведенных интервью.

Для достижения лучшей репрезентативности данные исследования взвешиваются по полу, возрасту, уровню образования, региону, типу населенного пункта и политическим предпочтениям (по голосованию па последних выборах).

Статистическая погрешность выборки не превышает 3,0%.

Пример

Классической пятиступенчатой была выборка в исследовании аудитории «ЛГ». Объектом исследования являлась всесоюзная городская аудитория, поскольку газеты в основном выписывали жители городов. В расчет выборки включался очень важный для аудиторных исследований показатель плотности подписки на «Л Г» по регионам.

Первая ступеньвыбор регионов. Было сформировано три группы территорий по уровням плотности подписки: высокий, средний и низкий, которые в свою очередь делились на три подгруппы с высоким, средним и низким уровнями. В результате было сформировано девять типологических подгрупп. Естественно, что в каждой из них оказалось по несколько регионов, которые потом типологизировались с учетом экономических и административных показателей. Затем в подгруппе регионы отбирались путем жеребьевки, т.е. случайного, вероятностного выбора. Например, в группе с высоким уровнем плотности подписки наибольшим числом административных единиц были представлены Северо-Западный, Волго- Вятский и Поволжский, Уральский и Западно-Сибирский, Восточно- Сибирский и Дальневосточный экономические районы. Из числа единиц Северо-Западного экономического района, входящих в подгруппу со средним уровнем, жребием была выбрана Мурманская область, из подгруппы с низким уровнем из состава Восточно-Сибирского и Дальневосточного экономических районов — Приморский край и т.д.

Общее число планируемой выборки в 2000 чел. было распределено пропорционально общей численности подписчиков, попавших в выборку; например, в Московской области нужно было опросить 1351 чел., а в Калмыкии — всего четыре человека.

Вторая ступень — выбор представителей районов. Решено было проводить исследования в разных типах городских поселений — в административных центрах территорий и одном из городов областного и районного подчинения. Второй город был выбран путем деления всех городов данного региона на два (п : 2), т.е. попадался средний в списке город. Таким образом, в 19 регионах исследование проводилось в 36 городах. Например, в Узбекской ССР в выборку попали Ташкент (столица республики) и Бекабад.

Третья ступеньопределение численности внутри выбранных районов. Объем выборки между административным центром и вторым городом был распределен пропорционально объему подписки в данных городах. Выборка проводилась на месте.

Четвертая ступень — выбор мест наблюдения в городах. Приехав в город, где предстояло проводить опрос, нужно было выбрать количсство доставочных почтовых отделений, исходя из того, что на каждом опрашивалось 25 человек. Таким образом, в Москве было выбрано каждое 55-е отделение связи. Если нужно было опросить от 50 и более человек, выбиралось жребием три доставочных отделения.

Пятая ступень — выбор подписчиков для опроса. В почтовых отделениях тоже методом жребия в зависимости от количества опрашиваемых выбирались доставочные участки. Внутри участка опрашивались все подряд. На тот случай, если по адресу не окажется подписчиков и читателей «ЛГ», формировался запас (25—30%), для формирования которого существует особая методика.

Пример

Предположим, что изучается отношение студенчества г. Москвы к телепередачам. Как формировать выборку? В программе исследования необходимо определить объект. Например, это будут студенты разных типов вузов: государственных и коммерческих, гуманитарных, технических и естественных. Предположим, что также важно знать мнение студентов разных курсов. Выборка будет зависеть от того, какое количество групп нужно изучить. Если число групп будет очень большим, например, исследователей будут интересовать многопрофильные университеты, институты по разным направлениям — экономические, филологические, литературные, институты культуры, искусства, машиностроительные, текстильные и т.п., тогда и выборка должна включать группы всех этих типов.

Допустим, таких групп наберется 20. Минимальное количество людей, которых можно считать социологической группой, — не менее 25 чел. Следовательно, 20 • 25 = 500 чел.

Если исследователей будут интересовать не только профили вузов, но и разные внутривузовскис специализации, разные формы обучения (дневная, вечерняя, заочная), разные уровни обучения (бакалавр, специалист, магистр) и разные курсы, то, естественно, увеличивается количество групп и выборка. В данном случае выборка может быть стратифицированной, г.е. во всех типах вузов мы опрашиваем определенное количество студентов. Если же выборка распределяется в зависимости от реального количества студентов в разных вузах (тогда она будет репрезентативной), то, возможно, число выборки придется увеличить, чтобы в «малонаселенных» вузах, например в художественных, набрать необходимую группу для анализа.

Прежде всего нужно выбрать (путем жребия или систематического отбора) сами вузы, а потом в них также посредством жребия или типологического отбора — факультеты, затем на факультетах опросить студентов разных курсов, используя при этом систематический отбор по списочному составу внутри каждого курса.

Таким образом, формирование и реализация выборки — это сложное и трудоемкое дело, особенно если речь идет о репрезентативных исследованиях. В связи с этим самодеятельно составлять выборку в таких случаях нецелесообразно — этим должны заниматься профессионалы. Выборка — это основа социологического исследования. Даже если будет хорошая программа и прекрасные методики, можно напрасно потратить время и деньги, но не получить объективных данных, потому что выборка была сделана неправильно. Знание способов формирования выборки пригодится и для того, чтобы профессионально сформулировать заказ социологическим службам, суметь оценить качество их работы.

Однако, конечно, знания о типах выборки и способах ее формирования нужны сотрудникам редакций, чтобы провести своими силами конкретное локальное исследование, которое в этом случае может не претендовать на репрезентативность, но даст кое-какую информацию, например, необходимую для сбора материала. Если журналист пишет о беспризорных, а работает в одной из региональных газет, то его выборка может быть сформирована случайным путем: он поговорит с теми подростками (можно точно определить границы их возраста, например, от 13 до 15 лег), которых встретит на улицах, вокзалах, рынках. В таком случае, однако, журналист не будет писать в своей публикации, что это мнение беспризорников города, а назовет количество опрошенных им подростков и скажет о том, где их нашел. При проведении более строгого исследования нужно обратиться в социальные органы, где есть статистика и адреса таких подростков, и тогда можно сделать более репрезентативную выборку.

Если для журналистского опроса достаточно опросить 20—25 чел., то для серьезного репрезентативного исследования понадобится большее число опрашиваемых, но это будет зависеть от того, какие группы нужно изучать. Если, например, исследователя интересуют разные возрастные группы (дети до семи лет, 8—10, 11 — 13, 14—16), следует набрать в каждой группе но 25—30 чел., следовательно, выборка должна быть не менее 100 чел. Если нужно посмотреть, к какой социальной группе относятся их родители и другие люди, количество выборки увеличится, потому что увеличится количество групп, которые надо исследовать. При этом надо помнить, что компьютер, посчитав группы но возрасту, снова соберет их в один массив и разделит но признаку пола, а затем и по другим характеристикам.

Общий принцип такой: чем более локальным является исследование и более однородной группа, тем меньше может быть выборка. Общероссийские выборки обычно строятся на 1500—2000 опрошенных. При этом оказывается, что увеличение выборки приводит к весьма незначительному уточнению результатов и поэтому экономически нецелесообразно.

Если журналист решился сам заняться составлением выборки, особенно квотной, ему нужно знать процентное соотношение различных групп населения: мужчин и женщин, людей с разным уровнем образования, рода занятий и т.п. Обычно такая статистическая информация есть в органах статистики любого региона. На уровне России существуют данные переписи населения (последняя состоялась в 2010 г.) или специальные статистические справочники. Соответственно процентному соотношению разных групп в репрезентативном исследовании следует формировать выборку. Если же предпочтение отдается вероятностной выборке, целесообразно соотнести ее со статистикой по региону.

Важно не только правильно составить выборку, но и учесть время, когда следует, например, опрашивать население, чтобы застать всю семью в сборе. Если это опрос по месту жительства, нужно правильно рассчитать время такого опроса.

Однажды в Москве по репрезентативной выборке провели опрос населения о проблемах, которые больше всего волнуют москвичей. Однако время выбрали дневное, когда дома были в основном пенсионеры, для которых главной проблемой, естественно, было медицинское обслуживание. Исследователи так и не узнали, какие проблемы реально волнуют москвичей.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >