ИСПОЛЬЗОВАНИЕ АНАЛИТИЧЕСКОЙ СТАТИСТИКИ В МАРКЕТИНГЕ

ТЕОРИЯ АНАЛИТИЧЕСКОЙ СТАТИСТИКИ В МАРКЕТИНГЕ

4.1. Виды и применение выборочного наблюдения

Существуют два основных вида сбора первичной информации: сплошной (получение всех сведений подряд, без пропусков) и выборочный (отбирается лишь часть данных). В статистике сбор данных получил название «наблюдение». Сплошное наблюдение используется довольно редко и, как правило, проводится государственными органами статистики на постоянной основе. Например, государство в заданные периоды времени проводит на макроуровне переписи, в том числе перепись населения, или сплошную регистрацию основных активов в отраслях промышленности и т.п. Поскольку сплошное наблюдение требует больших затрат как денежных средств, так и времени, а кроме того, является сложным в организации, то наибольшее распространение получило выборочное наблюдение.

Выборочное наблюдение — вид несплошного наблюдения, при котором из генеральной совокупности отбирают заранее определенное число случайных величин или данных. Таким образом, механизм проведения выборочного наблюдения основан на двух постулатах — случайности при отборе единиц признака и степени достоверности совпадения, с которой предполагаемый результат выборки будет соответствовать действительному значению определяемого параметра ГС. Именно от последнего постулата (параметра) зависит, какой должен быть объем выборки.

Выделяют следующие виды выборочного наблюдения:

  • • по технике проведения:
    • — с повторной выборкой,
    • — бесповторной выборкой;
  • • по состоянию самой генеральной совокупности:
  • — без нарушения ее структуры,
  • — с нарушением ее структуры.

При повторной выборке информацию о единице признака (отобранный элемент) возвращают в ГС, после того как проведено наблюдение и получена требуемая информация, ради которой проводится выборка.

Естественно, что речь идет о возвращении в исходную совокупность различного вида неодушевленных носителей или элементов, где записаны интересующие сведения о единицах признака. Это могут быть карточки или картотеки, формуляры, листы учета кадров и т.п. При бес- повторной выборке элемент с информацией не возвращают в ГС.

Назовем способы проведения выборки без нарушения структуры или расположения единиц признака в исходной совокупности данных:

  • • случайный отбор (с помощью таблицы случайных чисел или генератора таких чисел в компьютере);
  • • отбор по слоям, уровням, категориям, отраслям или территориям совокупности данных (стратифицированная выборка);
  • • серийная выборка (отдельной серии, партии товара и т.д.).

В свою очередь, при нарушении исходной совокупности данных применяют:

  • • механическую (систематизированную) выборку;
  • • выборку с перемешиванием единиц признака (они произвольно вращаются в барабане, их отбирают наугад из специальной урны и т.п.).

Для получения механической (систематизированной) выборки необходимо случайно выбрать первый элемент выборки. Затем все элементы или единицы совокупности данных располагают в ряд и осуществляют с постоянным шагом отбор элементов (отбор, например, каждой 5-й или 10-й единицы признака производится в любом направлении — с начала или с конца ряда, в который расположили сведения о единицах признака изучаемой совокупности данных).

Широко известно, что выборочное наблюдение проводят с целью вынести суждение о генеральной совокупности по отрывочным данным выборочной. Собственно, основная причина применения выборки связана с несопоставимостью объемов ГС и выборки.

Конечно, у выборки есть множество преимуществ, в том числе, как указано выше, она позволяет экономить (деньги, время проведения, трудозатраты), иногда она безальтернативна (например, при необходимости проверки качества герметично закрытых продуктов, веществ, жидкостей) и т.п. Однако выборка имеет и существенный недостаток — неточность полученных данных.

Можно обсуждать, какой из этих способов наблюдения точнее, однако ясно одно — в выборке с возвращением, или в повторной выборке, вероятность каждого элемента или единицы признака быть отобранным является одинаковой, она не уменьшается с увеличением количества наблюдений в выборке. Кроме того, повторная выборка интересна в теоретическом плане — она позволяет значительно увеличить объем выборки (в этом случае он может на порядок и более превосходить исходную совокупность данных), что позволяет применить к ней закон больших чисел.

Как уже говорилось выше, использование при анализе генеральной совокупности данных метода выборочного наблюдения, или выборки, обязательно предполагает случайный отбор единиц признака. Подавляющее большинство статистических моделей, используемых на практике, основывается на фундаментальном понятии «независимая случайная величина».

Сущность случайного явления, события или результата можно воспринимать очень широко. Так, отвлекаясь от экономики, заметим следующее. Тот человек, кто стоит на остановке, не оборудованной электронным табло с расписанием, может сказать, что автобус или троллейбус прибывает в случайные моменты времени. В случае если на улице перед ним светящееся табло с расписанием, то будущий пассажир следит, нет ли непредвиденного отклонения общественного транспорта от расписания. В этом случае при отклонении получается неожиданное число в расписании движения транспорта. Следовательно, с понятием «случайный» часто связывают обозначение или понятие чего-то (или кого-то) непредсказуемого или неизвестного.

Действительно, в экономике выборочное наблюдение напрямую связано со случайностью. Именно с выборочным наблюдением, или выборкой, связаны два вида случайности: случайное значение числа и неизвестная частота появления конкретного числа. Часто случайные числа вместо двух неизвестных (значения и частоты появления числа) содержат только одно. Например, рассмотрим случай с реализацией билетов на концерт в конкретном зале. Конечно, в этом зале известно и число зрительных мест, и цены на них для конкретного развлекательного мероприятия. Сумма денег за каждое место — это действительные числа, а количество проданных мест — случайная величина. Таким образом, если исключить аншлаг на концерт, то непредсказуемо только число проданных билетов.

Поставим вопрос по-другому: в этом же зале необходимо сделать выборку и узнать число зрителей, которым концерт понравился. Проблема заключается в том, что зачастую, в том числе и в рекламных целях, выборку проводят предвзято и учитывают в основном мнение «группы поддержки» того артиста, который выступал в тот вечер. Следовательно, с беспристрастностью и соблюдением всех правил проведения выборки связано, получится или нет реальный результат исследования. Поэтому случайность отбора (той или иной) единицы признака — основа объективности собранной информации. Это очевидно, поскольку любая направленность в таком деле искажает суть явления, процесса или мнения.

Насколько случайное событие произошло случайно? Если воспользоваться генератором случайных чисел, то получим алгоритм, порождающий последовательность чисел гь г2, г3, ..., г„, которую получили в результате специальной программы по обработке компьютером множества чисел. В качестве основой теоретической предпосылки генератора служит постулат: чтобы считать последовательность случайной, нужно убедиться, что для каждого наблюдения с порядковым номером к > 0 все числа различных комбинаций цифр встречаются в последовательности с приблизительно одинаковой частотой.

Кроме того, помимо компьютера, можно воспользоваться таблицей случайных чисел, что также обеспечит случайность отбора единиц признака из генеральной совокупности. Приведем пример использования такой таблицы.

Пример 4.1

Предположим, база данных маркетинговой фирмы содержит пронумерованный список телефонов (с 1-го по 2500-й номер) юридических лиц и постоянных покупателей (они отвечают на звонки этой фирмы) и необходимо выбрать номера 100 телефонов. Выберем и область (границы номеров в телефонной книге), кому будем звонить. Допустим, из объема 2500 порядковых номеров в списке телефонов останавливаемся на абонентах, записанных в списке с 100-го по 400-й номер телефонной книги. Чтобы обеспечить непредвзятость выбора, обратимся к таблице случайных чисел.

Таблица случайных чисел состоит из колонок, в которой содержатся пятизначные числа. Таблицы случайных чисел могут быть нескольких видов и содержать разный объем чисел — в диапазоне от 500 до 800 раздельных групп чисел. Обратимся ко второму варианту, где в каждой строке содержатся по восемь пятизначных чисел, а вся таблица содержит сто строк.

Сами числа выбираются произвольно. Предположим, что первые 18 телефонов из намеченных ста выбираются следующим образом. Наугад обратились ко второй строчке, выписали первое число в этом ряду — 78 240. Затем решили продолжить, и подряд выписываем еще семь чисел, заполняя весь второй ряд. Затем переходим в третий ряд и из него произвольно выписываем еще три числа. Все выписанные пятизначные числа располагаем в строчку:

78240 43195 24837 32511 70880 22070 52622 61881 00833 88000 67299.

Разделяем этот числовой ряд в группы по три цифры:

782 404 319 524 837 325 117 088 022 070 526 226 188 100 833 880 006 729.

Таким образом, из 55 цифр использовано 54, и осталась одна цифра 9.

Для выбранного сектора выбираем только значения цифр от 100-го до 400- го. Эти отобранные значения цифр выписываем и получаем результат: 319 325 117 226 188 100 — так получены первые шесть номеров из 50-ти. Затем работу с таблицей случайных чисел следует продолжить вплоть до получения нужного количества абонентов.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >