Статистический вывод и вероятность

Статистика — это наука о методах сбора данных, их обработки и анализа для выявления закономерностей, присущих изучаемому явлению.

Социальная статистика — основа современной эмпирической социологии. Ее предметом служит общество во всем многообразии его форм и проявлений, а также количественная сторона социальных явлений. Она аккумулирует обобщенные социальные показатели по регионам, отраслям, социальным группам (рис. 4.3).

Статистика подразделяется не только по отраслям, но и по видам. В частности, она подразделяется на описательную и аналитическую. В первой основными средствами измерения выступают пропорция, норма, процент, частотность распределения, измерение основной тенденции, индексы и шкалы. Аналитическая статистика начинается с вероятностной логики и теории выборки, которые выводят социолога за границы простого описания, ведут его к обобщению и анализу.

Статистический вывод — это индуктивное обобщение, построенное на основе математической обработки и обобщения некоторого множества единиц исследования. Вы опросили 1500 избирателей и выяснили, что более 60% пожилых людей (старше 60 лет) на последних выборах голосовали за коммунистов. В данном случае изучалась статистическая связь двух переменных: возраст и электоральное поведение. В результате можно сделать статистический вывод: чем старше возраст респондента, тем выше вероятность того, что он проголосует за коммунистов. И наоборот.

В основе статистического вывода лежит индуктивное рассуждение, приводящее к утверждениям, верным лишь с определенной степенью достоверности. Строгий смысл степени достоверности обеспечивается математическими методами и вероятностным подходом, образующими основы современной статистической теории[1].

Основные направления и отрасли социальной статистики

Рис. 4.3. Основные направления и отрасли социальной статистики

Статистический вывод социолог получает после обработки анкет и анализа первичных данных. Это количественный вывод. В отличие от него два других рассмотренных ранее типа вывода — логический и теоретико-гипотетический — являются качественными. Связь между ними следующая. При составлении программы исследования ученый заявляет (выдвигает теоретическую гипотезу) о возможной связи между двумя переменными - возрастом и электоральным поведением. Позже, когда он составил анкеты и провел исследование, при математической обработке данных строится статистический вывод. Это две стороны одной медали, первый служит пробным проектом, теоретическим макетом возможной связи двух переменных, а второй — его эмпирическим подтверждением.

Статистический вывод невозможно делать на малых совокупностях, скажем в 35 респондентов. Если в вашей анкете есть вопросы, к которым предусмотрено, скажем, по 5—7 закрытий, то, разделив 35 на 7, получим 5. А минимальным наполнение каждой ячейки должно быть 7. «Статистический вывод начинает работать тогда, когда единиц исследования достаточно много. “Достаточно много” означает, что при условии равновероятного попадания в каждую клетку пространства признаков наполнение каждой из них составит не менее семи единиц»[2]. Одна статистическая ячейка — это один признак. Допустим, вы спрашиваете респондента о том, какие каналы ТВ он предпочитает смотреть и предлагаете выбрать 5 позиций из 35 наименований. В этом списке один канал — это один признак или одна ячейка. Ее должны наполнить не менее 7 респондентов. Конечно, чем их больше, тем меньше вероятность ошибки, поэтому статистический вывод хорошо работает на больших выборках.

В эмпирическом исследовании статистические связи выполняют функцию цементирования первичных данных, какую в теоретическом знании выполняла логика. Статистические закономерности и статистические правила — таковы логика эмпирического знания и механизм его построения.

Статистический вывод — область вероятностного знания. Вероятность — числовая характеристика степени возможности появления какого- либо случайного события при тех или иных определенных, могущих повторяться неограниченное число раз условиях. Она изучается в теории вероятностей — разделе математики, в котором по данным вероятностям одних случайных событий находят вероятности других событий, связанных каким-либо образом с первыми. Одна из основных задач теории вероятностей состоит в выяснении закономерностей, возникающих при взаимодействии большого числа случайных факторов. Математическая статистика понимается также как наука о методах умозаключения, о свойствах соответствующей генеральной совокупности на основе наблюдений над репрезентативной выборочной совокупностью, причем данные наблюдений отбираются из генеральной совокупности в случайном порядке.

Когда мы находим количественную меру, то автоматически переходим в мир вероятностных утверждений. Мы можем сказать, что с достоверностью, равной 60—70%, женщины склонны выбирать в качестве брачного партнера мужчину с высшим образованием. Здесь процентная доля, которая заменяет размытые формулировки типа «некоторые», «большинство» или «часть», показывает степень вероятности наступления данного события. Наука тоже может ошибаться в своих прогнозах. Человек непредсказуем в своих действиях, еще менее предсказуемы массы людей, которые, объединяясь, часто ведут себя не так, как повела бы сумма разрозненных индивидов.

Вся социология, если говорить о ее математическом аппарате, построена на вероятностях, описываемых в процентных распределениях. Мы говорим: «72% избирателей данного округа проголосуют за кандидата М». Это значит, что с вероятностью в 72% избиратели на предстоящих выборах отдадут предпочтение именно ему. Добавим сюда ошибку выборки, скажем, в 5% и можем утверждать, что избиратели проголосуют за М с вероятностью 72 ± 5%.

Степень вероятности свидетельствует, во-первых, об ограниченных возможностях самой науки; во-вторых, о непредсказуемости, вариативности или изменчивости поведения объекта исследования; в-третьих, о высокой культуре научного исследования, которая выражает себя требованием осторожно судить о реальности.

Статистический вывод основан на статистическом анализе результатов выборочных исследований и направлен на оценку параметров совокупности в целом. В таком случае результаты выборочных исследований выступают всего лишь отправной точкой для получения общих выводов.

Например, автомобилестроительная компания провела два независимых исследования с целью определения степени удовлетворенности потребителей своими автомобилями. Первая выборка включала 100 потребителей, купивших данную модель в течение последних шести месяцев. Вторая выборка включала 1000 потребителей. В ходе телефонного интервьюирования респонденты отвечали на вопрос: «Удовлетворены или не удовлетворены вы купленной вами моделью автомобиля?» Первый опрос выявил 30% неудовлетворенных, второй — 35%.

Поскольку существуют ошибки выборки и в первом, и во втором случаях, то здесь можно рассуждать следующим образом. Для первого случая около 30% опрошенных выразили неудовлетворенность купленной моделью автомобиля, для второго случая — около 35% опрошенных. Какой же общий вывод можно сделать в данном случае? Как избавиться от слова «около»? Для этого введем показатель ошибки: 30 ± х% и 35 ± у% и сравним х и у. Используя логический анализ, можно прийти к заключению, что большая выборка содержит меньшую ошибку и что на ее основе можно сделать более правильные выводы о мнении всей совокупности потребителей. Видно, что решающим фактором для получения правильных выводов является размер выборки. Данный показатель присутствует во всех формулах, определяющих содержание различных методов статистического вывода[3].

  • [1] См.: Рао С. Р. Линейные статистические методы и их применение. М., 1968.
  • [2] Батыгин Г. С. Лекции по методологии социологических исследований : учебникдля вузов. М., 1995. С. 67.
  • [3] См.: Голубков Е. П. Маркетинговые исследования // Маркетинг в России и за рубежом.2001. № 1.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >