Меню
Главная
Авторизация/Регистрация
 
Главная arrow Статистика arrow МАТЕМАТИЧЕСКАЯ СТАТИСТИКА ДЛЯ СОЦИОЛОГОВ
Посмотреть оригинал

Понятие случайной величины

В курсе по теории вероятностей обычно вводится понятие случайной величины. Но, к сожалению, довольно типичным является следующий диалог студентов и преподавателя, начинающего читать курс математической статистики после того, как студенты освоили курс теории вероятностей.

— Что такое случайная величина? Приведите примеры случайных величин из социологической практики.

Молчание.

  • — Допустим, что мы провели анкетный опрос, собрали данные. Присутствуют ли в этих данных хотя бы в каком-то виде случайные величины?
  • — Ну, например, мы подсчитали, что у нас 20% мужчин. Это и есть случайная величина.

Ответы студентов говорят о том, что у них зачастую складывается совершенно неверное представление о том, что такое случайная величина. Доля мужчин станет случайной величиной только в том случае, если единицей наблюдения у нас будет, например, вуз, и мы тем или иным способом подсчитаем, каков состав студентов каждого рассматриваемого вуза по полу. Допустим, в каком-го социологическом вузе — 20% юношей, в другом — 18, в техническом вузе — 83% и т.д. Здесь доля мужчин — случайная величина, 20% — одно из ее значений. При анкетном опросе в качестве случайной величины может выступать, например, возраст респондентов. Единица наблюдения — человек. 20 лет, 35 лет, 16лет —это значения нашей случайной величины. Далее мы увидим, что единицей наблюдения может быть даже выборка: для каждой такой единицы мы можем, например, вычислить среднее арифметическое значение возраста попавших в выборку респондентов. Средний возраст здесь — это случайная величина, среднее значение возраста для конкретной выборки — конкретное значение этой величины.

Подчеркнем, что случайная величина всегда задается некоторым распределением вероятностей встречаемости ее значений; далее будем говорить либо о распределении, либо о распределении вероятностей, либо о распределении случайной величины. Задать случайную величину — значит задать отвечающее ей распределение; задать некоторое распределение — значит задать некоторую случайную величину.

Мы будем рассматривать в основном числовые случайные величины, т.е. такие, значениями которых служат числа (хотя для социолога огромное значение имеют нечисловые случайные величины, статистика которых разработана весьма слабо)[1]. Случайная величина может быть одномерной, многомерной[2]; непрерывной (когда в принципе ее значением может быть любая точка числовой оси) и дискретной (когда она принимает счетное, чаше всего — конечное число значений).

Важно отметить, что понятия вероятности, распределения вероятностей и, соответственно, случайной величины сопрягаются с генеральной совокупностью. Изучая выборку, мы имеем делос выборочными оценками вероятностей и их распределений (в качестве таковых обычно фигурируют относительные частоты встречаемости соответствующих событий и частотные распределения), выборочными реализациями значений случайной величины (выступающих перед нами в виде значений некоторых признаков).

Подчеркнем также важность выделения двух видов случайных событий, задействованных при рассмотрении случайных величин в социологии.

Сама случайная величина установлена на множестве случайных событий, имеющих определенные вероятности. В качестве такого события для социолога, как правило, выступает выбор того или иного респондента (конечно, вместо респондентов могут фигурировать и другие объекты — разного рода малые и большие социальные группы, регионы и т.д.). Поэтому вероятность встречаемости подобных событий зависит от способа построения выборки.

Другой вид интересующих нас случайных событий — это события, состоящие в том, что те или иные случайные величины принимают те или иные значения. Другими словами, мы говорим о распределениях случайных величин. Выбрав того или иного респондента, мы можем определить соответствующее значение нашей случайной величины. Например, можем определить, что возраст выбранного респондента равен 23 годам. И мы относим возраст к категории случайных величин только в том случае, если можно говорить о распределении вероятностей встречаемости разных значений возраста (хотя это распределение может и не быть известным нам заранее).

Как известно, каждое распределение характеризуется определенным набором своих параметров. Наиболее популярные из них — меры отвечающих распределению средних тенденций (математическое ожидание, мода, медиана) и меры разброса значений случайной величины (например, дисперсия, среднее квадратическое отклонение, абсолютный размах). Изучением такого рода параметров мы и будем в основном заниматься.

  • [1] * Мы получаем значения нечисловой случайной величины, когда, скажем,каждому респонденту приписываем данную им ранжировку каких-либо объектов, вершину графа (теория графов используется при изучении малых групп) и т.д.О статистическом анализе таких случайных величин можно прочитать, например,в работе: Орлов А.И. Эконометрика. М.: Экзамен, 2002. С. 229—301.
  • [2] Вообще говоря, многомерные случайные величины не относятся к числовым,поскольку здесь речь идет о приписывании каждому респонденту (или любому другому измеряемому объекту) не числа, а набора чисел. Нечисловыми можно считатьи такие случайные величины, значения которых получены, например, по номинальной шкале, поскольку соответствующие числа не являются действительнымичислами в общепринятом смысле этого термина. Однако иногда будем рассматривать первые очень часто, вторые — наряду с «истинно» числовыми случайными величинами. Надеемся, что это не приведет к сумятице в сознании читателя.
 
Посмотреть оригинал
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 

Популярные страницы