Практические примеры

Рассмотрим пример того, как можно на основе полученных эмпирических данных оценить параметры распределения случайной величины. Пусть у нас есть результаты оценки 20 мужчин и 20 женщин по шкале феминность – маскулинность опросника ММРI[1] (табл. 1.1).

Таблица 1.1

Результаты оценки феминности – маскулинности (в порядке возрастания)

Мужчины

Женщины

29

21

30

22

30

22

30

23

31

23

31

25

31

27

33

28

35

30

36

31

36

31

39

32

39

32

40

33

41

33

41

33

41

34

43

35

44

35

44

36

Оценка математического ожидания но данным эксперимента

Выполним оценку математического ожидания по данным эксперимента. Для начала посмотрим, как можно "вручную" оценить величины математического ожидания для выборки мужчин и женщин. Вспомним, что в этом случае у нас есть три варианта действий.

  • 1. Оценка среднего арифметического. Для того чтобы использовать эту возможность оценки математического ожидания, необходимо прежде всего подсчитать суммы всех тестовых баллов отдельно для выборки мужчин и женщин. Результат оказывается следующим: общая сумма баллов для мужчин составила 724, для женщин – 586. Теперь полученные суммы необходимо разделить на объем выборки. В нашем случае и мужская, и женская выборки содержат по 20 человек. Таким образом, воспользовавшись формулой (1.2), получаем, что оценка математического ожидания для выборки мужчин составляет 36,2 балла, для выборки женщин – 29,3 балла.
  • 2. Оценка моды распределения. Вспомним, что модой называют наиболее часто встречающееся значение. Для того чтобы оценить ее, построим для начала частотное распределение тестовых баллов для двух выборок. Результаты таких подсчетов представлены в табл. 1.2, где указаны все набранные испытуемыми баллы, а также число испытуемых – мужчин и женщин – набравших соответствующее число баллов. Те же данные можно представить более наглядно в виде гистограммы (рис. 1.3). Гистограмма отражает связь между наблюдаемыми значениями случайной величины и частотой их проявления. Непосредственно наблюдаемые значения, как правило, откладывают по горизонтальной оси (оси абсцисс), частоты их проявления – по вертикальной (оси ординат).

Таблица 1.2

Распределение набранных баллов феминности – маскулинности в группах мужчин и женщин

Набранный балл

Число испытуемых

Мужчины

Женщины

21

0

1

22

0

2

23

0

2

24

0

0

25

0

1

26

0

0

27

0

1

28

0

1

29

1

0

30

3

1

31

3

2

32

0

2

33

1

3

34

0

1

35

1

2

36

2

1

37

0

0

38

0

0

39

2

0

40

1

0

41

3

0

42

0

0

43

1

0

44

2

0

Таким образом, представленные данные свидетельствуют о том, что в группе мужчин три значения встречаются наиболее часто, по три раза: 30, 31 и 41 балл. Таким образом, в этой группе мы не обнаруживаем моды распределения. В группе женщин одно значение встречается чаще других – 33 балла. Это и есть мода распределения. Как видим, это значение несколько отличается от того, что было получено при расчете среднего арифметического, которое оказалось 29,3.

Гистограмма распределения тестовых баллов по шкале феминности – маскулинности в группах мужчин и женщин

Рис. 13. Гистограмма распределения тестовых баллов по шкале феминности – маскулинности в группах мужчин и женщин

3. Оценка медианы. Для того чтобы оценить медиану распределения в двух выборках, необходимо прежде всего упорядочить полученные нами данные по возрастанию. В табл. 1.1 данные представлены именно таким образом. Поскольку у нас по 20 испытуемых в каждой группе, то середина вариационного ряда, упорядоченного по возрастанию или убыванию, придется на 10–11 испытуемых: ведь до 10-го испытуемого оказывается ровно 9 испытуемых с меньшими или равными баллами и после 11-го испытуемого остается ровно 9 испытуемых с большими или равными баллами. Отсчитаем девять строк снизу и девять строк сверху, обнаружим, что и в мужской, и в женской выборках испытуемые, оказавшиеся на 10–11-м местах, показывают одинаковые результаты: у мужчин это 36 баллов, у женщин – 31 балл.

Таким образом, медианное значение феминности – маскулинности в мужской выборке практически соответствует значению среднего арифметического, тогда как для женской выборки мы обнаруживаем значение, которое оказывается чуть больше найденного ранее среднего арифметического, но чуть меньше найденной ранее моды распределения, фактически располагаясь между этими значениями.

Те же действия можно осуществить и с помощью компьютера. В простейшем случае для расчетов может быть использована любая программа электронных таблиц, как, например, MS Excel из офисного пакета корпорации Microsoft или ее аналоги в других офисных пакетах. Для оценки среднего арифметического необходимо будет воспользоваться функцией СРЗНАЧ[2]. Она возвращает среднее значение (среднее арифметическое) аргументов. Например, если диапазон А1:А20 содержит числа, формула = СРЗНАЧ(А1:А20) возвращает среднее значение этих чисел[3]. Для расчета моды и медианы необходимо соответственно воспользоваться функциями МОДА[4] и МЕДИАНА. Электронные таблицы также, как правило, предоставляют довольно развитые возможности для построения сводных таблиц и гистограмм.

Более эффективно позволяют провести необходимые вычисления специальные статистические программы. Так, известная программа статистического анализа SPSS Statistics, в последнее время разрабатываемая и поддерживаемая компанией IBM для ОС Windows, MacOS и Linux, содержит модуль описательной статистики. Его можно найти в разделе меню "Анализ". Аналогичные возможности представляют и другие статистические пакеты, наиболее мощным из которых представляется пакет статистического анализа STATISTIC А компании StatSoft Inc.

Рассмотрим, как можно оценить математическое ожидание полученных данных и построить их частотное распределение с помощью статистического пакета IBM SPSS Statistics (предполагается, что в нашем распоряжении имеется русская редакция этой программы для среды Windows).

Сначала необходимо правильно подготовить файл данных. Для этого запускаем программу, переходим на вкладку "Переменные" и вводим в первом столбце имена всех исследуемых переменных. В нашем случае это могут быть переменные "мужчины" и "женщины" (рис. 1.4), хотя в общем случае лучше создать две переменные: "пол" и "феминность" и далее использовать фильтры для отбора подходящих для анализа данных.

Создание переменных для анализа данных по феминности – маскулинности в IBM SPSS Statistics

Рис. 1.4. Создание переменных для анализа данных по феминности – маскулинности в IBM SPSS Statistics

Затем переходим на вкладку "Данные" и вводим имеющиеся у нас результаты измерения (рис. 1.5).

Для расчета среднего арифметического, моды и медианы необходимо выбрать в модуле описательной статистики пункт меню "Частоты", в появившемся окне – переменные для анализа, затем нажать кнопку "Статистики". Во вновь появившемся окне выбираем "Среднее", "Медиана" и "Мода" (рис. 1.6).

Для построения гистограмм в окне "Частоты" выбираем пункт "Диаграммы" (рис. 1.7), в появившимся окне выбираем пункт "Гистограммы". Также при необходимости можно отметить чекбокс "Показать на гистограмме нормальную кривую". В этом случае можно будет сравнить имеющееся частотное распределение с теоретически возможным нормальным распределением.

Ввод данных по феминности – маскулинности во вкладке

Рис. 1.5. Ввод данных по феминности – маскулинности во вкладке "Данные" в IBM SPSS Statistics

Расчет моды, медианы и среднего арифметического с помощью статистического пакета SPSS Statistics

Рис. 1.6. Расчет моды, медианы и среднего арифметического с помощью статистического пакета SPSS Statistics

Построение гистограммы с помощью статистического пакета IBM SPSS Statistics

Рис. 1.7. Построение гистограммы с помощью статистического пакета IBM SPSS Statistics

  • [1] Данные получены студенткой РГГУ Ю. Смирновой в ее курсовой работе, выполненной в 2004 г. под руководством И. Е. Высокова.
  • [2] Предполагается, что используется русская версия MS Office 2013.
  • [3] Диапазоном называют две или более ячеек листа. Ячейки диапазона могут быть как смежными, так и несмежными.
  • [4] В MS Excel, начиная с версии 2010, для вычисления моды рекомендуется использовать функции МОДА.ОДН и МОДА.НСК соответственно для вычисления одной и нескольких мод распределения.
 
< Пред   СОДЕРЖАНИЕ     След >