Дискретные количественные данные

Для группировки дискретных количественных данных подсчитывают частоту встречаемости тх каждого признака xv При достаточно большом числе значений сгруппированный вариационный ряд может быть подвергнут дальнейшей группировке и преобразован в интервальный.

Сгруппированный дискретный вариационный ряд представляет собой k значений признака xv указанных вместе с соответствующими частотами т1 или частостями w,• = = т,/п. Эти частоты называют эмпирическими.

Значения признака хх

*0)

хт

*0)

x(k>

Частоты т,

Щ

т2

тi

Щ

Сгруппированный дискретный вариационный ряд графически представляют в виде гистограммы (которую мы рассмотрели для категориальных данных) или полигона.

Полигон — графическое изображение сгруппированного дискретного вариационного ряда в виде ломаной, соединяющей точки, по оси абсцисс соответствующие всем возможным значениям признака, а по оси ординат — значениям частот тг или относительных частот Wj = тг / п.

Масштаб по осям выбирают произвольно такой, чтобы была обеспечена необходимая наглядность. Так же, как и гистограмма, полигон позволяет оценить распределение частот значений дискретной переменной, выявить наиболее часто (мода) и редко встречающиеся значения признака.

Сгруппированный кумулятивный дискретный вариационный ряд представляет собой значения признака xif указанные вместе с соответствующими накопленными частотами тт или частостями wiu = тт/ п.

Значения признака xt

хт

х(2)

Х(к)

Накопленная частота min

Щи =

щ

Щи = щ +

т2

к

ть,=п = !т<

i= 1

Сгруппированный кумулятивный дискретный вариационный ряд графически представляют в виде кумуляты.

Кумулята — графическое изображение сгруппированного кумулятивного дискретного вариационного ряда в виде столбцов, при построении которого по оси абсцисс откладывают все возможные значения признака, а по оси ординат — накопленные частоты или накопленные относительные частоты, относящиеся к данному значению.

Кумулята показывает количество (или долю) объектов совокупности, значения признака которых не превышают заданного.

Пример 4.3

По данным представленной табл. 4.6 постройте вариационный дискретный ряд и получите различные графические изображения ряда данных — гистограмму, полигон и кумуляту частот и относительных частот ряда распределения.

Чтобы построить вариационный ряд, значения необходимо ранжировать в порядке неубывания. В Excel это легко сделать с помощью функции СОРТИРОВКА А —» Я. Полученный вариационный ряд числа опечаток представлен в табл. 4.7.

Но полученному вариационному ряду уже легко построить сгруппированный.

Исходная таблица числа опечаток, обнаруженных на каждой из 30 случайно просмотренных страниц книги

5

1

3

4

5

6

1

3

4

6

8

1

4

6

3

3

2

2

2

6

3

3

7

2

0

0

4

1

2

4

Таблица 4.7

Вариационный ряд числа опечаток, обнаруженных на каждой из 30 случайно просмотренных страниц книги

0

0

1

1

1

1

2

2

2

2

2

3

3

3

3

3

3

4

4

4

4

4

5

5

6

6

6

6

7

00

Если число значений велико, то нет необходимости строить вариационный ряд, можно сразу из исходных данных получить сгруппированный вариационный ряд с помощью функции Excel ЧАСТОТА, которая позволяет подсчитать частоты значений массива данных, попадающих в заданные интервалы или принимающих заданные значения (как у нас).

Для этого после определения возможных значений признака необходимо выделить область, состоящую из смежных ячеек, количество которых на единицу больше количества значений (выделена серым цветом), вызвать встроенную статистическую функцию ЧАСТОТА, выделить массив данных и массив значений признака в соответствующих окнах меню функции, нажать комбинацию клавиш для работы с матрицами CTRL + SHIFT + ENTER, после чего в выделенной области появятся частоты встречаемости значений в массиве данных.

Исходные данные

5

1

3

4

5

6

1

3

4

6

8

1

4

6

3

3

2

2

2

6

3

3

7

2

0

0

4

1

2

4

Частоты

2

4

5

5

6

2

4

1

1

0

Значения признака

0

1

2

3

4

5

6

7

8

Значения признака

_0_

_1_

_2_

_3_

  • 4
  • 5

_6_

_7_

8

Полученные частоты на данном небольшом массиве данных легко проверить по табл. 4.7.

Аналогично можно построить сгруппированный вариационный ряд с помощью модуля Excel АНАЛИЗ ДАННЫХ — Гистограмма.

Итак, полученный сгруппированный дискретный вариационный ряд и кумулятивный вариационный ряд частот и относительных частот числа опечаток на странице имеет вид, как в табл. 4.8.

Сгруппированный вариационный ряд числа опечаток, обнаруженных на каждой из 30 случайно просмотренных страниц книги

Значения признака число опечаток на странице

0

1

2

3

4

5

6

7

8

Частота ш, — число страниц с таким числом опечаток

2

4

5

6

5

2

4

1

1

Относительная частота

Wj = rrij/n

  • 2
  • 30
  • 4
  • 30

©| ^

  • 6
  • 30
  • 5
  • 30
  • 2
  • 30
  • 4
  • 30
  • 1
  • 30
  • 1
  • 30

Накопленная частота встречаемости — число страниц с числом опечаток не менее *, - пгт

2

6

И

17

22

24

28

29

30

Относительная накопленная частота Щи = тт/п

  • 2
  • 30
  • 6
  • 30
  • 11
  • 30
  • 17
  • 30
  • 22
  • 30
  • 24
  • 30
  • 28
  • 30
  • 29
  • 30

1

На основании данных табл. 4.8 можно построить все требуемые графики частот и относительных частот числа опечаток на странице — гистограмму, полигон и кумуляту.

По гистограмме (рис. 4.7, а) и полигону (рис. 4.7, 6) распределения легко определить моду — число опечаток на странице с максимальной частотой — здесь это три опечатки (встречается на шести страницах), и наиболее редкие значения признака — семь и восемь опечаток встречаются всего лишь по одному разу.

Гистограмма (а) и полигон (б) частот числа опечаток на странице

Рис. 4.7. Гистограмма (а) и полигон (б) частот числа опечаток на странице

Полигон строится по тем же точкам, что и гистограмма, просто имеет другой вид графика в виде ломаной.

Для построения кумуляты (рис. 4.8) используем накопленные частоты из табл. 4.8.

График кумуляты позволяет найти число объектов, имеющих значения признака, не превышающие заданного. Например, из табл. 4.8 и рис. 4.8 видно, что 24 страницы имеют число опечаток, не превышающее пять (от 0 до 5 опечаток).

Графики гистограммы, полигона и кумуляты относительных частот выглядят абсолютно аналогично, только по оси ординат у них, соответственно, находятся относительные частоты, и они показывают не число, а долю объектов. Для примера построим только гистограмму относительных частот (рис. 4.9).

Гистограмма относительных частот числа опечаток на странице

Рис. 4.9. Гистограмма относительных частот числа опечаток на странице

Графики относительных частот показывают долю объектов с соответствующим числом опечаток. Например, из рис. 4.9 и табл. 4.8 видно, что мода, равная трем опечаткам, имеет относительную частоту встречаемости, равную 0,2. Это означает, что 20% (6 из 30) всех объектов совокупности — исследуемых страниц — имеет ровно 3 опечатки.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >