Меню
Главная
Авторизация/Регистрация
 
Главная arrow Математика, химия, физика arrow БИЗНЕС-СТАТИСТИКА

АНАЛИЗ ВАРИАЦИИ И КОРРЕЛЯЦИИ

В результате изучения главы 3 студент должен: знать

• значение вариации и методы измерения вариации;

• показатели центра и характера распределения;

• методы построения парных и множественных уравнений регрессии; уметь

• анализировать вариацию, выявлять закон распределения;

• совместно рассматривать показатели центра распределения и вариации;

• оценивать однородность данных;

• измерять дифференциацию явления, используя структурные показатели ряда распределения;

• измерять корреляцию;

• изучать зависимости, строить уравнения регрессии;

• анализировать во взаимосвязи экономические явления и процессы;

• анализировать и интерпретировать данные статистики о бизнес-процессах и явлениях;

• выявлять тенденции изменения процессов; владеть

• методикой построения рада распределения,

• методикой выявления закона распределения;

• методикой построения уравнений парной и множественной регрессии;

• программными средствами анализа вариации и корреляции.

Анализ вариации

Первичная обработка данных включает ранжирование по возрастанию или по убыванию значений переменной х, расчет среднего значения, моды, медианы, разброса значений (xmax, xmin), среднего отклонения от средней, коэффициента вариации, а также характеристик формы распределения, таких как асимметрия и эксцесс.

Рассмотрим пример. На основании учета отработанного времени было рассчитано среднее число часов сверхурочного времени, отработанного каждым из 50 работников предприятия в среднем за неделю второго квартала (апрель—июнь) (табл. 3.1).

юз

Исходные данные

Номер

работника

Количество сверхурочных часов в неделю х

Номер

работника

Количество сверхурочных, часов в неделю х

1

0

26

6

2

1

27

7

3

2

28

7

4

2

29

7

5

3

30

7

6

3

31

7

7

2

32

7

8

2

33

7

9

4

34

7

10

4

35

7

11

4

36

7

12

4

37

8

13

4

38

8

14

4

39

8

15

4

40

8

16

5

41

9

17

5

42

9

18

5

43

9

19

5

44

9

20

5

45

10

21

5

46

10

22

6

47

11

23

6

48

11

24

6

49

11

25

6

50

11

Все работники упорядочены от минимального до максимального количества часов сверхурочной работы. Минимальное число сверхурочных равно нулю, максимальное — 12 ч. Рассчитаем интервал для проведения группировки (ix):

Если принять число групп, равное т = 3, то получим следующую группировку (табл. 3.2), где/—частота (frequency) появления значения х. Полученная группировка не раскрывает характера распределения. Руководство предприятия нуждается в понимании закономерности сверхурочных: ведь они оплачиваются по повышенному тарифу, что влияет на объем затрат (издержек). Для большей детализации примем число групп, равное 6 (табл. 3.3). Тогда интервал группировки составит

Таблица 3.2

Результат группировки

Количество отработанных сверхурочных часов в неделю х

Число человек /

0—4

15

4—8

25

8—12

10

Таблица 3.3

Результат группировки

Количество отработанных сверхурочных часов х

Число человек/

0—2

2

2—4

6

4—6

13

6—8

15

8—10

8

10—12

6

Итого

50

Рассчитаем среднее количество отработанных сверхурочных часов по сгруппированным данным:

по данным примера х =6,56 ч.

Среднее квадратическое отклонение по сгруппированным данным рассчитывается по формуле

по данным примера стА. = 2,6 ч.

Показатель асимметрии имеет вид

по данным примера As = -0,22. Значение As позволяет заключить, что асимметрия несущественная, отрицательная, т.е. модальное число сверхурочных (от 6 до 8 ч) слегка смещено влево от средней, Мо < х. Можно ожидать на предприятии тенденции уменьшения сверхурочных.

Покажем на графике кривую нормального распределения (рис. 3.1). Рассматриваемое распределение достаточно близко к нормальному, т.е. на число часов сверхурочных влияет множество случайных причин, ни одна из которых не является определяющей.

Рис. 3.1. Кривая нормального распределения — симметричная (нулевая скошенность и нулевой эксцесс)

На рис. 3.2 представлены нормальное и асимметричные распределения, часто встречающиеся в конкретных задачах. Асимметрию измеряют как через разность (х-Мо), так и через центральный момент третьего порядка, д3:

ст3 — среднее квадратическое отклонение в третьей степени.

Если As > 0, то асимметрия правосторонняя, если As < 0, то асимметрия левостронняя.

Эксцесс характеризует крутизну (островершинность) распределения. Показатель эксцесса строится как отклонение от Ех = 3 (для нормального распределения):

где /х4 — центральный момент четвертого порядка; а4 — среднее квадратическое отклонение в четвертой степени.

На рис. 3.3 показаны нормальное и плосковершиннное распределения

Рис. 3.2. Нормальное (Л) и асимметричные распределения (В — правосторонняя асимметрия, С — левосторонняя асимметрия)

Рис. 3.3. Нормальное и плосковершинное распределения (с отрицательным эксцессом)

Островершинность распределения свидетельствует о высокой однородности данных, плосковершинность — о значительной дисперсии (неоднородности). Поскольку в рассматриваемом примере асимметрия невелика, проверим гипотезу о нормальности распределения.

Плотность нормального распределения Дх) рассчитывается по формуле

хх

Если от х перейти к z, где z =-, то а = 1, z =0. В этом случае фор-

ст

мула плотности распределения cp(z) имеет вид

Найдем параметры кривой по эмпирическим данным (табл. 3.4).

Таблииа 3.4

Расчет теоретических частот

Количество отработанных сверхурочных часов х

Число человек, fi

X;X

z = —--

а

Ф(г)

//

0—2

2

1

-2,14

0,0404

2

2—4

6

3

-1,37

0,1561

6

4—6

13

5

-0,60

0,3332

13

6—8

15

7

0,17

0,3932

15

8—10

8

9

0,94

0,2565

10

10—12

6

11

1,71

0,0925

4

Итого

50

50

Рассчитаем нормированное отклонение z, далее по таблице распределения ф(г) находим значения функции, затем определяем теоретические частоты по формуле

где п — объем выборки; i — интервал.

Результаты расчетов представлены на рис. 3.4.

Рис. 3.4. Эмпирическое и теоретическое распределение числа работников по количеству отработанных сверхурочных часов

Выполним статистическую проверку выдвинутой гипотезы о принадлежности данного распределения к нормальному. Для этого рассчитаем критерий согласия Пирсона у2:

Табличное значение критерия у} (а = 0,05; dj- = 6-3 = 3) равно 7,81. Табличное значение критерия согласия больше фактического, следовательно, гипотеза принимается. С вероятностью 95% можно утверждать, что в основе изучаемого распределения лежит закон нормального распределения.

Для устойчивости многих моделей в области экономики, финансов, управления рисками, эконометрики и страхования большое значение имеет тяжесть хвостов распределений. Наличие таких хвостов характерно для редких событий.

В случаях, когда редкими событиями нельзя пренебречь, а средние значения являются неинформативными, можно говорить об анализе распределений с тяжелыми хвостами. Распределение имеет тяжелый хвост, если его плотность распределения убывает медленнее плотности распределения экспоненциального закона, т.е.

Более строгое математическое определение распределениям с тяжелыми хвостами дается в диссертации С. Ю. Новака:

• для левого хвоста распределения

где L(x) убывает медленно, т.е.

• для правого хвоста распределения

а > 0 — показатель скорости убывания хвоста распределения.

При этом сходимость по t должна быть равномерной на компактных множествах.

Как показал Р. Ибрагимов, в моделях стоимостной меры риска (VaR) диверсификация становится субоптимальной, если распределения рассматриваемых рисков имеют очень тяжелые хвосты, риски с индексом тяжести z < 1 и бесконечными средними. Для рисков, распределения которых имеют умеренно тяжелые хвосты с индексом тяжести z > 1 и конечными первыми моментами, диверсификация является оптимальной.

Р. Ибрагимовым и Дж. Вальденом показано, что для продуктов с низкими предельными издержками оптимальная стратегия продавца заключается в продаже товаров по отдельности, если распределение ценности товаров для потребителей имеет очень тяжелые хвосты. Если

же это распределение имеет умеренно тяжелые хвосты, оптимальной стратегией для монополиста является продажа товаров в едином пакете.

Р. Ибрагимов обосновал, что если распределения сигналов, которые фирмы получают от потребителей, имеют умеренно тяжелые хвосты и фирмы используют для оценки идеального продукта выборочное среднее, то число и типы участников рынка имеют выраженную зависимость от их значений в прошлом. В таких условиях крупные фирмы имеют преимущество перед фирмами меньшего размера. Это свойство заменяется на противоположное в случае сигналов с очень тяжелыми хвостами распределений. В таком случае, с большой долей вероятности фирмы меньшего размера могут стать крупными в следующем периоде и наоборот, размер больших фирм уменьшится.

Утверждение, что динамика характеристик распределения может служить индикатором эволюции структуры совокупности, высказал М. М. Юзбашев (1984).

Как видим, анализ характера распределения и вариации позволяет ответить на многие вопросы. Прежде всего, это касается оценки риска: чем выше вариация, тем выше риск (см. гл. 10).

Показатели вариации и характеристики центра распределения помогают решить, например, такую важную задачу, как вероятность выездной налоговой проверки. Ответ на данный вопрос может быть получен путем выполнения следующих этапов работы:

1) формирование эталонных показателей;

2) выявление согласованности изменения показателей;

3) определение очередности отбора организаций для налоговой проверки.

Среднее значение — это величина признака, которая приходилась бы на каждую единицу совокупности при равномерном распределении всего объема признака между ними. Мода — значение признака с наибольшей частотой появления, медиана — значение признака в середине ряда распределения.

Довольно часто в экономических исследованиях наблюдаются без- модальные (равномерные) совокупности наблюдений. Показателем, характеризующим совпадение характеристик центра распределения, Мо их является коэффициент асимметрии.

Если распределение значений изучаемого показателя симметрично, то медиана и мода совпадают со средней, коэффициент асимметрии равен нулю:

Эталонное значение определяется как характеристика центра распределения. Значение показателя является типичным, если оно является одновременно средней, медианой и модой:

по

Коэффициент асимметрии может быть близок к нулю, но не равен ему. Для оценки значимости отклонения коэффициента асимметрии от нулевого значения рассчитывается средняя квадратическая ошибка коэффициента асимметрии по формуле

где п — число наблюдений.

Если выполняется соотношение

то асимметрия считается статистически незначимой. В противном случае делается вывод о наличии значимой асимметрии. На практике в качестве критического значения принимают As = 0,5, усиливая тем самым точность выводов. Если критическое значение коэффициента асимметрии As > 0,5, то совокупность неоднородна и среднее значение не является типичным.

Если коэффициент асимметрии отрицателен, то это означает, что большая часть наблюдений имеет значение показателя ниже среднего и мода с медианой смещены в сторону меньших значений по сравнению со средней. При положительной асимметрии наблюдается обратное соотношение.

Исходя из этого, методика определения эталонного значения показателя включает следующие шаги.

1. Для каждого предприятия (организации) по данным бухгалтерской отчетности определяется значение исследуемого показателя.

2. Из совокупности удаляются предприятия, имеющие отрицательные значения показателя (для показателей, расчет которых основан на величинах прибыли/убытка), или имеющие неопределяемые значения (нет данных, деление на ноль).

3. По оставшейся совокупности данных п рассчитываются:

• среднее значение

где х, — значение анализируемого признака для i-ro предприятия; п* — количество предприятий (без удаленных).

Затем рассчитывается коэффициент асимметрии. Среднее квадратическое отклонение определяется по формуле

ш

4. Значение коэффициента асимметрии сравнивается с критическим значением As = 0,5. Если фактическое значение коэффициента асимметрии по модулю ниже критического |As|<0,5, то совокупность признается симметричной относительно среднего значения и в качестве эталонного принимается найденное среднее значение (х*).

При | As | > 0,5 необходимо провести процедуру устранения асимметрии в соответствии с п. 1—3.

5. Для всех значений показателя находится величина отклонения индивидуального значения от среднего по совокупности (d,):

)

6. Определяется максимальное абсолютное отклонение d,:

7. Предприятие, имеющее max(df), исключается из рассматриваемой совокупности. Таким образом, общее количество наблюдений составит (п*-1).

8. Для оставшихся предприятий повторяются шаги, начиная с третьего пункта. Если коэффициент асимметрии по-прежнему превышает критическую отметку, то процедура устранения асимметрии и пересчета коэффициента асимметрии повторяется, начиная с п. 3. Как только условие п. 4 оказывается выполненным, процесс заканчивается.

9. Все показатели ранжируются с точки зрения влияния на сумму налоговых выплат. По значениям каждого показателя определяется зона налогового риска по удаленности значений показателя от эталонного.

Результатами реализации процедуры выявления эталонных значений показателя являются:

• исходные среднее значение (х) и коэффициент асимметрии (As);

• эталонное значение показателя (хэ), а также среднее квадратическое отклонение (аэ) и коэффициент асимметрии (As3) для усеченной (эталонной) совокупности, в которой х = хэ;

• сводка номеров предприятий, удаленных при проведении процедуры определения эталонного значения, их анализ по причинам отсева — отрицательные значения показателя, неопределяемые значения показателя; максимальное отклонение от средней;

• график распределения индивидуальных значений признака относительно исходного среднего значения и график распределения индивидуальных значений признака относительно эталонного значения.

По завершении формирования эталонных значений показателя выполняется процедура анализа вариации индивидуальных значений показателя по отклонениям от эталонного.

Данная процедура основывается на том положении, что в нормально распределенной совокупности вероятность получить отклонение индивидуального значения от среднего (в нашем случае—эталонного) составляет

менее 1%. Выделенные хвостовые значения образуют зону риска, т.е. это те предприятия, для которых шанс выездной налоговой проверки более высокий, нежели для предприятий, тяготеющих к центру распределения.

 
Посмотреть оригинал
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Предыдущая   СОДЕРЖАНИЕ РЕЗЮМЕ ПОХОЖИЕ СТАТЬИ   Следующая >
 
Предметы
Агропромышленность
Банковское дело
БЖД
Бухучет и аудит
География
Документоведение
Журналистика
Инвестирование
Информатика
История
Культурология
Литература
Логика
Логистика
Маркетинг
Математика, химия, физика
Медицина
Менеджмент
Строительство
Педагогика
Политология
Политэкономия
Право
Психология
Религиоведение
Риторика
Социология
Статистика
Страховое дело
Техника
Товароведение
Туризм
Философия
Финансы
Экология
Экономика
Этика и эстетика