Меню
Главная
Авторизация/Регистрация
 
Главная arrow Бухучет и аудит arrow АНАЛИЗ ФИНАНСОВО-ХОЗЯЙСТВЕННОЙ ДЕЯТЕЛЬНОСТИ
Посмотреть оригинал

Формализованные методы

Традиционные методы

Методы экономической статистики и способы обработки информации

Методы средних и относительных величин. Разработаны в рамках экономической статистики, адаптированы ею к особенностям исследования социально-экономических систем, широко применяются также во всех разделах микроэкономического анализа. Именно их широкая распространенность, простота и историчность в плане разработки дают основание условно называть их традиционными. Правильное понимание сущности средней определяет ее особую значимость в условиях рыночной экономики, когда средняя через единичное и случайное позволяет выявить общее и необходимое, выявить тенденцию закономерностей экономического развития.

Средняя величина — это обобщающая количественная характеристика совокупности однородных явлений по одному варьирующему признаку. Важнейшим условием применения средних величин в анализе является достаточное количество единиц в совокупности, по которой рассчитывается среднее значение признака. Данное условие становится решающим при применении выборочного наблюдения, когда необходимо обеспечить репрезентативности выборки.

Средние величины связаны с законом больших чисел. В силу действия этого закона при осреднении случайные отклонения индивидуальных величин взаимопогашаются и в средней выявляется основная тенденция развития. Средняя величина является равнодействующей всех факторов, оказывающих влияние на изучаемое явление, при ее расчете исключается влияние случайных (пертурбационных, индивидуальных), что позволяет определить закономерность, присущую исследуемому явлению.

Качественная однородность совокупности определяется на основе всестороннего теоретического анализа сущности явлений. Так, например, при исчислении средней урожайности требуется, чтобы исходные данные относились к одной и той же культуре (средняя урожайность пшеницы) или группе культур (средняя урожайность зерновых).

Однако нельзя сводить роль средних только к характеристике типичных значений признаков в однородных но данному признаку совокупностях. На практике современная статистика использует так называемые системные средние, обобщающие неоднородные явления (характеристики государства, единой народнохозяйственной системы: например, средний национальный доход на душу населения, средняя урожайность зерновых по всей стране реальный доход на душу населения, среднее потребление продуктов питания на душу населения, производительность труда).

Если исследуемое явление не является однородным, то его разбивают на группы, содержащие только однородные элементы. Для такого явления сначала рассчитываются средние по группам, которые называются групповыми средними — они будут выражать наиболее типичную величину явления в каждой группе. Затем для всех элементов рассчитывается общая средняя величина, характеризующая явление в целом. Она рассчитывается как средняя из групповых средних, взвешенных по числу элементов совокупности, включенных в каждую группу.

Также условием применения средней величины в анализе является определение максимального и минимального значений признака в изучаемой совокупности. В случае больших отклонений между крайними значениями и средней, необходимо проверить принадлежность экстремумов к исследуемой совокупности. Если сильная изменчивость признака вызвана случайными, кратковременными факторами, то, возможно, крайние значения не характерны для совокупности. Следовательно, их следует исключить из анализа.

Виды средних величин. В статистике выделяют следующие средние величины:

  • по наличию признака-веса:
    • а) средняя арифметическая простая,
    • б) взвешенная средняя величина.

Если имеются сведения о влиянии некоторого признака или нескольких признаков, которые необходимо учесть при расчете для корректного расчета средней величины, то рассчитывается средняя взвешенная;

  • по форме расчета:
    • а) средняя арифметическая величина,
    • б) средняя гармоническая величина,
    • в) средняя геометрическая величина,
    • г) средняя квадратическая, кубическая величина и т.д.

Средняя арифметическая простая (не взвешенная) равна сумме отдельных значений признака, деленной на число этих значений.

Отдельные значения признака называют вариантами и обозначают через х (xj, х2, х3, ..., хп); число единиц совокупности обозначают через п, среднее значение признака — х. Следовательно, средняя арифметическая простая равна:

Средняя арифметическая величина — это такое среднее значение признака, при вычислении которого общий объем признака в совокупности равномерно распределяется между всеми ее единицами. Например, предположим, что на предприятии работает п работников, причем величины заработной платы любых двух работников не совпадают. Для этой совокупности можно рассчитать размер заработной платы в среднем, т.е. такую ее величину, которая приходилась бы на одного работника, если бы весь фонд оплаты труда (в данном случае это и есть общий объем признака) предприятия распределялся между всеми сотрудниками поровну.

Простая средняя арифметическая применяется в случаях, когда имеются отдельные значения признака, т.е. данные не сгруппированы. Если же данные представлены в виде рядов распределения или группировок, то средняя исчисляется иначе.

Средняя арифметическая взвешенная вычисляется по формуле

где У) — частота повторения i-x вариантов признака, называемая весом.

Таким образом, средняя арифметическая взвешенная равна сумме взвешенных вариантов признака, деленной на сумму весов:

В экономической практике используется широкий круг показателей, вычисляемых в виде средних величин. Наиболее простой и распространенной является средняя арифметическая. Средняя арифметическая имеет ряд свойств, знание которых упрощает ее вычисление.

1. Средняя арифметическая сумма варьирующих величин равна сумме средних арифметических величин:

Пример 2.1

Выпускаемое изделие х состоит из двух деталей у и z, на изготовление каждой расходуется в среднем у = 3 ч, z - 5 ч.

Время на изготовление данного изделия будет равно 8 ч.

2. Алгебраическая сумма отклонений индивидуальных значений варьирующего признака от средней равна нулю, так как сумма отклонений в одну сторону погашается суммой отклонений в другую сторону:

Это правило показывает, что средняя является равнодействующей.

  • 3. Если все варианты ряда уменьшить или увеличить на одно и то же число, то средняя уменьшится или увеличится на это же число.
  • 4. Если все варианты ряда уменьшить или увеличить в несколько раз, то средняя также уменьшится или увеличится во столько же раз.
  • 5. Если все частоты ряда разделить или умножить на одно и то же число, то средняя не изменится. Это свойство показывает, что средняя зависит не от размера весов, а от соотношения между ними.

Одновременное применение различных свойств средней арифметической заметно упрощает ее расчет.

Пример 2.2

В таблице приведены данные о дневной выработке рабочих.

Выработка деталей, шт. (х)

Число рабочих 00

х- а (а = 40)

хх = (х - а)/А 04 = 5)

i/d

(d = 20)

х' f/d

30

80

-10

-2

4

-8

Выработка деталей, шт. (х)

Число рабочих

(У)

х - а (.а = 40)

= (х - а)/А (Л = 5)

f/d

(d = 20)

X1 ? f/d

35

120

-5

-1

6

-6

40

150

0

0

7,5

0

45

60

+0

+1

3

+3

50

90

+10

+2

4,5

+9

Итого

500

-

-

25

-2

Для упрощения расчетов все варианты ряда х уменьшим на 40, а затем еще в 5 раз. Зная, что величина средней не изменится, если все частоты ряда уменьшить или увеличить в несколько раз, сократим частоты в 20 раз. Получим после этого среднюю величину:

Чтобы по этой средней исчислить среднюю первоначального ряда, необходимо умножить ее на 5 и к полученному результату прибавить 40: -0,08 • 5 + 40 = 39,6 дет.

В качестве постоянного числа а следует брать значение признака, расположенного в середине ряда или имеющего наибольшую частоту, в качестве постоянного числа А — величину интервала между признаками.

Средняя гармоническая. Средняя гармоническая тождественна сред-

ixf Xz

ней арифметической, т.е. х= ~. =-. Она применяется тогда, когда

ХУ

неизвестны действительные веса /, а известно произведение xf = z. Для определения средней гармонической необходимо иметь ряд вариантов и частот, т.е. значения х и /. В некоторых случаях известны индивидуальные значения признака х и произведения xf, а частоты / неизвестны. Чтобы

исчислить среднюю, обозначим произведение xf = z, откуда / = —. Теперь

х

преобразуем формулу средней арифметической таким образом, чтобы по имеющимся данным хиг исчислять среднюю. Подставим в формулу

средней арифметической вместо xf = z и вместо / — —. Получим:

х

Средняя в такой форме называется средней гармонической и обозначается хгарм.

Пример 2.3

В таблице приведены данные об объеме производства в тыс. руб. и производительности в руб. на одного рабочего в час на трех производствах.

Номер

производства

Производительность труда, руб/ч (х)

<

II

М

Общее число отработанных всеми рабочими чел.-ч,

?=/

X

1

18,2

3640

200

2

20,4

3060

150

3

23,5

2350

100

Итого

-

9050

450

Применяя формулу средней гармонической взвешенной, получим:

хгарм = (3640 + 3060 + 2350)/(3640/18,2 + 3060/20,4 + 2350/23,5) = 20,1 (руб/ч).

Этот же результат мы получим и по средней арифметической взвешенной, если в качестве весов примем площадь каждого производства:

.г = (18,2-200 + 20,4 • 150+23,5 • 100)/(200 +150 +100) = 20,1 (руб/ч).

В тех случаях, когда произведения xf одинаковы или равны единице (2=1), применяется средняя гармоническая простая, вычисляемая по формуле

где х — отдельные варианты; п — их число.

Пример 2.4

В бригаде работают три человека, которые производят одни и те же детали. При этом первый рабочий затрачивает на производство одной детали 1/2, второй 1/3, третий 1 /4 ч. Требуется определить средние затраты времени на производство одной детали. Определим их по формуле средней гармонической простой:

Применив среднюю арифметическую простую, мы получили бы:

Средняя геометрическая. В некоторых случаях приходится исчислять средний коэффициент роста на единицу' времени. Применить для этого среднюю арифметическую нельзя, так как в этом случае уравненная совокупность не будет равна первоначальной, т.е. будет нарушено определяющее свойство средних величин. Убедимся в этом.

Пример 2.5

Приведенные в таблице коэффициенты роста выпуска продукции получены путем деления показателя выпуска каждого данного года на показатель предыдущего. Необходимо определить средний годовой коэффициент роста выпуска продукции по заводу за четыре года.

Показатель

1-й год

2-й год

3-й год

4-й год

Выпуск продукции, млн руб. (у,)

20,0

22,0

26,4

50,1

Коэффициент роста выпуска продукции по сравнению с предыдущим годом (Kt)

1,10

1,20

1,90

Простая средняя будет равна: х = (1,1 +1,2+1,9)/3 = 1,40. Если умножить выпуск продукции за первый год на простую среднюю, а полученный результат еще раз умножить на 1,40 и т.д. до четвертого года, то получим: 20 • 1,4 = 28,0; 28,0 -1,4 = 39,2; 39,2 • 1,4 = = 54,88, а не 50,1, как действительности, что свидетельствует о нарушении определяющего свойства средних величин.

Если в нашем примере обозначить выпуск продукции через г/,, г/2> У л* У> ежегодные коэффициенты роста — через Кь К2, К-л, а число коэффициентов — через и, то

Общий коэффициент роста за изучаемый период равен:

Отсюда К = К2 К3, или К = з —.

V У

В нашем примере K = $j 1,1 1,2-1,9 =^2,508 = 1,3585.

Аналогично К = ? —— • ^2,508 = 1,3585, т.е. 135,85%.

V 20,0 v

Среднегодовой темп роста выпуска продукции на заводе за указанные годы составил 135,85%. Если теперь 20, т.е. продукцию 1-го года, умножить на среднюю геометрическую, то получим: 20 ? 1,3585 = 27,17; 27,17 • 1,3585 = 36,91; 36,91 • 1,3585 = 50,1. Таким образом, применение средней геометрической определяющее свойство средней не нарушает.

Если теперь каждый из индивидуальных коэффициентов роста заменить средним, то исходя из определяющего свойства

Итак, если имеется п коэффициентов роста, то формула среднего коэффициента роста будет иметь следующий вид:

Это и есть формула средней геометрической.

Средний коэффициент роста можно определить и по данным последнего и первого уровней ряда. Если первый уровень ряда обозначить ух, а последний — уп, то

где п — число дат, а не коэффициентов.

Приведенные формулы идентичны, но первая применяется в тех случаях, когда имеются текущие коэффициенты или темпы роста, а вторая - когда имеются абсолютные значения начального и конечного уровней ряда.

Средняя квадратическая. В тех случаях, когда необходимо найти среднее значение величин, выраженных в виде квадратных функций, применяется средняя квадратическая. Например, средние диаметры колес, труб, стволов, средние стороны квадратов и т.д. определяются при помощи средней квадратической.

Средняя квадратическая простая исчисляется путем извлечения квадратного корня из частного от деления суммы квадратов отдельных значений признака на их число:

Средняя квадратическая взвешенная равна: где / — веса.

Имеется пять квадратов со сторонами 2, 5, 6, 8, 9 м. Определим среднюю сторону квадратов:

Степенные средние. Подводя итоги, можно рассмотренные выше средние величины представить в виде формулы степенной средней вида

где х — средняя величина, х — индивидуальные значения признака, п - число единиц изучаемой совокупности, k — показатель степени средней.

Придавая показателю степени средней (k) различные целые значения, получим отдельные виды степени средних:

_ ^ х

k = 1 — средняя арифметическая: х =^—;

1 п

k = (-1) — средняя гармоническая: хгарм = ———;

х-

X

I Ух2

k = 2 — средняя квадратическая: хкк = J——.

V п

При расчете различных степенных средних по одним и тем же данным статистического наблюдения средние не будут одинаковы. Чем выше степень k средней, тем больше ее величина. Математически доказано, что между величинами степенных средних, рассчитанных но одной и той же совокупности единиц статического наблюдения и одному и тому же признаку, существует следующее соотношение:

Принципы выбора формы средней. При вычислении статистических средних величин всякий раз возникает вопрос: какую из известных форм средней следует применить в данном конкретном случае для получения адекватной оценки уровня изучаемого массового социально-экономического явления?

Споры о правильном вычислении средних величин уходят в глубь веков. В своей работе К. Джини[1] приводит пример о разногласиях по этому вопросу между Галилеем и Наццолино около 1627 г. Их можно схематично передать так. Имеется лошадь, действительная цена которой 100 скудо. Порознь были приглашены два оценщика, которые оценили ее так: первый в 10 скудо, второй в 1000 скудо (компетентность оценщиков не обсуждается). Спрашивается, какова средняя оценочная стоимость лошади, как, по какой форме средней ее можно найти? Наццолино считал, что нужно применить среднюю арифметическую. Она равна 505 скудо [(10 + 1000J/2), но ничего общего с действительной стоимостью лошади не имеет. Галилей предпочитал среднюю геометрическую: VlO lOOO = 10 скудо. Полнейшее совпадение с действительностью.

Безусловно, это всего лишь пример. Вычисление средних из столь различных величин в социально-экономической статистике не имеет смысла.

Чем же нужно руководствоваться при выборе формы средней?

В литературе по статистике есть несколько рекомендаций относительно выбора формы средней. Предлагается, например, пользоваться принципом определяющей функции, принципом определяющего показателя. Суть этих принципов, которые по смыслу близки, в самом общем виде заключается в следующем: в первом случае замена вариантов усредняемого признака (с учетом их весов в случае взвешенных средних) не должна нарушить равенства обеих частей определяющей функции, а во втором — не должна привести к результату, искажающему величину определяющего показателя.

Рассмотрим еще один, более простой и более надежный принцип, который начал формироваться в 1950-е гг., получивший название логической формулы средней и приведший к новой форме средней — средней агрегатной. Он основан на принципе выяснения сущности средней, ее социально-экономического содержания. Прежде чем оперировать цифрами, нужно выяснить, соотношением каких показателей является средняя в данном конкретном случае. Это исходное соотношение необходимо записать словами в виде формулы, которую и называют логической формулой средней.

После того как записана логическая формула средней, которую нужно вычислить, необходимо внимательно рассмотреть имеющиеся для вычислений данные, заменить словесные значения числителя и знаменателя логической формулы средней соответствующими данными, после чего остается только провести необходимые вычисления.

Этот принцип при вдумчивой работе, безусловно, обеспечит правильное определение величины средней. Еще одно важное свойство принципа логической формулы средней заключается в том, что здесь не возникает проблемы выбора весов средней. А ведь там, где эта проблема есть, нередко допускаются ошибки.

Рассмотрим применение принципа логической формулы средней на фактических статистических данных.

Пример 2.7

Имеются данные об отработанных всеми рабочими человеко-часах и их производительности труда в тыс. руб. за 1 ч на разных производствах по выпуску продукции одного вида за определенный год.

Производство

Общее число отработанных всеми рабочими чел.-ч

Производительность труда, тыс. руб/ч

Первое

1147

25,00

Второе

727

22,15

Третье

405

22,94

Требуется определить среднюю производительность труда указанных производств. Устанавливаем исходное соотношение и записываем логическую формулу этой средней. Средняя производительность есть отношение общего объема выпуска ко всем отработанным человеко-часам. Следовательно, логическая формула этой средней записывается так:

Общий объем выпуска продукции / Отработанные человеко-часы.

1 xlsl

Обозначив производительность труда через х, общее число отработанных всеми рабочими человеко-часов через /, среднюю через ху запишем формулу символами:

х = ? Мы пришли к средней арифметической взвешенной.

l J

Вывод. Если имеется ряд данных о двух взаимосвязанных показателях, для одного из которых нужно вычислить среднюю величину, и при этом известны численные значения знаменателя логической формулы, а значения числителя неизвестны, но могут быть найдены как произведения этих показателей, то средняя должна вычисляться по формуле средней арифметической взвешенной.

Теперь смотрим, какие данные имеются в нашем распоряжении для числителя и знаменателя логической формулы. Есть знаменатель — данные об отработанных человеко-часах, числителя — данных об общем объеме выпуска продукции по всем производствам — нет. Но их нетрудно определить как произведение отработанных человеко-часов и производительности труда. Подставляем нужные цифры в числитель и знаменатель логической формулы средней, производим необходимые вычисления:

Пример 2.8

Имеются данные об общем выпуске продукции и производительности труда на разных производствах за определенный год.

Производство

Общий объем выпуска продукции, тыс. руб.

Производительность труда, тыс. руб/ч

Первое

2867

25,00

Второе

1610

22,15

Третье

929

22,94

Требуется определить среднюю производительность труда. Логическая формула средней прежняя:

Общий объем выпуска продукции / Отработанные человеко-часы.

В данном случае известны значения числителя и не известны значения знаменателя (отработанных человеко-часов). Они могут быть найдены как частные от деления общего объема выпуска продукции но различным производствам на производительность труда:

Сохраняя прежние обозначения и введя обозначение общего объема выпуска про-

ЦТ

дукции (U0, запишем формулу в символах: х = ——. Мы пришли к средней гармо-

х-

ж

ничсской взвешенной. Надо обратить внимание на то, что всегда w = xf. Численно величина средней та же, что и полученная по формуле средней арифметической.

Вывод. Если имеется ряд данных о двух взаимосвязанных показателях, для одного их которых требуется вычислить среднюю величину, при этом известны численные значения числителя логической формулы ее, а значения знаменателя не известны, но могут быть найдены как частное от деления одного показателя на другой (их численных значений), то средняя должна вычисляться но формуле средней гармонической взвешенной.

Пример 2.9

Имеются данные об общем числе отработанных всеми рабочими человеко-часов

и общем объеме выпуска продукции на разных п

юизводствах за определенный год.

Производство

Общее число отработанных всеми рабочими чел.-ч

Общий объем выпуска продукции, тыс. руб.

Первое

1147

2867

Второе

727

1610

Третье

405

929

Итого

2279

5406

Требуется определить среднюю производительность труда. Логическая формула средней прежняя:

Общий объем выпуска продукции / Отработанные человеко-часы.

В данном случае известны и числитель, и знаменатель. Остается разделить сумму значений числителя — общий объем выпуска продукции — на сумму значений знаменателя — общее число отработанных всеми рабочими человеко-часов.

Имея прямые данные о числителе и знаменателе, мы воспользовались средней агрегатной.

Вывод. Если имеется ряд данных о двух взаимосвязанных показателях, для одного из которых требуется вычислить среднюю величину, и при этом непосредственно известны числовые значения и числителя, и знаменателя логической формулы средней, то средняя вычисляется по формуле средней агрегатной.

Мода и медиана. Кроме средних в статистике для характеристики величины варьирующего признака пользуются модой и медианой.

Мода (Мо) — это наиболее часто встречающийся вариант ряда. Мода применяется, например, при определении размера одежды, обуви, пользующейся наибольшим спросом у покупателей, наиболее распространенной цены на тот или иной товар и т.д.

Пример 2.10

В таблице приведены следующие данные.

Продажа магазином обуви но размерам

Размер обуви

33

34

35

36

37

38

39

Итого

Число пар

10

48

187

54

82

76

43

500

Определение моды по данным этого дискретного ряда не представляет трудностей. Модой в нашем примере является варианта, обладающая наибольшей частотой. Это 35-й размер, так как обуви такого размера продано больше всего — 187 пар.

Величины моды и медианы, как правило, отличаются от величины средней и совпадают с ней только в случае симметрии вариационного ряда.

При исчислении моды для интервального вариационного ряда необходимо вначале определить модальный интервал, в пределах которого находится мода, а затем приближенное значение модальной величины признака. В этом случае мода (Мо) исчисляется по следующей формуле:

где х0 нижняя граница модального интервала; h — величина интервала; fm частота модального интервала; fm_{ частота интервала, предшествующего модальному; fm+{ частота интервала, следующего за модальным. Рассмотрим исчисление моды из интервального ряда на примере.

Пример 2.11

В таблице на следующей странице приведены следующие данные.

В данном примере модальный интервал находится в пределах 25—30 лет, так как на этот интервал приходится наибольшая частота (1054). Определяем моду:

Мо = 25 + 5 • (1054 - 872)/[( 1054 - 872) + (1054 - 781)] = 27 (лет).

Возрастные группы

Число студентов

Сумма накопленных частот

До 20 лет

346

346

20—25 лет

872

1218

25—30 лет

1054

2272

30—35 лет

781

3053

35—40 лет

212

3265

40—45 лет

121

3386

45 лет и выше

76

3462

Итого

3462

-

Это значит, что модальный возраст студентов равен 27 годам.

Таким образом, мода является наиболее распространенной и в этом смысле наиболее типичной величиной в распределении. Но мода и средняя величина по-разному характеризуют совокупность. Мода определяет непосредственно размер признака, свойственный, хотя и значительной части, но все же не всей совокупности. В рассмотренном примере, если даже предположить, что возраст всех студентов третьей группы (25—30 лет) составляет 27 лет, мода соответствует только 30,4% общей суммы всех частот. Поэтому мода по своему обобщающему значению уступает средней, которая характеризует совокупность в целом, так как складывается под воздействием всех без исключения элементов совокупности.

Медианой (Me) называется вариант, который приходится на середину ряда, расположенного в порядке возрастания или убывания численных значений признака. Медиана делит ряд на две равные части.

Пример 2.12

Выработка пяти рабочих составляет соответственно 30, 31, 32, 34 и 35 дет.

Медиана будет равна 32 дет., так как именно этот вариант делит ряд на две равных части. В тех случаях, когда ряд состоит из четного числа членов, медиана будет равна средней из двух значений признака, расположенных в середине ряда.

Допустим, выработка шестого рабочего — 36 дет. В этом случае медиана равна средней арифметической из третьего и четвертого вариантов, т.е. 33 дет. [(32 + 34)/2 ].

Для определения медианы в дискретном ряду сначала исчисляют полусумму частот, а затем определяют, какое значение признака приходится на нее.

Так, в примере 2.10 медианой является 36-й размер, так как именно он приходится на полусумму частот (500/2 = 250). Это значит, что 36-й размер делит ряд на две равных части.

При исчислении медианы для интервального вариационного ряда вначале определяют медианный интервал, в пределах которого находится медиана, а затем — приближенное значение медианы (Me) по формуле где х0 нижняя граница интервала, который содержит медиану; h — величина интервала; X / сумма частот или число членов ряда; Sm _ t — сумма накопленных частот интервалов, предшествующих медианному; fm частота медианного интервала.

Пример 2.13

Исчислим медиану по данным распределения студентов из примера 2.11. Медианный интервал находится в пределах 25—30 лет, так как в этом интервале расположена варианта, которая делит совокупность на две равных части: 3462/2 = = 1731. Подставляя в формулу необходимые численные значения, получим:

Это значит, что одна половина студентов имеет возраст до 27,4, а другая — свыше 27,4 лет.

Медиана, как это видно из способа ее вычисления, не зависит ни от амплитуды колебаний ряда, ни от распределения частот в пределах двух равных частей ряда. Вот почему в медиане не находят отражения важные свойства совокупности и она используется обычно для решения лишь некоторых частных задач, связанных с определением оптимума, совпадающего с вариантом, приходящимся на середину ряда.

Мода и медиана являются описательными характеристиками совокупности с количественно варьирующими признаками и не могут заменить среднюю обобщающую величину.

Метод группировок. Является одним из наиболее распространенных методов обработки и анализа статистической информации. Под группировкой в статистике понимают расчленение статистической совокупности на группы, однородные в каком-либо отношении, и характеристику выделенных групп системой показателей в целях выделения типов явлений, изучения их структуры и взаимосвязей.

Задачи метода группировки:

  • • выделение социально-экономических типов явлений;
  • • изучение структуры явления и структурных сдвигов;
  • • выявление связи и зависимости между явлениями.

Посредством группировок по отдельным признакам и комбинации самих

признаков имеется возможность выявить закономерности и взаимосвязи явлений в условиях, в известной мере определяемых ею. При использовании метода группировок появляется возможность проследить взаимоотношения различных факторов.

Исходя из характера решаемых задач, выделяют следующие виды группировок.

Типологические — исследуемая качественно разнородная совокупность разделяется на классы, социально-экономические типы, однородные группы единиц в соответствии с правилами научной группировки.

При проведении типологической группировки основное внимание должно быть уделено идентификации типов социально-экономических явлений. Она проводится на базе глубокого теоретического анализа исследуемого явления. Например, типологической группировкой является группировка промышленных предприятий по формам собственности.

Структурные — происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-либо варьирующему признаку. С помощью таких группировок могут изучаться: состав населения по полу, возрасту, месту проживания; состав предприятий по численности занятых, стоимости основных производственных фондов; структура депозитов по сроку их привлечения и т.д.

Аналитические — выявляющие взаимосвязи между изучаемыми явлениями и их факторными и результативными признаками. Преимущество метода аналитических группировок перед другими методами анализа например, корреляционным анализом, состоит в том, что он не требует соблюдения каких-либо условий для его применения, кроме одного — качественной однородности исследуемой совокупности. Всю совокупность признаков можно разделить на две группы: факторные и результативные. Факторными называются такие признаки, под воздействием которых изменяются другие — они и образуют группу результативных признаков. Взаимосвязь проявляется в том, что с возрастанием признака-фактора систематически возрастает или убывает среднее значение результативного признака.

Особенности аналитической группировки таковы: во-первых, в основу группировки кладется факторный признак; во-вторых, каждая выделенная группа характеризуется средними или относительными значениями результативного признака. Затем изменения средних или относительных значений результативного признака сопоставляются с изменениями факторного признака для выявления характера связи между ними. Аналитические группировки позволяют определить распределение предприятий или рассчитать среднее значение любого фактора на пересечении диапазона значений любых двух аналитических факторов на заданную дату.

В зависимости от числа признаков, положенных в основу группировки, различают:

  • простые группировки, в которых группы образованы по одному признаку;
  • сложные группировки, в которых совокупность разделяется на группы и подгруппы по двум или более признакам, взятым в сочетании (комбинации).

Сложные группировки дают возможность изучать распределение единиц совокупности одновременно по нескольким признакам. Однако с увеличением количества признаков растет число групп, а группировка с большим числом групп становится не наглядной. Поэтому на практике строят сложные группировки не более чем по трем признакам.

В зависимости от характера группировочного признака, различают количественные и качественные группировки.

Количественные группировки (по количественным признакам). Определение количества групп:

  • - для количественных группировок с дискретно изменяющимся значением признака: 1) по числу вариантов значений признака (если оно невелико); 2) 3—10 групп (если число вариантов значительно, они объединяются в группы);
  • — для количественных группировок с непрерывно изменяющимся значением признака — по формуле Стерджесса:

где п — число групп; N — число единиц совокупности.

Качественные группировки (но качественным признакам). Определение количества групп для качественных группировок производится но числу социально-экономических типов.

Принципы построения группировки. При построении группировки следует придерживаться следующей схемы:

  • 1) выбирают группировочный признак или комбинацию признаков;
  • 2) определяют число групп и величину интервала;
  • 3) непосредственно группируют статистические данные;
  • 4) составляют таблицу или графическое отображение, в которых представляют результаты группировки;
  • 5) делают вывод.

Существуют также методы многомерных группировок, наиболее разработанный из них — кластерный анализ.

Кластерный анализ — математическая процедура многомерного анализа, позволяющая на основе множества показателей, характеризующих ряд объектов (например, испытуемых), сгруппировать их в классы (кластеры) таким образом, чтобы объекты, входящие в один класс, были более однородными, сходными по сравнению с объектами, входящими в другие классы. На основе численно выраженных параметров объектов вычисляются расстояния между ними, которые могут выражаться как в евклидовой метрике (наиболее употребимой), так и в других метриках.

Название кластерный анализ происходит от английского слова cluster — гроздь, скопление. Впервые в 1939 г. исследователем Трионом был определен предмет кластерного анализа и сделано его описание. Главное назначение кластерного анализа — разбиение множества исследуемых объектов и признаков на однородные в соответствующем понимании группы или кластеры. Это означает, что решается задача классификации данных и выявления соответствующей структуры в ней. Общим для всех исследований, использующих кластерный анализ, являются пять основных процедур:

  • 1) отбор выборки для кластеризации;
  • 2) определение множества признаков, по которым будут оцениваться объекты в выборке;
  • 3) вычисление значений той или иной меры сходства между объектами;
  • 4) применение метода кластерного анализа для создания групп исходных данных;
  • 5) проверка достоверности результатов кластерного решения.

Каждый из перечисленных шагов играет существенную роль при использовании кластерного анализа в прикладном анализе данных. При этом шаги 1, 2 и 5 целиком зависят от решаемой задачи и должны определяться пользователем. Шаги 3 и 4 выполняются программой кластерного анализа.

В целом, многие методы кластерного анализа — эвристические процедуры, которые не имеют, как правило, строгого статистического обоснования, но позволяют свести к минимуму вероятность допущения ошибки при трактовке результатов кластерного анализа.

Разные кластерные методы могут порождать различные решения для одних и тех же данных. Это обычное явление в большинстве прикладных исследований. Окончательным критерием считают удовлетворенность исследователя результатами кластерного анализа.

Разработанные кластерные методы образуют семь основных семейств.

  • 1. Иерархические агломеративные методы.
  • 2. Иерархические дивизивные методы.
  • 3. Итеративные методы группировки.
  • 4. Методы поиска модальных значений плотности.
  • 5. Факторные методы.
  • 6. Методы сгущений.
  • 7. Методы, использующие теорию графов.

По данным ряда исследований, около 2/3 приложений кластерного анализа, используют иерархические агломеративные методы. Рассмотрим сущность этих методов на примере наиболее простого метода одиночной связи.

Процесс кластеризации начинается с поиска двух самых близких объектов в матрице расстояний. На последующих шагах к этой группе присоединяется объект, наиболее близкий к одному из уже находящихся в группе. По окончании кластеризации все объекты объединяются в один кластер.

Отметим несколько важных особенностей иерархических агломератив- ных методов:

  • 1) все эти методы просматривают матрицу расстояний размерностью N х N (где N — число объектов) и последовательно объединяют наиболее схожие объекты. Именно поэтому они называются агломеративными (объединяющими);
  • 2) последовательность объединения кластеров можно представить визуально в виде древовидной диаграммы, часто называемой дендрограммой;
  • 3) для понимания этого класса методов не нужны обширные знания матричной алгебры или математической статистики. Вместо этого дается правило объединения объектов в кластеры.

Сначала ищутся два наиболее близких объекта (предположим, А и В). Расстояние между объектами А и В равно R. В один кластер объединяются объекты, расстояние между которыми меньше, чем (10 - С) /?, где С — четкость классификации, параметр управления процессом, принимающий значения от 1 до 10, который может меняться пользователем. При С - 10 на каждом шаге объединяются только два самых близких элемента, т.е. имеет место иерархическая агломеративная процедура в чистом виде. Однако, как показывает практика использования кластерного анализа, пользователю важнее выделить в пространстве группы объектов с разной плотностью. В этом случае величину С необходимо уменьшать. Минимальное расстояние R пересчитывается на каждом шаге кластерного анализа.

Объединение. На каждом шаге кластерного анализа происходит объединение объектов, т.е. из нескольких объектов образуется один кластер. Процедура кластеризации заканчивается, когда все первичные объекты исчерпаны. Допустим, на каждом шаге объединяются п объектов. Из этих объектов образуется один кластер как центр тяжести этих объектов (среднее арифметическое по каждой координате).

Размерность задачи уменьшается на величину п - 1 {п объектов удаляются, один добавляется). Далее производится пересчет матрицы расстояний.

Рассмотрим кластерный анализ наблюдений. В результате вычислительной процедуры каждое наблюдение относится к той или иной группе. Кластеризация проводится на основе одной из двух метрик:

I*

1) евклидово расстояние: R = . ?(х,- -yi )2;

i=i

2) корреляционное расстояние: R = |1 - г |,

где х = {л:,, х2,..., хк}, у = {у,у2, —, У и) ~ Две точки; гху — парный коэффициент корреляции между х и у.

На результаты кластеризации существенное влияние оказывает выбор меры расстояния. На практике их лучше бы называть мерами несходства: для большинства используемых коэффициентов большие значения соответствуют большему сходству, в то время как для мер расстояния все наоборот. Считается, что два объекта идентичны, если описывающие их переменные принимают одинаковые значения. В этом случае расстояние между ними равно нулю. Меры расстояния обычно не ограничены сверху и зависят от выбора шкалы (масштаба) измерения. В программе кластеризация проводится на основе метрик: евклидово расстояние; корреляционное расстояние; расстояние городских кварталов (манхэттенское); расстояние Махала- нобиса (обобщенное расстояние), вычисление которых показаны в табл. 2.1.

Таблица 2.1

Расчетные формулы метрик кластеризации

Показатель

Формула расчета

1

Евклидово расстояние

Я = , I (х,-у02 V ;=1

2

Корреляционное расстояние

Я = |1-^1

3

Расстояние городских кварталов

р

dij = Zxik-Xjk

k=l

4

Расстояние Махаланобиса

Сегодня существует достаточно много методов кластерного анализа. Остановимся на некоторых из них.

Метод полных связей. Суть данного метода в том, что два объекта, принадлежащих одной и той же группе (кластеру), имеют коэффициент сходства, который меньше некоторого порогового значения S. В терминах евклидова расстояния это означает, что расстояние между двумя точками (объектами) кластера нс должно превышать некоторого порогового значения, которое определяет максимально допустимый диаметр подмножества, образующего кластер.

Метод максимального локального расстояния. Каждый объект рассматривается как одноточечный кластер. Объекты группируются по следующему правилу: два кластера объединяются, если максимальное расстояние между точками одного кластера и точками другого минимально. Процедура состоит из п - 1 шагов и результатом являются разбиения, которые совпадают со всевозможными разбиениями в предыдущем методе для любых порогов значений.

Метод Ворда. В этом методе в качестве целевой функции применяют внутригрупповую сумму квадратов отклонений, которая есть ни что иное, как сумма квадратов расстояний между каждой точкой (объектом) и средней по кластеру, содержащему этот объект. На каждом шаге объединяются такие два кластера, которые приводят к минимальному увеличению целевой функции, т.е. внутригрупповой суммы квадратов. Этот метод направлен на объединение близко расположенных кластеров.

Центроидный метод. Расстояние между двумя кластерами определяется как евклидово расстояние между центрами (средними) этих кластеров. Кластеризация идет поэтапно, на каждом из п - 1 шагов объединяют два кластера G и л, имеющие минимальное значение Щ. Если я, много больше п2, то центры объединения двух кластеров близки друг к другу и характеристики второго кластера при объединении кластеров практически игнорируются. Иногда этот метод называют еще методом взвешенных групп.

Метод «ближайшего соседа» представляет собой иерархический агломеративный метод. Процесс кластеризации начинается с поиска двух самых близких объектов в матрице расстояний, далее к этой группе присоединяется объект, наиболее близкий к одному из уже находящихся в группе. По окончанию кластеризации все ближайшие объекты объединены в один кластер.

Метод «Олимп» основан на иерархической агломеративной процедуре, основанный на приеме объединения.

Метод К-средних относится к итеративным методам группировки. Его достоинство — возможность управления количеством групп (/б-групп), на которые должны быть разнесены наблюдения. Алгоритм метода таков.

  • 1. Начать с исходного разбиения данных на некоторое заданное число кластеров; вычислить центры тяжести этих кластеров (в программе исходное разбиение выполняется методом ближайшего соседа).
  • 2. Поместить каждую точку данных в кластер с ближайшим центром тяжести.
  • 3. Вычислить новые центры тяжести кластеров; кластеры не заменяются новыми до тех пор, пока не будут просмотрены полностью все данные. Шаги 2 и 3 повторяются до тех пор, пока не перестанут меняться кластеры.

Содержательно этот метод направлен на поиск разбиения выборки с минимальным разбросом. В отличие от иерархических агломеративных методов, которые требуют вычисления и хранения матрицы сходств между объектами размерностью N х N, итеративные методы работают непосредственно с первичными данными. Поэтому с их помощью можно обрабатывать довольно большие множества данных. Более того, итеративные методы делают несколько просмотров данных и могут компенсировать последствия плохого исходного разбиения данных, тем самым устраняя самый главный недостаток иерархических агломеративных методов. Эти методы порождают кластеры одного ранга, которые не являются вложенными, и поэтому не могут быть частью иерархии. Большинство итеративных методов не допускают перекрытия кластеров.

Кластерный анализ в задачах социально-экономического прогнозирования. При анализе и прогнозировании социально-экономических явлений исследователь довольно часто сталкивается с многомерностью их описания. Это происходит при решении задачи сегментирования рынка, построении типологии стран по достаточно большому числу показателей, прогнозирования конъюнктуры рынка отдельных товаров и многих других проблем.

Свое первое применение кластерный анализ нашел в социологии. Методы кластерного анализа можно применять в самых различных случаях, когда речь идет о простой группировке, в которой все сводится к образованию групп по количественному сходству.

Большое достоинство кластерного анализа в том, что он позволяет производить разбиение объектов не по одному параметру, а по целому набору признаков. Кроме того, кластерный анализ в отличие от большинства математико-статистических методов не накладывает никаких ограничений на вид рассматриваемых объектов, и позволяет рассматривать множество исходных данных практически произвольной природы. Это имеет большое значение, например, для прогнозирования конъюнктуры, когда показатели имеют разнообразный вид, затрудняющий применение традиционных эконометрических подходов.

Кластерный анализ позволяет рассматривать достаточно большой объем информации и резко сокращать, сжимать большие массивы социально-экономической информации, делать их компактными и наглядными.

Большое значение кластерный анализ имеет применительно к совокупностям временных рядов, характеризующих экономическое развитие (например, общехозяйственной и товарной конъюнктуры). Здесь можно выделять периоды, когда значения соответствующих показателей были достаточно близкими, а также определять группы временных рядов, динамика которых наиболее схожа.

Кластерный анализ можно использовать циклически. В этом случае исследование производится до тех пор, пока не будут достигнуты необходимые результаты. При этом каждый цикл здесь может давать информацию, которая способна сильно изменить направленность и подходы дальнейшего применения кластерного анализа. Этот процесс можно представить системой с обратной связью.

В задачах социально-экономического прогнозирования весьма перспективно сочетание кластерного анализа с другими количественными методами (например, с регрессионным анализом).

Как и любой другой метод, кластерный анализ имеет определенные недостатки и ограничения. В частности, состав и количество кластеров зависит от выбираемых критериев разбиения. При сведении исходного массива данных к более компактному виду могут возникать определенные искажения, а также могут теряться индивидуальные черты отдельных объектов, заменяя их характеристики обобщенными значениями параметров кластера. При проведении классификации объектов игнорируется очень часто возможность отсутствия в рассматриваемой совокупности каких-либо значений кластеров.

В кластерном анализе считается, что выбранные характеристики допускают в принципе желательное разбиение на кластеры, а единицы измерения (масштаб) выбраны правильно.

Рассмотрим приложение кластерного анализа на примере деления стран на группы по уровню развития.

Изучались 65 стран по 31 показателю (национальный доход на душу населения, доля населения занятого в промышленности, накопление на душу населения, доля населения, занятого в сельском хозяйстве, средняя продолжительность жизни, число автомашин на 1 тыс. жителей, численность вооруженных сил на 1 млн жителей, доля промышленности в ВВП, доля сельского хозяйства в ВВП и т.д.).

Каждая из стран выступает в данном рассмотрении как объект, характеризуемый определенными значениями 31 показателя. Соответственно они могут быть представлены в качестве точек в 31-мерном пространстве. Такое пространство обычно называется пространством свойств изучаемых объектов. Сравнение расстояния между этими точками будет отражать степень близости рассматриваемых стран, их сходство друг с другом. Социально-экономический смысл подобного понимания сходства означает, что страны считаются тем более похожими, чем меньше различие между одноименными показателями, с помощью которых они описываются.

На каждом этапе матрица преобразуется так, что из нее исключаются два столбца и две строки, содержащие расстояние до объектов (пар стран или объединений — кластеров), сведенных воедино на предыдущей стадии; исключенные строки и столбцы заменяются столбцом и строкой, содержащими расстояние от новых объединений до остальных объектов; далее в измененной матрице выявляется пара наиболее близких объектов. Анализ продолжается до полного исчерпания матрицы (т.с. до тех пор, пока все страны нс окажутся сведенными в одно целое). Обобщенные результаты анализа матрицы можно представить в виде дерева сходства (дендрограммы). Это дерево в соответствии с числом сопоставляемых объектов включает 65 уровней. Первый (нижний) уровень содержит точки, соответствующие каждой стране в отдельности. Соединение двух этих точек на втором уровне показывает пару стран, наиболее близких по общему типу народных хозяйств. На третьем уровне отмечается следующее но сходству парное соотношение стран (как уже упоминалось, в таком соотношении может находиться либо новая пара стран, либо новая страна и уже выявленная пара сходных стран) и т.д. до последнего уровня, на котором все изучаемые страны выступают как единая совокупность.

Элементарные методы обработки рядов динамики. Процессы и явления общественной жизни, которые изучаются статистикой, находятся в постоянном движении и изменении. Статистические данные, характеризующие изменения явлений во времени, называются динамическими (хронологическими или временными) рядами. Для каждого ряда динамики характерны два основных элемента: показатель времени t; соответствующий ему уровень развития изучаемого явления у.

В качестве показателей времени в рядах динамики выступают либо определенные даты (моменты), либо отдельные периоды (годы, кварталы, месяцы, сутки). Они могут выражаться абсолютными, относительными или средними величинами.

Каждое значение временного ряда может состоять из следующих составляющих: тренда, циклических, сезонных и случайных колебаний.

Тренд можно рассматривать в качестве общей направленности изменений значений ряда или основной тенденции ряда. Циклическими называются колебания относительно линии тренда для периодов свыше одного года. Такие колебания соответствуют циклам деловой активности: оживлению, росту, а также периодам спада и застоя. Сезонными колебаниями называются периодические изменения значений ряда на протяжении года. Их можно вычленить после анализа тренда и циклических колебаний. Случайные колебания выявляются путем снятия тренда, циклических и сезонных колебаний, остающаяся после этого величина и есть беспорядочное отклонение, которое необходимо учитывать при определении вероятной точности принятой модели прогнозирования.

Важнейшим условием правильного построения динамических рядов является сопоставимость всех входящих в них статистических показателей. Для этого необходимо, чтобы состав изучаемой совокупности был один и тот же на всем протяжении ряда, т.е. относился к одной и той же территории, к одному и тому же кругу объектов и был исчислен по одной и той же методологи. Кроме того, данные динамического ряда должны быть выражены в одних и тех же единицах измерения, а промежутки времени между значениями ряда должны быть по возможности одинаковыми.

В ряде случаев для преобразования несопоставимых рядов в сопоставимые прибегают к пересчету данных, используя различные приемы.

Прямой пересчет данных. Если динамические ряды не сопоставимы, несопоставимы в силу изменения круга объектов учета или территориальных границ, то для обеспечения сопоставимости производится прямой пересчет данных по первичному материалу, лишь когда они будут сопоставимы, и их можно будет сравнивать.

Смыкание рядов. Если имеются два ряда показателей, характеризующих динамику одного и того же явления в новых и старых административных границах, причем на один—два срока, имеются данные в новых и старых границах по одному и тому же кругу объектов, то такие динамические ряды можно сомкнуть.

Пример 2.14

Имеются данные отчетности но определенной области за ряд лег.

Динамика розничного товарооборота области в новых и старых границах, млн руб.

Границы области

1-й год

2-й год

3-й год

4-й год

5-й год

6-й год

Старые границы

350

380

400

450

-

Новые границы

420

456

480

540

600

650

Показатели за 5-й и 6-й годы несопоставимы с показателями за 1 -й — 4-й годы, так как относятся к разным границам. Задача заключается в том, чтобы вычислить данные за 1-й — 3-й годы в новых границах, что и делается путем смыкания рядов.

Для этого определяем процент розничного товарооборота в 4-м году в новых границах но сравнению со старыми: 540/450 • 100 = 120%.

Корректируем данные за 1-й — 3-й гг. в старых границах:

Эти данные подставляем в таблицу.

Виды динамических рядов. В зависимости от характера изучаемых величин динамические ряды различают по разным признакам.

По времени ряды динамики подразделяются на моментные и интервальные.

Моментные ряды динамики отображают состояние изучаемых явлений на определенные даты (моменты) времени. Примером моментного ряда является информация о списочной численности сотрудников предприятия на конкретные даты. Особенностью этого ряда динамики является то, что в его уровни могут входить одни и те же единицы изучаемой совокупности. Хотя здесь тоже есть интервалы — промежутки между соседними в ряд}' датами, величина того или иного конкретного уровня не зависит от продолжительности периода между двумя датами. Основная часть персонала предприятия, составляющая списочную численность и продолжающая работать в течение данного ряда, отображается в уровнях последующих периодов. Поэтому при суммировании уровней моментного ряда может возникнуть повторный счет.

Интервальные ряды динамики отражают итоги развития изучаемых явлений за отдельные периоды (интервалы) времени. Примером такого ряда могут служить данные об объемах производства по годам за определенный период времени. Особенностью интервального ряда динамики является то, что каждый его уровень складывается из данных за более короткие интервалы времени. Например, суммируя объем производства за три месяца, получаем его объем за квартал, суммируя за четыре квартала — получаем величину за год и т.д. При прочих равных условиях уровень интервального ряда тем больше, чем больше длина интервала, к которому этот уровень относится. Свойство суммирования уровней за последовательные интервалы времени позволяет получить ряды динамики более укрупненных периодов.

Статистическое отображение изучаемого явления во времени может быть представлено рядами динамики с нарастающими итогами. Их применение обусловлено потребностями отображения результатов развития изучаемых показателей не только за данный отчетный период, но и с учетом предшествующих периодов.

По форме представления уровней ряды динамики могут быть построены на основе абсолютных, относительных и средних величин. В свою очередь они могут быть либо моментными, либо интервальными. Но здесь следует отметить, что в интервальных рядах, основанных из относительных или средних величин, непосредственное суммирование уровней лишено смысла, так как относительные и средние величины являются производными.

По расстоянию между датами или интервалами времени выделяют полные и неполные ряды динамики. В полных рядах даты регистрации или окончания периодов следуют друг за другом с равными интервалами. Это равностоящие ряды динамики. Неполные ряды — когда принцип равных интервалов не соблюдается.

По числу показателей можно выделить изолированные и комплексные (многомерные) ряды динамики. Изолированный ряд дает возможность проводить анализ во времени одного показателя. Комплексный получается в том случае, когда в хронологической последовательности дается система показателей, связанных между собой единством процесса или явления.

Основные показатели анализа динамических рядов. Динамические ряды анализируются при помощи ряда показателей, определяющих характер, направление, интенсивность количественных изменений явлений общественной жизни во времени. К ним относятся: уровень ряда, средний уровень, абсолютный прирост, темп роста, коэффициент роста, темп прироста, коэффициент опережения, абсолютное значение одного процента прироста.

Уровнем ряда называется абсолютная величина каждого члена динамического ряда. Все уровни ряда характеризуют его динамику. Различают начальный, конечный и средний уровни ряда. Начальный уровень — эго величина первого члена ряда, конечный — последнего, средний уровень — средняя из всех значений динамического ряда.

Пример 2.15

В таблице (стр. 61) приведены данные о производстве продукции за пять лет.

Начальным уровнем являются показатели за первый год (344,2 тыс. шт.), а конечным — показатели пятого года (1119,4 тыс. шт.).

Средний уровень определяется в зависимости от вида динамического ряда. Если ряд моментный, применяется средняя хронологическая. Для интервальных рядов рассчитывается средняя арифметическая. Показатели таблицы представляют собой интервальный ряд, потому что характеризуют производство продукции по годам. Поэтому среднегодовое производство за 5 лет определяется по формуле средней арифметической простой: [2]

Годы

Произведено про- дукции, тыс. шт.

Абсолютный прирост, тыс. шт.

Теми роста, %

Темн прироста, %

Абсолютное значе- ние одного процента прироста, тыс. шт.

по сравнению с предыдущим годом (цепные)

по сравнению с 1-м годом (базисные)

по сравнению с предыдущим годом (цепные)

но сравнению с 1-м годом (базисные)

по сравнению с предыдущим годом (цепные)

по

сравнению с 1-м годом (базисные)

1-й

344,2

2-й

529,0

184,8

184,8

153,7 (529,0/344,2 х 100)

153,7 (529,0/344,2 х 100)

53,7

53,7

3,44

3-й

730,1

201,1

385,9

138,0 (730,1/529,0 х 100)

212,1 (730,1/344,2 х 100)

38,0

112,1

5,29

4-й

916,7

186,6

572,5

125,5 (916,7/730,1 х 100)

266,3 (916,7/344,2 х 100)

25,5

166,3

7,32

5-й

1119,4

202,7

775,2

122,1 (И 19,4/916,7 х 100)

325,2 (1119,4/344,2 х 100)

22,1

225,2

9,17

Абсолютный прирост характеризует размер увеличения или уменьшения изучаемого явления за определенный период времени. Он определяется как разность между данным и предыдущим или первоначальным уровнем. Уровень, который сравнивается, называется текущим, а уровень, с которым производится сравнение, называется базисным, так как является базой для сравнения. Если каждый уровень ряда сравнивается с предыдущим, то получают цепные показатели. Если же все уровни ряда сравниваются с одним и тем же первоначальным уровнем, то полученные показатели называются базисными.

База для сравнения должна выбираться обоснованно, в зависимости от исторических и экономических особенностей изучаемого явления.

Абсолютный прирост определяется по формулам:

  • - цепной: Ai = yi-yi_l;
  • — базисный: А = г/, - г/0,

где у, — текущий уровень ряда; yi_l — уровень, предшествующий г/,-; у0 — начальный уровень ряда.

В примере 2.15 вычислены цепные и базисные абсолютные приросты. Они показывают ежегодный абсолютный прирост выпуска продукции, а также прирост их по сравнению с первым годом.

Средний абсолютный прирост определяется как частное от деления суммы всех абсолютных цепных приростов на их число.

В нашем примере средний абсолютный прирост за год равен:

- УД, 184,8 + 201,1 + 186,6 + 202,7 775,2 ,поо/

Д„ '- =-=-= 193,8 (тыс.шт.).

" и-1 4 4

Средний абсолютный прирост можно рассчитать и по формуле

где Д„ — средний абсолютный прирост; у„ — конечный уровень ряда; у0 — начальный уровень ряда.

По данным нашего примера

Расчеты показывают, что за пять лет производство продукции увеличивалось ежегодно в среднем на 193,8 тыс. шт.

В ряде случаев изучаемое явление растет неравномерно, под воздействием многих факторов, сила и направление влияния которых из года в год меняются. Так, размеры продукции растениеводства зависят от многих факторов, в том числе и от метеорологических условий. Поэтому для определения роста производства зерна или другой продукции растениеводства правильнее сравнивать не ежегодные уровни валового сбора урожая, а средние — за определенные периоды времени, допустим за пятилетия или десятилетия.

Для характеристики относительной скорости изменения уровня динамического ряда в единицу времени вычисляют показатели темпа роста и темпа прироста.

Темпом роста называется отношение данного уровня явления к предыдущему или начальному, выраженное в процентах. Темпы роста, вычисленные как отношение данного уровня к предыдущему, называются цепными, а к начальному — базисными.

Темпы роста вычисляются по формулам:

  • — цепной: Тр = yi/yj_i 100;
  • — базисный: Тр = y -Jy{) ? 100,

где yi — текущий уровень ряда; у(_, — уровень предшествующий у;, г/0 — начальный уровень ряда.

Расчеты цепных и базисных темпов роста представлены в таблице примера 2.15.

Если темпы выражены в виде простых отношений, т.е. база сравнения принимается за 1, а не за 100%, то полученные показатели называются коэффициентами роста.

Темпом прироста называется отношение абсолютного прироста к предыдущему или начальному уровню, выраженное в процентах. Темп прироста можно рассчитать по данным о темпе роста. Для этого надо от темпа роста отнять 100% или от коэффициента роста — 1, в последнем случае получим коэффициент прироста.

Темпы прироста рассчитываются по следующим формулам:

  • - цепной: Тир = (у, - у, _ {)/у, _ , = Тр - 100 = Кр - 1;
  • - базисный: Тир = (у, - у0)/у0 = Тр - 100 = Кр - 1.

Расчеты цепных и базисных темпов прироста представлены в таблице примера 2.15.

Для характеристики темпов роста и прироста в среднем за весь период, охватываемый рядом динамики, исчисляют средний темп роста и прироста. Средний темп (коэффициент) роста определяется по формуле средней геометрической. Когда средний темп роста вычисляется по абсолютным данным первого и последнего членов динамического ряда, применяется следующая формула средней геометрической:

где у — начальный уровень; уп — конечный уровень; п — число членов ряда.

Пример 2.15 (продолжение)

Вернемся к нашему примеру и рассчитаем по этой формуле среднегодовой коэффициент роста производства продукции:

Средний годовой темп роста производства за указанные годы составляет 134,25%.

Если абсолютные данные динамического ряда отсутствуют, а имеются цепные коэффициенты роста (по сравнению с предыдущим периодом), средний коэффициент роста оппелеляется по йюпмуле

где К, К2. К3.....К„ — коэффициенты роста за каждый период.

Пример 2.15 (продолжение)

В нашем примере К = ^1,537 1,38 1,255 1,221 =

Обе формулы средней геометрической идентичны, тождественны, потому что произведение цепных коэффициентов роста равно отношению последнего члена ряда к первому.

Для определения средней из средних коэффициентов роста за неодинаковые промежутки времени применяется средняя геометрическая взвешенная, которая вычисляется по формуле

где i — продолжительность отрезков времени.

Пример 2.15 (продолжение)

Например, если среднегодовой коэффициент роста выпуска продукции на заводе за три года составил 1,07, а за два года — 1,10, то среднегодовой коэффициент выпуска продукции за пять лет будет равен: Кр = ^1,073 1,102 = 1,082, а среднегодовой темп роста — 108,2%.

При сравнении интенсивности развития явлений, отражаемых двумя динамическими рядами, представляет интерес определение интенсивности изменения во времени одного явления по сравнению с другим. Такое сопоставление интенсивности изменения проводится как при сравнении двух взаимосвязанных динамических рядов, характеризующих развитие изучаемых явлений, так и при сравнении рядов одних и тех же явлений, но относящихся к разным объектам. Например, сравнение динамики роста производительности труда и заработной платы, сопоставление рядов динамики, характеризующих производство важнейших видов продукции в России и других странах, и т.д. Для этого сравнивают базисные темпы роста за одинаковые периоды времени. Отношение базисных темпов роста двух динамических рядов за одинаковые отрезки времени называется коэффициентом опережения. Обозначим коэффициент опережения Коп, базисные

1С_

К"'

темпы роста первого ряда динамики — К', второго — К". Тогда КОП

Коэффициент опережения показывает, во сколько раз быстрее растет уровень одного ряда динамики по сравнению с другим.

В тех случаях, когда темпы роста по двум сравниваемым рядам динамики неизвестны, а имеются средние темпы роста за одинаковый период времени, коэффициент опережения рассчитывается по формуле:

где К' — средний темп роста первого ряда динамики, К" — второго, а п - число лет в периоде.

Отношение абсолютного прироста к темпу прироста представляет собой абсолютное значение одного процента прироста (А%), которое определяется но формуле

где ДА — абсолютный прирост; Гир — темп прироста цепной.

Пример 2.15 (окончание)

В примере 2.15 абсолютные значения одного процента прироста производства приведены в таблице. Они получены как отношение: 184,8/53,7 = 3,44 тыс. шт. и т.д.

Между базисными и цепными темпами роста имеется взаимосвязь: произведение последовательных цепных темпов роста равно базисному темпу роста, а частное от деления последующего базисного темпа роста на предыдущий равно соответствующему цепному темпу роста.

Важным статистическим показателем динамики является также темп наращения, который в условиях интенсивного роста экономики измеряет наращение во времени экономического потенциала. Определяются темпы наращения (Г„) делением цепных абсолютных приростов (ДУЩ) на уровень, принятый за постоянную базу сравнения (Уб/):

Интерполяция и экстраполяция. При решении некоторых вопросов приходится определять неизвестные промежуточные значения динамического ряда. Эта задача решается способом интерполяции. Интерполяция — способ определения неизвестных промежуточных значений динамического ряда.

Рассмотрим процесс интерполирования недостающего уровня динамического ряда на условном примере.

Пример 2.16

Имеется следующий динамический ряд.

Годы

1-й

2-й

3-й

4-й

5-й

6-й

7-й

Произведено электроэнергии, млрд кВт • ч

639

689

741

800

857

915

976

Допустим, что в динамическом ряду отсутствуют данные о производстве электроэнергии в 4-м году. Чтобы установить недостающий уровень ряда методом интерполяции, необходимо выбрать устойчивый показатель, характеризующий изменение уровней динамического ряда. Таким показателем могут быть средняя арифметическая из прилегающих уровней, абсолютные приросты, средние абсолютные приросты, темпы роста, средние темпы роста.

Определим недостающий уровень как среднюю из уровней за 3-й и 5-й годы: у = (741 + 857) / 2 = 799 (млрд кВт • ч).

Отклонение от фактического уровня составляет 1 млрд кВт • ч, или немногим больше 0,1%.

Вычислим абсолютный прирост за прилегающие годы:

Уровень 4-го года будет равен уровню 3-го года плюс абсолютный прирост: 741 + + 58 = 799 (млрд кВт • ч).

Вычислим недостающий уровень ряда при помощи среднегодового темпа роста,

•100= 107,3%. Теперь определим уровень

„ . = уп I976,0

который будет равен: Тр =

4-го года: 741 • 1,073 = 795 (млрд кВт • ч).

Интерполяция заключается по существу в приближенном отражении сложившейся закономерности внутри определенного отрезка времени в отличие от экстраполяции, которая требует выхода за пределы этого отрезка времени.

Экстраполяция — метод определения количественных характеристик для совокупностей и явлений, не подвергшихся наблюдению, путем распространения на них результатов, полученных из наблюдений над аналогичными совокупностями за прошедшее время, на будущее.

Пример 2.16 (продолжение)

Вернемся к примеру. Допустим, что в 5-м году мы хотим определить масштабы производства электроэнергии на предстоящий 6-й год. Для этого определим смежный темп роста 5-го года к 4-му году и по нему рассчитаем возможное производство электроэнергии в 6-м году: Тр = 857/800 • 100 = 107,1%. Производство электроэнергии составит: 857 • 107,1 = 918 (млрд кВт • ч). Ошибка равна 0,3%.

Если рассчитывать при помощи среднегодового коэффициента роста, то

а экстраполируемое производство электроэнергии в 6-м году: 854 • 1,076 = 922 (млрд кВт • ч), т.е. ошибка составит менее 0,7%.

Величины признаков колеблются под воздействием различных причин и условий. Чем разнообразнее условия, влияющие на размер данного признака, тем больше его вариация. Так, размер заработной платы рабочего зависит от ряда факторов: специальности, разряда, стажа работы, образования, состояния здоровья и т.д. Чем больше различия между значениями факторов, тем больше вариация в уровне заработной платы рабочих.

Вопрос об определении вариации, т.е. степени колеблемости признака, имеет важное значение для характеристики изучаемой совокупности и решения ряда задач анализа. Например, два завода выполнили месячный план на 100%. Одно предприятие работало ритмично, систематически выполняя дневные задания, а другое — неритмично, в отдельные дни значительно недовыполняя дневные задания, зато в другие дни огромным напряжением сил резко перевыполняя их для того, чтобы не сорвать выполнение месячного плана. Из этого примера видно, что для правильной оценки работы предприятий одной средней недостаточно, необходимо изучать и отклонения отдельных значений признака, на основе которых она исчислена.

Наиболее простой мерой колеблемости является размах вариации, т.е. разность меду максимальными и минимальными значениями варьирующего признака. Если обозначить максимальное значение варьирующего признака через хтах, минимальное через хт{п, то размах вариации будет равен: R=xmax~xm in* Но размах вариации как показатель колеблемости имеет существенный недостаток. Его величина определяется двумя крайними значениями признака, в то время как колеблемость последнего в целом складывается из всех его значений. Поэтому размах вариации может в ряде случаев неправильно характеризовать колеблемость признака. Если, например, на большой посевной площади равномерной в целом урожайности встречаются отдельные небольшие участки с исключительно высокой и низкой урожайностью, то размах вариации будет иметь значительный характер, хотя колеблемость урожайности в целом незначительна. Следовательно, размах вариации не отражает варьирование признака основной массы единиц совокупности.

Показателями, определяющими меру вариации каждого отдельного значения признака от среднего значения, являются среднее линейное отклонение, дисперсия и среднее квадратическое отклонение.

Среднее линейное отклонение представляет собой среднюю из абсолютных значений отклонений отдельных вариант от их средних. Так как алгебраическая сумма отклонений индивидуальных значений признака от средней равна нулю, т.е. Х(х-х) = 0 (одно из свойств средней арифметической), при исчислении среднего линейного отклонения принимаются во внимание только абсолютные значения отклонений без учета знаков («+» или «-»). Если средняя арифметическая из отклонений является простой, то среднее линейное отклонение рассчитывается по формуле

Если же средняя арифметическая из отклонений взвешенная, то средние линейное отклонение равно:

Недостаток среднего линейного отклонения в том, что оно берется без учета знака. Поэтому в статистике для характеристики колеблемости признака чаще всего пользуются дисперсией и средним квадратическим отклонением.

Дисперсией называется средний квадрат отклонений индивидуальных значений признака от их средней величины. Дисперсия обозначается греческой буквой а (сигма) в квадрате и равна:

При равенстве весов или когда они равны 1:

Дисперсия имеет большое значение в анализе. Однако ее применение как меры вариации в ряде случаев бывает не совсем удобным, потому что размерность дисперсии равна квадрату размерности изучаемого признака. В таких случаях для измерения вариации признака вычисляют среднее квадратическое отклонение.

Среднее квадратическое отклонение (а) равно корню квадратному из дисперсии:

а при равенстве весов, или когда они равны 1:

Применение дисперсии и среднего квадратического отклонения позволяет устранить недостаток среднего линейного отклонения, потому что любое число, положительное или отрицательное, возведенное в квадрат, будет числом положительным.

Сопоставление линейных или средних квадратических отклонений по нескольким совокупностям дает возможность определять степень их однородности в отношении того или иного признака. Чем меньше размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, тем совокупность более однородна, тем более типичной будет средняя величина.

Дисперсия и среднее квадратическое отклонение не всегда бывают достаточными для характеристики колеблемости признака, так как они характеризуют абсолютный размер отклонений.

Для характеристики колеблемости явлений среднее квадратическое отклонение сопоставляют с его средней величиной и выражают в процентах. Такой показатель называется коэффициентом вариации, обозначается он буквой v и исчисляется по формуле

Коэффициент вариации представляет собой отношение среднего квадратического отклонения к средней арифметической и дает возможность сравнивать и оценивать колеблемость величин различных признаков. Он является наиболее распространенным относительным показателем колеблемости и более точно чем абсолютный характеризует различие колеблемости признаков. Чем меньше коэффициент вариации, тем меньше колеблемость признака, и наоборот.

Дисперсия обладает рядом математических свойств, использование которых значительно упрощает и облегчает ее вычисление.

  • 1. Если все значения признака уменьшить или увеличить на какое-то постоянное число ау то дисперсия от этого не изменится. Следовательно, дисперсию можно исчислить не только по вариантам, но и по их отклонениям от какого-то постоянного числа а.
  • 2. Если все значения уменьшить или увеличить в К раз, то дисперсия от этого измениться в К2 раз. Следовательно, при исчислении дисперсии можно все значения признака уменьшить в К раз, исчислить дисперсию, а затем умножить ее на это постоянное число в квадрате 2).

3. Сумма квадратов отклонений индивидуальных значений признака х от их средней х меньше суммы квадратов отклонений индивидуальных значений признака от любого данного числа а при условии, что аФх, т.е.

Это свойство дает возможность упрощать расчеты среднего квадратического отклонения путем замены громоздких отклонений индивидуальных значений признака от средней отклонениями от любого произвольно взятого числа, удобного для произведения расчетов, с последующей поправкой.

4. Дисперсия признака равна разности между средним квадратом значений признака и квадратом их средней, т.е.

В связи с тем, что статистические исследования весьма трудоемки, возникла мысль о замене сплошного наблюдения выборочным.

Выборочное наблюдение — это наиболее совершенный, научно обоснованный способ не сплошного наблюдения, при котором обследуется не вся совокупность, а лишь часть ее, отобранная по определенным правилам выборки и обеспечивающая получение данных, характеризующих всю совокупность в целом.

При проведении выборочного наблюдения нельзя получить абсолютно точные данные, как при сплошном, потому что обследованию подвергается не вся совокупность, а только ее часть. Поэтому при проведении выборочного наблюдения неизбежно некоторая свойственная ему погрешность, ошибка.

Ошибки, свойственные выборочному наблюдению, называются ошибками репрезентативности, т.е. представительства. Они характеризуют размер расхождения между данными выборочного наблюдения и всей совокупности. Ошибки репрезентативного наблюдения делятся на случайные и систематические.

Случайные ошибки возникают вследствие того, что выборочная совокупность недостаточно точно воспроизводит всю совокупность вследствие не сплошного характера наблюдения. Их размеры и пределы можно определить с достаточной точностью на основании закона больших чисел и теории вероятностей.

Систематические ошибки возникают в результате нарушения принципа случайности отбора единиц совокупности для наблюдения. Например, для обследования успеваемости в университете отбирают наиболее подготовленных студентов с положительными отметками.

Различают четыре вида отбора: случайный, механический, типический и серийный (гнездовой).

Случайный отбор. Наиболее распространенным способом отбора в случайной выборке является метод жеребьевки, при котором на каждую единицу совокупности заготовляется жетон, билет с порядковым номером. Затем в случайном порядке отбирается необходимое количество единиц совокупности. При этих условиях каждая из них имеет одинаковую вероятность попасть в выборку.

Механический отбор. Вся совокупность разбивается на равные по объему группы по случайному признаку. Затем из каждой группы, как правило, берется одна единица. Все единицы изучаемой совокупности предварительно располагаются в определенном порядке, например, по алфавиту, местоположению и т.п., а потом в зависимости от объема выборки механически, через определенный интервал отбирается необходимое количество единиц. Так, если надо провести 10%-ю механическую выборку студентов, то составляется список их фамилий по алфавиту и механически отбирается каждый десятый студент. Если выборка 5%-я, то отбирается каждый 20-й студент, т.е. интервал зависит от объема выборки. Чем меньше выборка, тем больше интервал.

Типический отбор. Изучаемая совокупность разбивается по существенному, типическому признаку на качественно однородные, однотипные группы. Затем из каждой группы случайным способом отбирается количество единиц, пропорциональное удельному весу группы по всей совокупности.

Например, необходимо провести типический отбор 1500 студентов из 10 000, обучающихся на четырех факультетах института. Для этого их группируют в однородные группы по факультетам, а затем по каждому из них отбирают число студентов, пропорционально удельному весу числа студентов института по факультетам.

Типический отбор дает более точные результаты, чем случайный или механический, потому что при нем в выборку в такой же пропорции, как и в генеральной совокупности, попадают представители всех типических групп.

Серийный (гнездовой) отбор. Отбору подлежат не отдельные единицы совокупности, а целые группы, серии, гнезда, отобранные случайным или механическим способом. В каждой такой группе, серии проводится сплошное наблюдение, а результаты переносятся на всю совокупность.

Так, например, 10 000 студентов института занимаются в группах но 25 человек. Для проведения 15%-го выборочного наблюдения серийным (гнездовым) способом необходимо в случайном порядке отобрать 60 групп (1500/25) из 400 (10 000/25) и результаты наблюдения перенести на всю совокупность.

Точность выборки зависит и от схемы отбора. Она может быть проведена по схеме повторного и бесповторного отбора.

Все явления общественной жизни взаимосвязаны и взаимообусловлены. Взаимосвязанные признаки подразделяются на факторные (под их воздействием изменяются другие, зависящие от них, признаки) и результативные.

Связи по степени тесноты могут быть функциональными (от которых определенному значению факторного признака соответствует строго определенное значение результативного признака; эти связи проявляются в массе случаев и притом — в среднем). Функциональные связи иначе называются полными, а статистические — неполными или корреляционными.

По направлению различают прямую и обратную связь. Если с увеличением аргумента х функция у также увеличивается без всяких единичных исключений, то такая связь называется полной прямой связью. Если с увеличением аргумента х функция у уменьшается без всяких единичных исключений, то такая связь называется полной обратной. Кроме того, в виде исключений, которые, однако, не нарушают общей тенденции, встречается частичная связь — прямая или обратная. Когда признаки варьируют незаметно друг от друга, говорят о полном отсутствии связи.

Для изучения, измерения и количественного выражения взаимосвязей между явлениями статистикой применяются различные методы, важнейшими из которых являются: метод сопоставления параллельных рядов, балансовый, графический, методы аналитических группировок, дисперсионного и корреляционного анализа.

Метод параллельных рядов. Чтобы установить связь между явлениями, достаточно расположить полученные результаты в виде параллельных рядов и сопоставить их между собой. Такое сопоставление позволят установить наличие связи и получить представление о ее характере.

Балансовый метод служит для отражения пропорций двух групп взаимосвязанных экономических показателей. Этот метод широко распространен в практике бухгалтерского учета и планирования, когда требуется определить соотношение между ресурсами и их использованием, хозяйственными средствами и источниками их образования. С помощью этого метода на промышленных предприятиях анализируется использование рабочего времени оборудования, сырья, состояние основных и оборотных средств. При расчете балансовым методом используется метод сравнения, а также индексный метод.

Метод сравнения — научный метод, когда изучаемое явление сопоставляют с уже известным, изученным ранее, для определения общих черт либо различий между ними. В экономическом анализе данный способ является одним из важнейших, с него начинается любой анализ.

Индексный метод. В экономике приходится сопоставлять не только отдельные элементы, но и многие сложные явления, состоящие из несоизмеримых, разнородных, не поддающихся суммированию элементов. Так, продукция промышленности состоит из совокупности разнородных изделий, которые не могут суммироваться, если они выражены в натурально-вещественной форме. Нельзя, например, складывать количество продукции в метрах с тоннами, киловатт-часами и т.д.

Слово индекс {index) означает указатель, показатель. Индексом называется относительная величина, которая характеризует изменение во времени и в пространстве уровня изучаемого общественного явления или степень выполнения плана. Другие виды относительных величин (структуры, координации, интенсивности) к индексам не относятся, потому что при их вычислении сопоставляются не одноименные показатели, а величины разноименных явлений.

При помощи индексов:

  • 1) определяются средние изменения сложных, непосредственно несоизмеримых совокупностей во времени (индексы выступают как показатели динамики);
  • 2) оценивается средняя степень выполнения плана по совокупности в целом или ее части (индексы выступают как показатели выполнения плана);
  • 3) устанавливаются средние соотношения сложных явлений в пространстве (индексы выступают как показатели сравнения);
  • 4) определяется роль отдельных факторов в общем изменении сложных явлений во времени или в пространстве и, в частности, изучается влияние структурных сдвигов (индексы выступают как аналитическое средство).

По степени охвата различают индивидуальные и общие индексы.

Индивидуальные индексы выражают соотношение отдельных элементов совокупности, обозначаются буквой i и определяются путем сопоставления двух величин, характеризующих уровень изучаемого явления во времени или в пространстве, т.е. за два сравниваемых периода. Период, уровень которого сравнивается, называется отчетным или текущим периодом и обозначается подстрочным знаком j, а период, с уровнем которого проводится сравнение, называется базисным и обозначается подстрочным знаком о или пл, если сравнение проводится с планом. Если изменение явлений изучается за ряд периодов, то каждый период обозначается соответственно подстрочным знаком 0, ,, 2, з и т.д.

Приведем примеры индивидуальных индексов.

Индекс физического объема продукции: i =—, где q0 — количество

до

произведенной продукции в отчетном и базисном периодах. Этот индекс может характеризовать изменение физического объема продукции во времени, в пространстве, в сравнении с планом.

Индекс цен:

где р] и р0 цена единицы продукции в отчетном и базисном периодах. Индекс себестоимости:

где 2, и 20 — себестоимость единицы продукции в отчетном и базисном периодах.

Индекс трудоемкости:

где и t0 — затраты времени на производство единицы продукции в отчетном и базисном периодах.

Индекс как относительный показатель выражается в виде коэффициента, когда база для сравнения принимается за единицу, и в процентах, когда база для сравнения принимается за 100%. Если в результате вычислений полученный индекс больше 1 или 100%, то это указывает на рост явления, если же меньше 1 или 100% — на снижение уровня изучаемого явления.

Базисные и цепные индексы. Если имеются данные за ряд периодов или уровней, в качестве базы для сравнения может быть принят один и тот же начальный уровень или уровень предыдущего периода. В первом случае мы получим индексы с постоянной базой — базисные, во втором — индексы с переменной базой {цепные). Вопрос о том, каким индексом пользоваться в каждом конкретном случае решают исходя из задач исследования.

Если базисные и цепные индексы охватывают один и тот же период, между ними существует определенная взаимосвязь: произведение цепных индексов равно базисному.

В экономике часто приходится иметь дело с показателями, связанными между собой произведением. Например, фонд оплаты труда равен произведению средней заработной платы на численность работников, товарооборот — произведению цены на физический объем товарооборота и т.д.

В такой же связи находятся и индексы этих показателей: общий индекс равен произведению индексов сомножителей. Так,

где ipq — индекс товарооборота; гр — индекс цен; iq индекс физического объема товарооборота.

Такие индексы называются сопряженными. Их взаимосвязь дает возможность но двум имеющимся индексам находить третий.

Общие индексы показывают соотношение совокупности явлений, состоящей из разнородных, непосредственно несоизмеримых элементов. Например, несмотря на различия потребительских стоимостей отдельных продуктов, все они являются результатом труда и поэтому могут быть выражены общей мерой через стоимость, трудовые затраты и т.д.

Обозначим цену за единицу каждого продукта в отчетном периоде буквой рх, в базисном периоде — р0, количество проданных товаров в отчетном периоде — qv в базисном — q0, общую стоимость проданных товаров в отчетном периоде по ценам отчетного периода — р^У то же в базисном по ценам базисного периода — /?0<70, общий индекс товарооборота — lpq.

Придерживаясь принятых обозначений, можно записать формулу общего индекса товарооборота:

Приведенная формула индекса товарооборота называется агрегатной (от лат. aggrego — присоединяю). Агрегатными называются индексы, числители и знаменатели которых представляют собой суммы, произведения или суммы произведений уровней изучаемого явления. Агрегатная форма индекса является основной, наиболее распространенной формой экономических индексов, она показывает относительное изменение изучаемого экономического явления и абсолютные размеры этого изменения.

Агрегатная формула индекса товарооборота показывает, что его величина зависит от двух переменных величин. Чтобы выявить влияние каждой переменной в отдельности, следует влияние одной из них исключить, т.е. принять ее условно в качестве постоянной, неизменной величины, на уровне отчетного или базисного периода. Какой же период принять в качестве постоянной величины?

Если для получения индекса цен принять в качестве весов данные о количестве проданных товаров за отчетный период, то придерживаясь принятых выше обозначений, можно записать формулу агрегатного индекса цен:

где р{ и р0 цена единицы проданных товаров в отчетном и базисном периодах; q{ и q0 количество проданных товаров в отчетном и базисном периодах.

Если же принять в качестве весов данные о количестве проданных товаров в базисном периоде, то формула агрегатного индекса цен будет иметь следующий вид:

Получены две формулы агрегатных индексов цен: с отчетными и базисными весами. Эти индексы не идентичны. Величина индекса зависит от индексируемых показателей, т.е. от величин, изменения которых мы хотим определить.

Первый индекс характеризует изменение цен отчетного периода по сравнению с базисным по продукции, реализованной в отчетном периоде, и фактическую экономию от снижения цен. Экономическое содержание второго индекса совершенно другое. Он показывает, насколько, изменились цены в отчетном периоде по сравнению с базисным, но по той продукции, которая была реализована в базисном периоде, и экономию, которую можно было бы получить от снижения цен, т.е. условную экономию.

Индекс физического объема товарооборота должен показывать изменение физического объема в отчетном периоде по сравнению с базисным. Чтобы агрегатный индекс характеризовал только изменение физического объема товарооборота (продукции, потребления) и не отражал изменения цен, в качестве весов берутся неизменные цены как для базисного, так и для отчетного периодов. А неизменные цены всегда являются ценами базисного периода.

Таким образом, в индексе физического объема сомножитель индексируемого показателя берется на уровне базисного периода.

На практике часто приходится иметь дело не с двумя, а с большим числом периодов. Если индексы исчисляются за несколько периодов, то для всех них могут быть приняты одни и те же веса — индексы с постоянными весами, или же для каждого периода свои веса — индексы с переменными весами. Проиллюстрируем это примером.

Имеются данные о количестве и ценах проданных товаров.

Наименование

товара

Продано товаров

Цена за ед., руб.

Январь

Февраль

Март

...п

Январь

Февраль

Март

...п

А, кг

200

210

240

250

4,0

3,8

3,7

3,5

В, шт.

60

75

90

100

20,0

19,0

18,5

18

Требуется вычислить помесячные индексы. Их можно вычислить по-разному, в зависимости от решаемой задачи.

Теоретически возможны четыре типа индексов.

1. Общие базисные индексы цен с постоянными (базисными) весами (январскими):

В данных индексах цены каждого последующего периода (февраля — р{, марта — р2 и т.д.) сопоставляются с ценами января 0) и взвешиваются на одно и то же количество товаров, проданных в январе (q0). Полученные показатели характеризуют изменение цен по сравнению с начальным периодом, но не отражают изменений в структуре проданных товаров.

2. Общие базисные индексы цен с переменными (отчетными) весами:

В этих индексах цены каждого последующего периода (февраля — р1? марта — р2 и т.д.) сравниваются с ценами января (/;0), но в качестве весов каждый раз берется количество товаров отчетного периода (qj, q2 и т.д.). В вычисленных индексах находят отражение как изменения цен по сравнению с начальным (базисным) периодом, так и изменения структуры проданных товаров.

3. Общие цепные индексы цен с постоянными весами (январскими):

Эта группа индексов получена путем сопоставления цен каждого последующего периода с предыдущим, взвешенных на одно и то же количество товаров, проданных в январе (г/0). Эти индексы отражают изменение цен каждого периода по сравнению с предыдущим, но не отражают изменения в структуре проданных товаров. 4. Общие цепные индексы цен с переменными весами:

Эти индексы получены путем сопоставления цен каждого последующего периода с предыдущим, но взвешенных в каждом случае на количество товаров отчетного периода (q{, q2 и т.д.). В рассчитанных индексах находит отражение как изменение цен за ряд последовательных периодов, так и изменение структуры проданных товаров.

Индексы с переменными весами не дают возможности перехода от цепных индексов к базисным и наоборот, так как веса их различны:

Индексы с постоянными весами допускают возможность перехода от цепных к базисным индексам и наоборот. Перемножив два (или несколько) цепных индексов с постоянными весами, получим базисный индекс:

а поделив два базисных индекса с постоянными весами, получим индекс цепной:

Выбор периода взвешивания индексов зависит от того, какие индексы вычисляются: индексы количественных (объемных) или качественных показателей. В теории статистики принята следующая система взвешивания: сомножители количественных индексируемых показателей берутся на уровне базисного периода, а качественных — на уровне отчетного.

Система взаимосвязанных индексов дает возможность широко применять индексный метод для проведения факторного анализа с целью определения роли, влияния отдельных факторов на изменение сложного явления, но здесь снова возникает проблема весов.

Например, рассмотренный ранее индекс товарооборота зависит не только от изменения цен от одного периода к другому, но и от изменения физического объема товарооборота, т.е. не только от индекса цен, но и от индекса физического объема товарооборота. Связь между этими тремя индексами такая: Ipq = 1рIq. Чтобы убедиться в этом, подставим буквенные обозначения и получим:

При анализе себестоимости необходимо учитывать следующую систему взаимосвязанных индексов: Izq = I, ? Iq, т.е. индекс издержек производства равен индексу себестоимости, умноженному на индекс физического объема:

В этой системе индексов 1г взвешивается по количеству изделий, выработанных в отчетном периоде, a Iq по уровню себестоимости отдельных изделий в базисном периоде.

Пример 2.17 (продолжение)

Если, например, себестоимость единицы продукции в отчетном периоде но сравнению с базисным снизилась на 2%, а физический объем выпущенной продукции увеличился на 5%, то можно определить изменения издержек производства: 1Щ = I, х х 1Ц = 0,98 • 1,05 = 1,029 или 102,9%. Таким образом, при увеличении выпуска продукции на 5% издержки производства увеличились только на 2,9% из-за снижения себестоимости единицы произведенной продукции.

Аналогично при анализе производительности труда можно построить систему взаимосвязанных индексов. Так, индекс производительности труда равен отношению индекса физического объема продукции (по трудовым затратам) к индексу трудовых затрат:

Пример 2.17 (окончание)

Если, например, индекс физического объема продукции составил 114,4%, а индекс трудовых затрат — 104%, то индекс производительности труда будет равен:

Производительность труда в отчетном периоде по сравнению с базисным возросла на 10%.

Кроме двухфакторпой связи общий индекс может зависеть от трех, четырех и более факторов, т.е. связь может быть трехфакторной, четырехфакторной и т.д. Поэтому общие индексы могут быть разложены не только на два, но и на три и более факторных индекса, объясняющих изменение общего индекса влиянием каждого фактора в отдельности.

Пример 2.18

По данным таблицы требуется определить, насколько изменились затраты труда в отчетном периоде по сравнению с базисным.

Вид

продукции

Базисный период

Отчетный период

Производство продукции (П0), 1UT.

Удельный вес продукции в общем объеме производства (У0)

Фактические затраты труда на ед. изделия (Н0), чел.-дн.

Производство продукции (П(), шт.

Удельный вес продукции в общем объеме производства (Kj)

Фактические затраты труда на ед. изделия (Н,), чел.-дн.

Ассортимент А

300

0,75

8

450

0,9

6

Ассортимент В

100

0,25

15

50

0,1

15

Итого

400

1,0

-

500

1,0

-

Общие затраты труда зависят от размеров производства каждого вида ассортимента мебели (П), их структуры (У) и затрат труда на единицу изделия (Н). Общий индекс затрат груда отражает влияние всех трех факторов:

Индекс показывает, что под влиянием этих факторов затраты труда в отчетном периоде по сравнению с базисным возросли на 15%, или на 330 чел.-дн. (2505 - 2175).

Чтобы определить влияние каждого фактора в отдельности, необходимо вычислить три факторных индекса.

1. Факторный индекс общего размера производства данных изделий:

Следовательно, вследствие роста общего объема производства общие затраты труда увеличились на 33%, т.е. на 712,5 чел.-дн. (2887,5 - 2175).

2. Факторный индекс структуры продукции:

Индекс показывает, что затраты труда вследствие изменения структуры продукции в отчетном периоде по сравнению с базисным возросли на 14% или на 427,5 чел.-дн. (3315 - 2887,5).

3. Факторный индекс затрат труда на единицу изделия:

Эго значит, что вследствие изменения средней нормы затрат труда на единицу изделия общие затраты труда снизились на 24% или на 810 чел.-дн. (3315 - 2505).

Таким образом совокупность всех факторов привела к увеличению общих затрат труда на 15%, а в абсолютном выражении на 330 чел.-дн. (712,5 + 427,5 - 810).

Между тремя факторными индексами и общим индексом затрат существует следующая зависимость: /общ = 1п1У1ц.

Подставим их значения и получим:

  • [1] См.: Джини К. Средние величины. М.: Статистика, 1970.
  • [2] = X Y/N = (344,2 + 529,0 + 730,1 + 916,7 +1119,4)/5 = 727,9 (тыс. шт.).
 
Посмотреть оригинал
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 

Популярные страницы