Однофакторный линейный корреляционно-регрессионный анализ

Наиболее разработанной в настоящее время является методология парной корреляции, рассматривающая влияние вариации одного факторного признака X на результативный признак У. Теория и методика парной корреляции служат основой более сложных приемов и методов изучения статистических связей.

При изучении парной регрессии показателей социально-экономической сферы используются различные функции (уравнения):

  • • линейная У = а0 + алХ
  • • логарифмическая У = а0 + ал lgX;
  • • показательная У = а0 +
  • • степенная У = а0Хаi;
  • • параболическая У = а0 + а{Х + а2Х2;

гиперболическая У = а0 + а{ — и др.

X

Выбор функции, которая наиболее точно выражает связь между анализируемыми показателями, — важнейший этап корреляционно-регрессионного анализа.

При решении этой задачи необходимо использовать теоретические знания об изучаемом процессе и опыт предыдущих аналогичных исследований. Возможности современной вычислительной техники позволяют выбрать «наилучшую» функцию эмпирически — перебором и оценкой функций разного вида.

Определение параметров выбранной функции осуществляется с помощью метода наименьших квадратов, в основу которого положен критерий минимальности суммы квадратов отклонений эмпирических (фактических) данных (У,) от соответствующих им расчетных значений результативного признака (Yj):

Чаще всего используется линейное уравнение парной регрессии:

где Yj — теоретическое (расчетное) значение результативного признака, полученного по уравнению регрессии; а0 и ал — параметры уравнения регрессии.

Коэффициент ал (коэффициент регрессии) показывает, на сколько единиц в среднем изменится результативный признак при изменении факторного признака на одну единицу его измерения. Знак при коэффициенте регрессии свидетельствует о направлении зависимости Y от X:

  • • при ал > 1 зависимость прямая;
  • • при ал< 0 зависимость обратная.

Параметр я0 показывает среднее значение результативного признака Y при X - 0 в случае, если в исходных данных имеется нулевое значение факторного признака. Во всех остальных случаях а0 экономически не интерпретируется и количественно представляет собой «доводку», обеспечивающую равенство

Параметры уравнения (9.1) в соответствии с методом наименьших квадратов определяются по формулам

Определив значения я0 и я, и подставив их в уравнение (9.1), находим значение Y,, зависящее только от заданного уровня х{.

Пример 9.1

Построим уравнение парной регрессии, отражающее зависимость годовой заработной платы и выработки продукции рабочих завода. В этом случае результативным признаком является заработная плата рабочих, а в качестве факторного признака выступает выработка продукции в натуральном выражении.

Распределение рабочих завода по выработке и заработной плате

Исходные данные

Расчет

номер

рабочего

выработка продукции, тыс. шт.

заработная плата, тыс. руб.

Xf

Yi2

Ъ

х,

Y

1

2

3

4

5

6

7

1

4,4

9,6

19,36

92,16

42,24

11,83

2

4,5

9,8

20,25

96,04

44,2

12,03

3

6,1

17,5

37,21

306,25

106,75

15,30

4

6,5

17,8

42,25

316,84

115,7

16,12

Исходные данные

Расчет

номер

рабочего

выработка продукции, тыс. шт.

заработная плата, тыс. руб.

X?

Гi2

ХУ,

%

х,

Y,

1

2

3

4

5

6

1

5

7,0

17,5

49,0

306,25

122,5

17,14

6

7,0

18,8

49,0

353,44

131,6

17,14

7

7,5

17,8

56,25

316,84

133,5

18,17

8

8,0

19,2

64,0

368,64

153,6

19,19

9

8,1

21,0

65,61

441,0

170,1

19,39

10

8,4

19,6

70,56

384,16

164,64

20,01

11

8,5

20,1

72,25

404,01

170,85

20,21

12

9,0

20,6

81,0

424,36

185,4

21,23

13

9,3

22,0

86,49

484,0

204,6

21,85

14

9,5

22,5

90,25

506,25

213,75

22,26

15

12,0

26,0

144,0

676,0

312,0

27,37

16

12,4

27,8

153,76

772,84

344,72

28,19

Итого

168

379

1525

6757

3051

753

хъ

X*?

xn2

iXfi

XYt

В таблице факторный признак X проранжирован, и сопоставление параллельных рядов (графы 2 и 3) позволяет утверждать, что между рассматриваемыми показателями существует прямая зависимость: с ростом объема выработки увеличивается величина заработной платы.

Наличие такой связи подтверждается расположением точек и ломаной линией на корреляционном поле.

Зависимость заработной платы рабочих от выработки продукции

Для количественной оценки связи между анализируемыми показателями определим параметры линейного уравнения регрессии:

где Y — теоретические (расчетные) значения результативного признака (заработной платы), полученные по уравнению регрессии; а0 и ал — параметры уравнения регрессии; X — выработка продукции.

Используя информацию таблицы, но формулам (9.2) рассчитаем значения параметров парной регрессии:

Таким образом, регрессионная модель зависимости заработной платы рабочих от выработки продукции выгладит следующим образом:

Графическое изображение этой функции показано на рисунке сплошной прямой линией.

Такая зависимость означает, что с ростом выработки продукции в данной совокупности рабочих на 1 гыс. шт., в среднем величина их заработной платы увеличивается на 2,8 тыс. руб.

Величины, представленные в графе 7 таблицы, рассчитываются следующим образом:

Правильность расчета параметров уравнения регрессии подтверждает равенство: = =307,6 (некоторое расхождение объясняется округлением расчетов).

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >