Корреляционные связи между экономическими показателями и факторами
Кроме решения задачи установления вида связи между входными и выходными элементами экономической системы, осуществляемой регрессионным анализом, важное значение имеет установление тесноты связи между воздействующими факторами и результирующими показателями.
Оценка степени влияния на изменение результирующего показателя каждого фактора, позволяющая формировать мероприятия для достижения требуемых значений выходных показателей осуществляется с помощью корреляционного анализа.
Индекс корреляции
Простейшая мера связи между показателем у и фактором х - функция 5, используемая в методе наименьших квадратов:
Другая мера связи - среднее значение квадратов остатков, т.е.
Соотношение а^хср/а| характеризует уменьшение размаха колебаний фактических значений результирующего показателя у в результате использования линии регрессии. Если соотношение аост.срЛ7// = 0> т0 эт0 значит, что все точки выборки лежат на линии регрессии (т.е. зависимость между показателем и фактором носит строго функциональный характер). Если соотношение а2ст>ср/а| = 1, то уравнение регрессии ничего не объясняет.
Таким образом, отношение о'оГГ.с>/®?/ характеризует долю дисперсии показателя у, необъясненную регрессионной моделью, построенной с использованием факторах
Иным показателем, характеризующим улучшение качества модели (повышение тесноты связи между х и у) с возрастанием сто значения является коэффициент детерминации
характеризующий ту долю совокупной дисперсии о£ которая объясняется с помощью регрессионной модели. При /?2= 1 все значения выборки лежат на линии регрессии. При й2 = О уравнение регрессии ничего не объясняет.
К основным достоинствам коэффициента детерминации относятся:
- o симметричность относительно х и г/, т.е. /?27/ = Я]1Х
- o приемлемость как для однофакторной, так и для многофакторной модели любого вида;
- o универсальность как меры качества подбора уравнения регрессии.
По аналогии между дисперсией и средним квадратическим отклонением в математической статистике, в регрессионном анализе вместо коэффициента детерминации используют индекс корреляции (или корреляционное отношение)
Пример 17.4. Для условий предыдущего примера найдите индексы корреляции линейной и параболической регрессии.
Для определения индексов корреляции используем вспомогательную таблицу с учетом данных предыдущего примера:
Приведенные в таблице данные позволяют рассчитать составляющие формулы индекса корреляции для линейной и параболической регрессий:
а) общую дисперсию
б) остаточную дисперсию: o для линейной регрессии
o для параболической регрессии
в) индекс парной корреляции: o для линейной регрессии
o для параболической регрессии
Таким образом, при параболическом виде уравнения регрессии связь между показателем и фактором - более тесная.
Коэффициент парной корреляции
Для проверки наличия корреляции используют корреляционный момент(ковариацию)
Значение Кцу = О свидетельствует о том, что связь между х и у отсутствует. Если Кщ. * 0, то связь между х и у есть.
Пример 17.5. Найдите корреляционные моменты для следующих пар наблюдений щ, у;.
- o первый случай (1, 1); (4, 1); (4, 4); (1, 4);
- o второй случай (1, 1); (2, 2); (3,3); (4,4); (5,5). В первом случае Кху = 0, а во втором КХ1/ = 2.
Для оценки тесноты связи х и у используется и безразмерная величина - коэффициент парной корреляции глу (отношение корреляционного момента КХ!/ к произведению средних квадратических отклонений показателя о,, и фактора
В первом случае ау - 2 и о,- = 2, тогда гху = 0: (2 o 2) = 0.
Во втором случае ау = ^2 и ах = 42, тогда г-, -2:2 - 1.
Для функциональной же убывающей связи (5,1); (4,2); (3,3); (2, 4); (1,5)^= -2, а г --1.
Таким образом коэффициент парной корреляции г™ может меняться от +1 до -1 (для возрастающей и убывающей функций, соответственно) и быть равен нулю при отсутствии связи.
Коэффициент парной корреляции служит мерой приближения к линейной функциональной связи. Для нелинейной функциональной связи между .г и у ;;,?/ * 1.
Пример 17.6. Рассчитайте коэффициенты парной корреляции для условий примера 17.4.
Используя исходные данные имеем:
В рассмотренном примере зависимость между хну близка к линейной функциональной.
Для оценки надежности коэффициента парной корреляции гху определяется его погрешность по формуле
Затем рассчитывается отношение г^/ог
Если Гуу/а,- > 3, то можно считать, что полученный коэффициент корреляции отражает суть связи хну (при п > 50).
Индекс корреляции ЯХ!/ и коэффициент парной корреляции гху связаны между собой зависимостью Ях// > гху.
Множественная корреляция
Если на показатель влияет не один фактор, а несколько, их влияние оценивается не через коэффициент парной корреляции, а через совокупный коэффициент корреляции, определяемый, например, для двух факторов (х,х2) по формуле
где гуХх, гуХ2 - коэффициенты парной корреляции между показателем"?/ и факторами хь х2 гХи1-.г - коэффициенты парной корреляции между факторами Х, х2.
Совокупный коэффициент корреляции изменяется от 0 до 1. Если г"(д.1|Л-2) = 0, то показатель у не может быть связан СХ и х2 линейной корреляционной зависимостью. При этом возможна иная связь. Если Гу(*1,*2)= ^'то связь между у, Х,Х2 носит линейный функциональный характер. Во всех остальных случаях совокупный коэффициент корреляции - мера линейной корреляции между у, Х и х2.
Если в уравнении регрессии более двух факторов, то совокупный коэффициент корреляции определяется по формуле
Частный коэффициент корреляции - оценка степени связи показателя у с одним из факторов при исключении влияния других.