Примеры решения задач

Приведем несколько примеров решения задач по рассмотренным в главе методикам.

Пример 3.13

Деятельность п = 8 карьеров характеризуется себестоимостью 1 т песка (X1), сменной добычей песка 2) и фондоотдачей 3). Значения показателей представлены в таблице.

X1, тыс. руб.

30

20

40

35

45

25

50

30

X2, тыс. руб.

20

30

50

70

20

20

90

25

X3

20

25

20

15

10

30

10

20

Требуется:

  • 1) оценить параметры генеральной совокупности, которая предполагается нормально распределенной;
  • 2) при а = 0,05 проверить значимость частных коэффициентов корреляции р|2/з" Pi3/2 и Ргз/i и *фи Y = 0,95 построить интервальную оценку для р13/2;
  • 3) найти точечную оценку множественного коэффициента корреляции р1/2з и при а = 0,05 проверить его значимость.

Решение

1) Найдем значения средних арифметических (.у,) и средних квадратических отклонений (Sj) где j = 1,2,3, а также парных коэффициентов корреляции и

где

В результате расчетов получим

2) Предварительно найдем точечные оценки частных коэффициентов корреляции из выражения

где – алгебраическое дополнение элемента г,2 корреляционной матрицыа и– алгебраические дополнения первого и второго диагональных элементов этой матрицы:

Аналогично находими

Для проверки значимости частных коэффициентов корреляции найдем , где / – порядок коэффициента корреляции (число фиксированных признаков). В нашем примере

Так как , то гипотезане отвергается, т.е. предположение о равенстве р нулю не противоречит наблюдениям, но п = 8 мало.

Определим интервальную оценку дляпри". Для этого используем

Z-преобразование Фишера и предварительно найдем интервальную оценку для Z из условия

По таблице Z-преобразования Фишера для , учитывая, что будем иметь . По таблице нормального закона из условия Ф(0 = 0,95 найдем Тогда

откуда

По таблице Z-преобразования длянайдем интервальную оценку для

Полученная интервальная оценка подтверждает вывод о незначимости частного коэффициента корреляции р13/2. так как нуль находится внутри доверительного интервала.

3) Найдем точечную оценку множественного коэффициента корреляции р1/23 и при а = 0,05 проверим его значимость.

Точечная оценка определяется по формуле , где – определитель корреляционной матрицы:

Проверим гипотезу. Имеем

где 1=2. Критическое значение по таблице F- распределения

Так как , то гипотеза отвергается, т.е. множественный коэффициент корреляции не равен нулю ().

Пример 3.14

Проведем анализ взаимосвязи социально-экономических показателей группы стран по данным о 20 странах мира, обследованных по следующим девяти показателям:

x1 – детская смертность (количество умерших младенцев на 1000 новорожденных):

x2 – средняя продолжительность жизни женщин;

x3 – доля городского населения, %;

x4 – уровень грамотности населения, %;

x5 – прирост населения, %;

x6 – ВВП на душу населения, тыс. долл.;

x7 – уровень рождаемости (число родившихся на 1000 жителей); x8 – уровень смертности (число умерших на 1000 жителей); x9 – среднее число детей в семье.

Поданным обследования рассчитана матрица выборочных парных коэффициентов корреляции (см. с. 194).

Выберем в качестве исследуемого признака переменную x1 – детская смертность (число умерших младенцев на 1000 новорожденных). Требуется:

  • 1) проверить значимость каждого из коэффициентов на уровне значимости α = 0,05;
  • 2) определить признаки, наиболее важные для объяснения вариации исследуемой переменной, рассчитать выборочные частные коэффициенты корреляции исследуемого признака с каждым из признаков при фиксированном значении остальных; найти интервальные оценки частных коэффициентов корреляции, определить значимость коэффициентов; сравнить частные коэффициенты корреляции с соответствующими парными и сделать выводы относительно роли исключенной переменной в изменении степени тесноты статистической связи, характеризуемой этими коэффициентами корреляции;
  • 3) рассчитать значение множественного коэффициента корреляции исследуемого признака с выбранными в п. 2 признаками; найти коэффициент детерминации, проверить его значимость.

1

-0,879

-0,758

-0,556

0,767

-0,600

0,826

-0,580

0,698

1

0,817

0,710

-0,591

0,631

-0,676

0,406

-0,514

1

0,717

-0,515

0,664

-0.615

0,433

-0.466

1

-0,249

0,624

-0,329

0,313

-0,057

1

-0,604

0,963

-0,865

0,851

1

-0,658

0.612

-0,419

1

-0,833

0,906

1

-0,637

1

Решение

Определим по таблице Фишера – Йейтса критическое значение гкр для одного из наиболее часто использующихся уровней значимости а = 0,05. С учетом объема выборки п = 20 находим число степеней свободы v = п – 2 = 18. Но данным таблицы получаем rKJ> = 0,444.

Для выборочных парных коэффициентов корреляции ri}, абсолютная величина которых превосходит критическое значение, отвергается гипотеза о равенстве нулю соответствующих им истинных коэффициентов корреляции (H0: р^ = 0), и они считаются значимыми. Остальные истинные значения коэффициентов корреляции от нуля существенно не отличаются. Подчеркнем значимые коэффициенты корреляции.

1

-0.879

-0.758

-0,556

0.7.67

-0.600

0.826

-0,580

0,622

1

0.817

0,710

-0.591

0.631

-0,676

0,406

-0,514

1

0,717

-0,515

0.664

-0,615

0.433

-0,466

1

-0.249

0,624

-0,329

0,313

-0,057

1

-0.604

0.963

-0.865

0,851

1

-0,658

0.612

-0,419

1

-0.833

0,906

1

-0.637

1

С вероятностью 1 – а = 0,95 можно утверждать наличие статистически значимой связи между i-м и j-м признаками, выборочный парный коэффициент корреляции которых rij значим. Связь между другими признаками с такой мерой уверенности не установлена (что, впрочем, не дает оснований творить о ее отсутствии).

Среди признаков, которые могут обусловливать вариацию детской смертности, выделим уровень грамотности населения () и среднее число детей в семье (). Соответствующие парные коэффициенты корреляции значимы и свидетельствуют о наличии существенной связи между этими переменными и исследуемой переменной. Ограничив корреляционную модель исследуемой переменной и двумя выбранными признаками, запишем для нее матрицу парных коэффициентов корреляции, взяв значения коэффициентов из общей корреляционной матрицы.

1

-0,556

0,698

-0.556

1

-0,057

0,698

-0,057

1

Вычислим выборочные частные коэффициенты корреляцииипо формуле

где– алгебраическое дополнение элементаматрицы выборочных парных коэффициентов корреляции.

В данном случае благодаря небольшой размерности матрицы несложно получить расчетное соотношение в аналитическом виде:

После подстановки значений получаем

Аналогично определяем другие выборочные частные коэффициенты корреляции:

Выборочные частные коэффициенты корреляцииине отличаются по знаку от соответствующих парных коэффициентови, но превосходят их по абсолютной величине. Следовательно, исключаемый признак .г9 ослабляет взаимосвязь между признаками x1 и x4, а признак x4 ослабляет связь признакови

Рассчитаем интервальные оценки парных коэффициентов корреляции. Определяемая значением выборочного коэффициента корреляции величина , называемая Z-преобразованием Фишера, распределена приближенно нормально с математическим ожиданием и дисперсией , где т – число исключенных величин; – истинное значение коэффициента корреляции. Интервальная оценка для нормально распределенной величины определяется выражением

где – интеграл Лапласа; – несмещенная оценка математического ожидания.

Для выборочного частного коэффициента корреляции гИ(9) = -0,722 получаем Z' = -0,931. Можно использовать приближенное значение без поправки на несмещенность, определяемое по таблице Z-преобразования Фишера, г' ~ -0,91. Используя последнее значение и определив но таблице нормального закона распределения для Ф(Гу) = 1 – а = 0,95 величину ty = 1,96, получаем Р(-1,4 < Z < -0,42) = 0,95.

По таблице /-преобразования Фишера находим значения коэффициента корреляции р, соответствующие границам интервала величины Z, и определяем его интервальную оценку: Р(-0,89 < р,4<9) < -0,40) = 0,95.

В интервале возможных значений частного коэффициента корреляции нуль не содержится, поэтому с вероятностью 0,95 можно утверждать, что частный коэффициент корреляции нулю не равен. Диапазон возможных значений частного коэффициента корреляции показывает, что между детской смертностью и уровнем грамотности взрослого населения существует обратная линейная статистическая зависимость, степень тесноты которой либо умеренная, либо сильная.

Аналогично получим интервальную оценку для другого частного коэффициента корреляции:

Этот коэффициент также является значимым, а диапазон его значений указывает на прямую зависимость детской смертности от среднего числа детей в семье.

Рассчитаем значение выборочного множественного коэффициента корреляции исследуемого признакапо формуле

где– определитель матрицы выборочных парных коэффициентов корреляции.

Расчетное аналитическое соотношение будет иметь вид

Подставим значения выборочных парных коэффициентов корреляции и получим

Рассчитанный коэффициент является выборочным значением множественного коэффициента корреляции – максимального среди взятых по модулю парных коэффициентов корреляции переменнойс линейными комбинациями признаков и. Квадрат множественного коэффициента корреляции коэффициент детерминации– показывает долю дисперсии исследуемой случайной переменной, обусловленную вариацией включенных в модель признаков. Выборочное значение коэффициента детерминации. Остальные 24,5% дисперсии исследуемой переменной обусловлены действием признаков, не включенных в модель. С помощью F-критерия определим значимость коэффициента детерминации, проверив гипотезу• Вычислим значение F-статистики:

Рассчитанное значение сравним с критическим, найденным но таблице Фишера – Снедекора для уровня значимости а = 0,05 и числа степеней свободы числителя и знаменателя

 
< Пред   СОДЕРЖАНИЕ     След >