Понятие о других методах многомерного статистического анализа

Многомерный статистический анализ определяется[1] как раздел математической статистики, посвященный математическим методам построения оптимальных планов сбора, систематизации и обработки многомерных статистических данных, направленных на выявление характера и структуры взаимосвязей между компонентами исследуемого признака и предназначенных для получения научных и практических выводов.

Многомерные статистические методы среди множества возможных вероятностно-статистических моделей позволяют обоснованно выбрать ту, которая наилучшим образом соответствует исходным статистическим данным, характеризующим реальное поведение исследуемой совокупности объектов, оценить надежность и точность выводов, сделанных на основании ограниченного статистического материала.

С некоторыми разделами многомерного статистического анализа, такими, как многомерный корреляционный анализ, множественная регрессия, многомерный дисперсионный анализ (на примере двухфакторного анализа) мы уже сталкивались в гл. 11 — 13. Приведем теперь краткий обзор ряда других методов многомерного статистического анализа, которые уже нашли отражение в статистических пакетах прикладных программ. В первую очередь следует выделить методы, позволяющие выявить общие {скрытые или латентные) факторы, определяющие вариацию первоначальных факторов. К ним относятся факторный анализ и метод главных компонент.

Факторный анализ. Основной задачей факторного анализа является переход от первоначальной системы большого числа взаимосвязанных факторов Хх, Х‘2,..., Хт к относительно малому числу скрытых (латентных) факторов F,F2, ...,Fk, k < т. Скажем, производительность труда на предприятиях зависит от множества факторов (образовательного уровня сотрудников, коэффициента сменности оборудования, электровооруженности труда, возраста оборудования, количества мест в столовых и т.п.), из которых многие факторы связаны между собой. Используя факторный анализ, можно установить влияние на рост производительности труда лишь нескольких обобщенных факторов (например, размера предприятия, уровня организации труда, характера продукции), непосредственно не наблюдавшихся.

Модель факторного анализа записывается в виде

где а, = M(Xj) — математическое ожидание первоначального фактора Х;; Fj — общие (скрытые или латентные) факторы (/ = 1,2,..., к); й,; — нагрузки первоначальных факторов на общие факторы; е; — характерные факторы (г = 1, 2,..., т); Vj — нагрузки первоначальных факторов на характерные факторы.

Первое слагаемое в модели (13.46) — неслучайная составляющая, другие два слагаемых — случайные составляющие.

Особенностью факторного анализа является неоднозначность определения общих факторов.

Метод главных компонент (компонентный анализ). В отличие от рассматриваемых в факторном анализе общих факторов, которые обусловливают большую (но не всю) часть вариации первоначальных факторов, главные компоненты объясняют всю вариацию и определяются однозначно. Модель главных компонент имеет вид

Как видим, в модели (13.47) отсутствуют характерные факторы, так как главные компоненты Fj полностью обусловливают всю вариацию первоначальных факторов.

Для углубления анализа изучаемого явления после выявления главных компонент рассматривают регрессию на главных компонентах, в которых последние выступают в качестве обобщенных объясняющих переменных.

Среди других методов многомерного статистического анализа отметим методы, позволяющие осуществить классификацию экономических объектов, т.е. отнесение их к определенным классам. Это методы дискриминантного и кластерного анализа.

Дискриминантный анализ позволяет отнести объект, характеризующийся значениями т признаков, к одной из / совокупностей (классов, групп), заданных своими распределениями. Предполагается, что / совокупностей заданы выборками (называемыми обучаемыми), которые содержат информацию о статистических распределениях совокупностей в т-мерном пространстве признаков.

При отсутствии обучающих выборок могут быть использованы методы кластерного анализа, позволяющие разбить исследуемую совокупность объектов на группы «схожих» объектов, называемых кластерами, таким образом, чтобы объекты одного класса находились на «близких» расстояниях между собой, а объекты разных классов — на относительно «отдаленных» расстояниях друг от друга. При этом каждый объект X.- (j = 1, 2, ..., т) рассматривается как точка в ш-мерном пространстве, и выбор способа вычисления расстояний или близости между объектами и признаками является узловым моментом исследования, от которого в основном зависит окончательный вариант разбиения объектов на классы.

В завершение краткого обзора отметим, что применение методов многомерного статистического анализа невозможно без использования пакетов прикладных программ (см., например, |34|). Подробное изложение многомерных статистических методов приведено, в частности, в учебнике [ 14].

  • [1] См.: Математическая энциклопедия. Т. 3. М.: Советская энциклопедия, 1982.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >