Факторно-регрессионные модели характеристик электрических станций

Задача оптимизации размещения и выбора мощности электрических станций предполагает наличие экономических показателей их сооружения. При решении оптимизационных задач или задач сравнительной эффективности вариантов развития энергетических объектов в качестве экономического критерия обычно используются затраты. Затраты могут быть представлены в виде зависимости от совокупности технико-экономических показателей, включая постоянные КудСТ и irneP

переменные Куд удельные капиталовложения в сооружение электрических станций и другие экономические показатели Эст.

Постоянные удельные капиталовложения Куд0'1' практически не зависят от местоположения электростанции и определяются в основном конкретными технико-экономическими параметрами, такими как тип и мощность электростанции, число и мощность блоков, система технического водоснабжения, вид топлива и другие, образующие первый информационный уровень Х|. В связи с тем, что размер совокупности параметров первого информационного уровня нс очень велик и составляет около десяти параметров, моделирование постоянных удельных капиталовложений Ky°CT обычно выполняется на основе прямого использования методов регрессионного моделирования:

пб

Формирование переменных удельных капиталовложений КудР во многом определяется региональными Хм и местными или локальными Х||] инженерно-географическими условиями сооружения электрических станций, характеризующимися информационными параметрами, образующими второй и третий информационные уровни,

Сложность моделирования КудР объясняется свойствами параметров второго и третьего информационных уровней:

  • - размерность совокупности параметров второго и третьего информационных уровней весьма значительна и составляет около сотни параметров. Следует отмстить, что статистическая достоверность моделей достигается лишь в том случае, когда размер обучающей выборки превышает размерность совокупности параметров примерно на порядок. При моделировании же переменных удельных капиталовложений размер обучающей выборки N ограничен числом выполненных проектов, ТЭО электростанций и составляет величину того же порядка, что и размер совокупности параметров Хи и Хщ;
  • - каждый отдельный параметр второго и третьего информационных уровней имеет довольно слабые связи с моделируемыми переменными удельными капиталовложениями, в то же время совместное влияние всех параметров второго и третьего информационных уровней велико. В обследованных выборочных совокупностях совместное влияние всех параметров второго и третьего информационных уровней определяет около 80-90 % дисперсии переменных удельных капиталовложений;
  • - параметры второго и третьего информационных уровней взаимозависимы, коррелированны между собой. Некоторые коэффициенты корреляции в обследованных выборочных совокупностях превышают значение 0,8. В то же время регрессионные модели, полученные по коррелированной совокупности параметров, обладают слабой достоверностью (низкой точностью).

Перечисленные свойства параметров второго и третьего информационных уровней ограничивают использование прямого регрессионного анализа для моделирования переменных удельных капиталовложений и обуславливают необходимость прсдваритсль-ного применения методов ортогонального преобразования прос-транства.

Одним из таких методов является метод факторного анализа. С помощью факторного анализа при моделировании переменных удельных капиталовложений Ку®р в сооружение электростанций коррелированное пространство параметров второго и третьего информационных уровней (Х|| и Хщ) размерности п может быть преобразовано в пространство ортогональных факторов F той же размерности п. При этом, практически без потери точности описания совокупности параметров, размерность пространства факторов может быть существенно снижена до т, причем т « п. Снижение размерности ортогонального пространства факторов позволяет повысить достоверность результатов моделирования переменных удельных капиталовложений Ку®р, т. к. при снижении размерности пространства факторов по сравнению с пространством параметров размер выборочной совокупности не меняется и число наблюдений N становится больше числа переменных т.

Суть метода факторного анализа можно продемонстрировать на примере преобразования пространства двух коррелированных параметров Хх и Х2 в пространство ортогональных факторов Fa и F2 (рис. 27).

Пусть имеются выборочные совокупности коррелированных параметров:

Выборочные совокупности сформированы случайным образом, поэтому параметры Хц и x2i распределены вокруг своих математических ожиданий по нормальному закону.

Преобразование пространства

Рис. 27. Преобразование пространства

Перейдем от именованных параметров Xt и Х2 к нормированным Za и Z2. Значение каждого отдельного нормированного параметра z;;- с номером i в наблюдении j можно определить по выражению

где i = 1,..., n; j = 1,..., N.

Следует отметить, что математическое ожидание каждого нормированного параметра равно нулю, а дисперсия - единице. Если выборочная совокупность содержит п нормированных параметров, то суммарная дисперсия совокупности нормированных параметров будет равна числу параметров п. В пространстве нормированных параметров Zt и Z2 выборочные значения параметров образуют, как показано на рис. 27, облако наблюдений, по виду близкое к эллипсу (в многомерном случае к гиперэллипсоиду).

При направлении первого фактора Fx вдоль главной (большей) оси эллипса первый фактор будет определять большую часть дисперсии нормированных параметров Zt и Z2. В общем случае это направление не совпадает с осями параметров и это значит, что именованные параметры Xl5 Х2 и нормированные Zl5 Z2 коррелируют между собой.

Второй фактор F2 направляется по меньшей оси эллипса и определяет оставшуюся часть дисперсии нормированных параметров Zx и Z2.

Поскольку первый фактор концентрирует в себе большую часть дисперсии параметров, то для описания исходной совокупности параметров Ъх и Z2 достаточно выделения одного фактора. Таким образом, исходная коррелированная совокупность двух параметров п = 2 заменена ортогональной совокупностью факторов размерностью т = 1.

Теперь, вместо модели

может быть построена модель

При большей размерности совокупности параметров п > 2 бывает недостаточно учета только одного фактора и следует учесть т факторов, но обычно т « п.

В общем случае исходное пространство п нормированных коррелированных параметров Z может быть преобразовано в ортогональное пространство факторов F той же размерности п, но при этом первые т факторов (ш « п), как правило, достаточно полно отражают исходное пространство параметров.

Матрица нормированных параметров Z имеет ту же размерность п х N, что и выборочная совокупность именованных параметров X (N - размер выборки наблюдений, п - число параметров):

Целью ортогонального преобразования пространства является корректная замена матрицы нормированных параметров Z на матрицу факторов F той же размерности:

Связь между матрицей нормированных параметров Z и матрицей ортогональных факторов F описывается матрицей нагрузок А на факторы, размер которой п х п,

Для каждого отдельного наблюдения к = 1,, 7V связь вектора параметров Zk с вектором факторов Fk в координатной форме имеет вид:

В матричном виде связь нормированных параметров с факторами имеет вид:

Для оценки коэффициентов матрицы нагрузок А используется матрица выборочных коэффициентов парной корреляции параметров R. Каждый из коэффициентов матрицы определяется в зависимости от нормированных параметров:

120

Выражение (147) можно записать в матричном виде:

Матрица нагрузок связана с выборочной корреляционной матрицей соотношением:

Для обоснования формулы (149) достаточно умножить обе части выражения (146) на их транспонированные значения:

тогда

Преобразовав правую часть соотношения (150) с использованием формулы (149), можно получить выражение (148):

Коэффициенты матрицы нагрузок А находятся на основе собственных значений (чисел) А* и проекций собственных векторов а;{аХ?, oc2j, , ctyi, i,j = 1,2,, m,, n, корреляционной

матрицы R выборочных значений параметров по выражению

С целью определения собственных значений (чисел) А; и проекций собственных векторов Од составляется характеристическое уравнение для корреляционной матрицы в виде

Корни характеристического уравнения и есть собственные числа матрицы R. Если матрица неособенная, а R именно такая, и ее ранг равен её размерности, то собственные числа матрицы положительны (Aj > 0), количество собственных чисел и их сумма равны размерности матрицы п

Как видно, сумма корней характеристического уравнения (собственных чисел корреляционной матрицы) равна суммарной дисперсии выборочной совокупности нормированных параметров и, следовательно, собственные числа могут служить оценкой дисперсии параметров.

Если расположить собственные числа корреляционной матрицы Aj в порядке их убывания так, чтобы Ах > А2 > ••• > Ат > ••• > Ап, то первое собственное число будет описывать максимальную долю дисперсии совокупности параметров, а каждое последующее - меньшую долю. Анализ значений собственных чисел А,- показывает, что сумма первых т собственных чисел практически равна п, а остальные собственные числа несопоставимо малы и могут быть отброшены,

Эго означает, что первые т собственных чисел могут служить оценкой дисперсии всей совокупности параметров.

Далее возникает задача определения собственных векторов корреляционной матрицы, соответствующих первым т собственным числам Aj. Расчет векторов корреляционной матрицы ведется в порядке убывания собственных чисел, т. е. сначала определяется собственный вектор, соответствующий максимальному собственному числу Аг, а затем следующим значениям А2, А3, ..., Ат.

Для оценки проекций собственного вектора a;i, у = 1,..., п, i = 1,..., m, составляется система линейных уравнений вида

здесь Е - единичная матрица; а*{а^, a2j, ..., a;j, ..., аш} - собственный вектор с номером i.

Выражение (154) можно представить в координатной форме

Система линейных уравнений (155) включает два линейно зависимых уравнения (г. к. А; являются корнями характеристического уравнения корреляционной матрицы R). Системы линейно зависимых уравнений имеют множество решений, поэтому для получения проекций собственного вектора аДа^, а2;, ..., a;i, ... ,ani) необходимо предварительно как-то ориентировать одну из проекций вектора ctj и понизить размерность системы уравнений. Задав одну из проекций a’j, можно определить остальные координаты вектора на основе решения системы уравнений меньшей размерности.

Первый собственный вектор сt;, соответствующий максимальному собственному значению Аг, указывает направление первого фактора, а его длина определяется значением Аг. Теперь коэффициенты матрицы нагрузок А можно найти на основе собственных значений корреляционной матрицы Аь А2, Л3, ..., Аот и соответствующих им собственных векторов аДа^, а2?, ..., a;i, ..., ani} по выражению (155).

Как уже было указано выше, суммарная дисперсия совокупности п нормированных параметров равна ее размерности совокупности п. Учет факторами Fi? i = 1, 2,..., m,..., п, суммарной дисперсии нормированных параметров определяется соответствующими собственными числами Aj корреляционной матрицы, сумма которых равна п. Следовательно, если сумма первых т собственных чисел примерно

Вклад факторов в дисперсию параметров

Рис. 28. Вклад факторов в дисперсию параметров

равна п, то и первые т (т < п) факторов учитывают почти всю дисперсию п параметров.

Вклад каждого фактора в дисперсию параметров соответствует величине А/, т. к. сумма дисперсий нормированных параметров равна их сумме - п, учет суммарной дисперсии параметров первыми т факторами показан на рис. 28.

На основе анализа учета факторами суммарной дисперсии совокупности нормированных параметров можно отбросить несущественные факторы с номерами i — m + l, т — 2,..., п, и получить редуцированную (усеченную) матрицу Ар

Для оценки учета дисперсии совокупности нормированных параметров первыми т выделенными факторами используется матрица вычисленных коэффициентов корреляции RBbI4.

Матрицу вычисленных коэффициентов корреляции RBb|t| можно определить по выражению (149) с использованием редуцированной матрицы нагрузок на факторы

Проверку достаточности числа выделенных факторов т необходимо проверить по статистическим критериям. В качестве статистического критерия может быть использован критерий Пирсона. По критерию Пирсона оценивается значимость коэффициентов матрицы остаточных коэффициентов корреляции Rocx. Матрица остаточных коэффициентов корреляции R0CT вычисляется как разность матриц выборочных и вычисленных коэффициентов корреляции параметров

Для оценки значимости матрицы остаточных коэффициентов корреляции R0CT определяется матрица доверительных интервалов коэффициентов корреляции AR, состоящая из доверительных интервалов для каждого коэффициента корреляции |Дг^-|. Доверительные интервалы коэффициентов корреляции |Дг^ | определяются с использованием стандартного статистического распределения Пирсона.

Принцип проверки значимости матрицы остаточных коэффициентов корреляции заключается в сравнении каждого коэффициента матрицы |ост| с его доверительным интервалом. Коэффициент считается незначимым, если соблюдается условие |г;уост| < |Дгу| для каждого коэффициента матрицы R0CT.

Если проверка значимости матрицы остаточных коэффициентов корреляции неудовлетворительна, то следует увеличить число выделяемых факторов.

Процесс увеличения числа факторов продолжается до тех пор, пока остаточные коэффициенты корреляции значимы.

После выделения достаточного числа ортогональных факторов следует приступить к оценке значений факторов по всем наблюдениям выборочной совокупности нормированных параметров. Значения т выделенных факторов по N наблюдениям образуют матрицу факторов F.

Оценка значений факторов по наблюдениям производится с помощью регрессионного анализа. С этой целью левая и правая части выражения (146) умножаются на их транспонированные значения:

Теперь, обратив матрицу вычисленных коэффициентов корреляции и преобразовав выражение (159), можно получить матрицу значений факторов по наблюдениям

или

где W - матрица связи параметров с факторами,

После оценки значений факторов по наблюдениям можно на основе регрессионного анализа построить факторно-регрессионную модель переменных удельных капиталовложений в сооружение электрических станций в зависимости от ортогональных факторов в виде

Факторно-регрессионные модели переменных удельных капиталовложений в сооружение электрических станций в зависимости от ортогональных факторов обладают приемлемой точностью и могут быть использованы при решении задач развития электроэнергетических систем. Следует заметить, что при использовании факторно- регрессионных моделей для прогнозирования технико-экономических характеристик необходимо предварительно определить на перспективу прогнозные значения факторов. Обычно при определении прогнозных значений факторов не выполняется уточнение матрицы связи W и используется матрица связи, полученная по обучающей выборке параметров.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >