Регрессионный анализ результатов моделирования.

Регрессионный анализ дает возможность построить модель, наилучшим образом соответствующую набору данных, полученных в ходе машинного эксперимента с системой 5. Под наилучшим соответствием понимается минимизированная функция ошибки, являющаяся разностью между прогнозируемой моделью и данными эксперимента. Такой функцией ошибки при регрессионном анализе служит сумма квадратов ошибок.

Пример 7.2. Рассмотрим особенности регрессионного анализа результатов моделирования ори построении линейной регрессионной модели. На рис. 7.2, а показаны тонки х„ у/, /-га полученные в машинном эксперименте с моделью Мм системы 5.

Делаем предположение, что модель результатов машинного эксперимента графически может быть представлена в виде прямой линии

Построение линейной регрессионной модели

Рис. 7.2. Построение линейной регрессионной модели

где у — величина, предсказываемая регрессионной моделью.

Требуется получить такие значения коэффициентов Ь0в Ь при которых сумма квадратов ошибок является минимальной. На рисунке ошибка ей /— 1."М для каждой

экспериментальной точки определяется как расстояние по вертикали от этой точки до линии регрессии у = <р(х).

Обозначим

Тогда выражение для ошибок будет иметь вид

а функция ошибки

Для получения Ь0 и Ь при которых функция Р0 является минимальной, применяются обычные методы математического анализа. Условием минимума является

гр01гьс=6-,др0/еь1=о.

Дифференцируя *0. получаем

Решая систему этих двух линейных алгебраических уравнений, можно получить значения Ь0 и Ь^. В матричном представлении эти уравнения имеют вид

Решая это уравнение, получаем

где N — число реализаций при моделировании системы.

Соотношения для вычисления Ь0 и 6, требуют минимального объема памяти ЭВМ для обработки результатов моделирования. Обычно мерой ошибки регрессионной модели служит среднее квадратичное отклонение

Для нормально распределенных процессов приблизительно 67% точек находится в пределах одного отклонения ае от линии регрессии и 95% - - в пределах 2ае (трубки А в В соответственно на рис. 7.2, б), для проверки точности оценок Ь0 и Ь1 регрессионной модели могут быть использованы, например, критерии Фишера (Р- распределение) и Стьюдента (/-распределение). Аналогично могут быть оценены коэффициенты уравнения регрессии и для случая нелинейной аппроксимации.

Дисперсионный анализ результатов моделирования.

При обработке и анализе результатов моделирования часто возникает задача сравнения средних выборок. Если в результате такой проверки окажется, что математическое ожидание совокупностей случайных переменных {У1*}, {У2)},{Уя)} отличается незначительно, то статистический материал, полученный в результате моделирования, можно считать однородным (в случае равенства двух первых моментов). Это дает возможность объединить все совокупности в одну и позволяет существенно увеличить информацию о свойствах исследуемой модели Л/„, а, следовательно, и системы 5. Попарное использование для этих целей критериев Смирнова и Стьюдента для проверки нулевой гипотезы затруднено в связи с наличием большого числа выборок при моделировании системы. Поэтому для этой цели используется дисперсионный анализ.

Пример 73. Рассмотрим решение задачи дисперсионного анализа при обработке результатов моделирования системы в следующей постановке. Пусть генеральные совокупности случайной величины {1)}, {У2)}, {У"*} имеют нормальное распределение и одинаковую дисперсию. Необходимо по выборочным средним значениям при некотором уровне значимости у проверить нулевую гипотезу Н0 о равенстве математических ожиданий. Выявим влияние на результаты моделирования только одного фактора, т. е. рассмотрим однофакторный дисперсионный анализ.

Допустим, изучаемый фактор х привел к выборке значений неслучайной

величины У следующего вида: у,, у2, у*, где к — количество уровней фактора

х. Влияние фактора будем оценивать неслучайной величиной Ьх, называемой бакторной диспепсией:

где у — среднее арифметическое значение величины У.

Если генеральная дисперсия В [у] известна, то для оценки случайности разброса наблюдений необходимо сравнить /)[у) с выборочной дисперсией 5?, используя критерий Фишера (.Р-распределение). Если эмпирическое значение попадает в критическую область, то влияние фактора х считается значимым, а разброс значений х — неслучайным. Если генеральная дисперсия й [х] до проведения машинного эксперимента с моделью Мы неизвестна, то необходимей при моделировании найти ее оценку.

Пусть серия наблюдений на уровне у/ имеет вид уц, уп, —, У/л, где п — число повторных наблюдений на 1-м уровне. Тогда на 1-м уровне среднее значение наблюдений

а среднее значение наблюдений по всем уровням

Общая выборочная дисперсия всех наблюдений

При этом разброс значений у определяется суммарным влиянием случайных причин и фактора х. Задача дисперсионного анализа состоит в том, чтобы разложить общую дисперсию Э [у] на составляющие, связанные со случайными и неслучайными причинами.

Оценка генеральной дисперсии, связанной со случайными факторами,

а оценка факторной дисперсии

Учитывая, что факторная дисперсия наиболее заметна при анализе средних значений на 1-м уровне фактора, а остаточная дисперсия (дисперсия случайности) для средних значений в п раз меньше, чем для отдельных измерений, найдем более точную оценку выборочной дисперсии:

Умножив обе части этого выражения на л, получим в правой части выборочную дисперсию Б1, имеющую (/г— 1)-ю степень свободы. Влияние фактора х будет значимым, если при заданном у выполняется не равенство .§/50[у]> F 1_у. В противном случае влиянием фактора х на результаты моделирования можно пренебречь и считать нулевую гипотезу Н0 о равенстве средних значений на различных уровнях справедливой.

Таким образом, дисперсионный анализ позволяет вместо проверки нулевой гипотезы о равенстве средних значений выборок проводить при обработке результатов моделирования проверку нулевой гипотезы о тождественности выборочной и генеральной дисперсий.

Возможны и другие подходы к анализу и интерпретации результатов моделирования, но при этом необходимо помнить, что их эффективность существенно зависит от вида и свойств конкретной моделируемой системы 5

 
< Пред   СОДЕРЖАНИЕ     След >