Меню
Главная
Авторизация/Регистрация
 
Главная arrow Менеджмент arrow Управление рисками, системный анализ и моделирование

Основные задачи и методы математической статистики

Задачи рассматриваемого здесь класса вызваны тем, что на практике обычно приходится иметь дело с ограниченным объемом эмпирических данных, а их получение и обработка всегда сопряжены с определенным элементом случайности. В связи с этим возникает потребность в выявлении самых существенных закономерностей исследуемого явления, что необходимо для корректной оценки его случайных количественных характеристик.

С определенной условностью все задачи, решаемые методами математической статистики, могут быть разделены на следующие три группы.

1. Нахождение параметров (числовых характеристик) предполагаемого закона распределения конкретной случайной величины. Данная задача решается при допущении о соответствии действительного распределения случайной величины одному из известных статистических (см. параграф 2.5) и сводится к определению оценок

, т.е. наиболее подходящих значений, его реальных параметров Примером такой задачи можно считать оценивание математического ожидания и дисперсии, допустим – времени до достижения технической системой предельного состояния, считая (в силу влияния большого числа факторов), что оно подчинено нормальному закону распределения.

  • 2. Определение закона распределения случайной величины по совокупности ее измерений, т.е. эмпирических данных . Эта задача чаще всего решается как бы выравниванием или сглаживанием построенной с их помощью кривой, имеющей вид ломаной линии (см., например, ту, которая показана на рис. 2.3, б). Наиболее широко распространена ее аппроксимация одним из известных статистических распределений или сравнительно простой аналитической зависимостью, называемой регрессией и представляющей собой компактное аналитическое выражение, допустим – алгебраический многочлен, удобный для описания и анализа соответствующего явления.
  • 3. Проверка различных статистических гипотез (ранее выдвинутых предположений) относительно характера распределения случайной величины или соотношения между ее параметрами и какими-то другими числовыми характеристиками. Данная задача связана с двумя предыдущими – как по причинам появления (ограниченность имеющихся статистических данных и ошибки в их значениях), так и по прикладной ценности (систематизирует имеющуюся информацию и повышает достоверность полученного на ее основе результата). Чаще всего это достигается путем аппроксимации какого-либо эмпирического графика одним из известных теоретических распределений (нормальным, равномерным, экспоненциальным и т.д.), либо приравниванием их однотипных числовых характеристик, полученных на основе фиксированных выборочных данных на разных объектах или в ходе их пополнения на одном и том же.

Что касается задач первого типа, т.е. оценивания случайных параметров, то результаты их решения могут быть представлены в виде отдельно взятой величины (точки на соответствующей числовой оси), либо какого-либо ее отрезка – интервала . В первом случае говорят о точечном, а во втором – об интервальном оценивании.

Основными способами получения точечных оценок являются: а) метод моментов, основанный на приравнивании выборочного момента (допустим – среднего арифметического) моменту совокупности эмпирических данных; б) метод максимального правдоподобия (ММП), получивший, пожалуй, наиболее широкое применение. Последнее обусловлено тем, что ММП позволяет получать состоятельные, т.е. малосмещенные эффективные оценки mx и Dxc распределениями, асимптотически стремящимися к нормальному закону при увеличении объема выборки. При этом применяются так называемые функции правдоподобия, имеющие вид следующей условной плотности вероятности:

(2.32)

где – выборка из независимых испытаний; – плотность вероятности получения каждого значения-результата х, зависящая от параметров распределения.

Сущность же рассматриваемого здесь ММП сводится к определению такого значения оценки 0v искомого параметра, которое обращает функцию в максимум. Иначе говоря, подбирается значение Θx, при котором будет максимальной вероятность получения именно тех значений выборки , которые уже реально получены. Если эта функция имеет единственный максимум в области допустимых значений, то для его определения необходимо решить одно из двух следующих уравнений правдоподобия:

Для получения интервальных оценок используется уже другая процедура, включающая такие этапы:

  • а) подбор случайной величины , зависящей от оцениваемого параметра и характеризуемой одним из известных законов распределения f(Y);
  • б) расчет по эмпирическим данным (х1, х2, ..., хn) числовых характеристик этого распределения;
  • в) определение двух чисел Сх и С2, удовлетворяющих с выбранной (доверительной) вероятностью у условию ;
  • г) составление уравнений: – для двустороннего, либо – для одностороннего доверительного интервала;
  • д) решение этих уравнений для определения нижней и верхней доверительных границ, накрывающих с заданным уровнем доверия γ истинное значение неизвестного искомого параметра рассматриваемой генеральной совокупности.

При этом имеют место два возможных случая: 1) объем выборки велик, что позволяет оцененные по ней значения т или D считать известными (равными истинным), а в качестве распределения f(Y) использовать нормальный закон; 2) если же исследователю доступно лишь ограниченное число результатов наблюдений (n < 30), то случайная величинах может считаться нормально распределенной лишь приблизительно, поэтому вместо нее рекомендуется использовать так называемое распределение Стьюдента, статистика которого выражается следующей зависимостью:

где – оценки математического ожидания и стандартного отклонения, рассчитанные по выборке данных объемом п; тх – действительное значение математического ожидания.

Что касается графической интерпретации плотности вероятности данного распределения, то по своей форме она полностью совпадает с подобной кривой нормально распределенной случайной величины лишь при п = ∞. В то же время график плотности распределения Стьюдента становится все более растянутым и прижатым к оси х по мере уменьшения объема n выборки имеющихся статистических данных.

Насколько конструктивны рассмотренные здесь методы статистического оценивания подобных числовых характеристик, можно будет убедиться несколько ниже, например в гл. 15 – на примере принятия рациональных решений методами математической статистики. Там же демонстрируется работоспособность задач второго типа – применительно к поиску математического выражения для уравнения регрессии, сглаживающего эмпирическое распределение одним из известных теоретических.

В заключение параграфа и главы в целом кратко поясним идею, положенную в основу решения задач третьего типа, т.е. методом выдвижения и проверки статистических гипотез. При этом ныне наиболее известны следующие два подобных способа:

  • 1) так называемый классический;
  • 2) метод последовательного анализа, предложенный А. Вальдом.
  • 1. Классический метод проверки статистических гипотез использует выборки фиксированного объема и предполагает лишь два возможных решения: отвергнуть выдвинутую гипотезу или принять ее. Если гипотеза состоит в отрицании разницы Δ между сравниваемыми числовыми характеристиками, объясняя наблюдаемое отклонение Δ≠0 случайными факторами, то она называется нулевой и обозначается H0: Δ = 0. Все другие гипотезы, отличающиеся от нулевой, являются альтернативными и помечаются НA: Δ≠0. Этому методу сопутствуют ошибки первого а и второго (3 рода, состоящие в том, что гипотеза Н0 была отвергнута (принята), когда в действительности она верна (неверна).

Плотности распределения параметра Δ

Рис. 2.9. Плотности распределения параметра Δ

Графическая интерпретация плотностей распределения случайной разницы Δ, отличающихся числовыми характеристиками конкурирующих гипотез Н0 и НА, дана на рис. 2.9, где левая "палатка" соответствует нулевой гипотезе, а правая – альтернативной. Отмеченная на горизонтальной оси точка Дкр является критическим значением параметра Д, а соседние с нею области 3 и 4 указывают на возможные ошибки первого и второго рода, сопутствующие принятию неверных решений (соответственно о том, что Δ≠О, когда в действительности это не так, и наоборот). Величины вероятности этих ошибок равны размерам затемненных площадей, расположенных под кривыми I и 2 по обе стороны от Дкр.

Что касается процедуры проверки гипотез этим методом, то она включает следующие основные этапы:

  • 1) выдвижение проверяемой Н0 (нулевой) и альтернативных гипотез ;
  • 2) подбор и расчет выборочной статистики , используемой для проверки Н0;
  • 3) назначение величины приемлемых ошибок первого а и второго Р рода (в некоторых случаях вместо Р может назначаться объем выборки n);
  • 4) определение критического значения выбранной статистики f(Δ);
  • 5) принятие решения путем сравнения ее реального и критического значений.
  • 2. Метод последовательного анализа устанавливает уже объем требуемой выборки непосредственно в ходе проверки выдвинутой гипотезы, используя на каждом шаге три альтернативных решения: отвергнуть Н0, принять ее или отложить решение до получения дополнительных эмпирических данных. При этом считается, что выборочная функция распределения известна, гипотезы Н0 и Н] четко определены, а ошибки а и Р заранее выбраны. Порядок принятия решения данным методом можно представить в следующей форме:
  • 1) оценка на каждом шаге значений вероятностей: Р1п – получения выборки при условии, что верна гипотеза H1 и Р0п – получения ее же, но при условии справедливости гипотезы Н0;
  • 2) расчет величины L, называемой отношением правдоподобия, по формуле
  • 3) принятие решения о справедливости выдвинутой статистической гипотезы осуществляется с использованием следующих критериев:
    • • если , то нулевая гипотеза Н0 принимается;
    • • если , то нулевая гипотеза отвергается;
    • • если , то необходимо продолжить испытания.

Наиболее часто данная процедура используется при заводских либо эксплуатационных испытаниях технических устройств на безотказность, когда процесс их производства или эксплуатации еще не завершен. Условия принятия решения подобным способом графически иллюстрируются на рис. 2.10.

Ломаной линией на рисунке показана конкретная реализация процесса испытаний, наклонными сплошными прямыми – условия браковки и приемки (например, остановки или продолжения производства продукции), а вертикальной пунктирной линией – предельное число Nyc испытаний. Условия браковки и приемки обычно рассчитываются по заранее известному выборочному распределению и при одинаковых значениях ошибок первого и второго рода.

Последовательный анализ испытаний на безотказность

Рис. 2.10. Последовательный анализ испытаний на безотказность

Как показывает опыт, внедрение в практику процедуры последовательного анализа и других методик, основанных на принципах математической статистики, позволяет экономить средства и время на принятие рациональных решений. Конструктивность изложенного в данной главе инструментария применительно к оценке безопасности различных технических систем будет продемонстрирована ниже, например, при аппроксимации эмпирических данных какой-либо регрессией, статистической оценке вероятности техногенных происшествий, проверке гипотез о равенстве двух математических ожиданий их количеств, которые были получены по различным выборочным данным.

 
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 

Популярные страницы