Базовые категории и теоремы математической статистики
Рассмотренные выше понятия и принципы теории вероятностей представляют собой формализованное выражение реальных закономерностей, присущих массовым случайным явлениям, тогда как разработкой методов регистрации, описания, анализа и интерпретации эмпирических количественных данных о подобных явлениях занимается уже другая специальная дисциплина – математическая статистика. В число основных категорий данной отрасли человеческой деятельности обычно включают следующие:
- а) генеральная совокупность – множество всех реально известных предметов;
- б) выборочная подсовокупность (выборка) – часть генеральной совокупности, на основе изучения которой предполагается получение оценочных суждений по всему множеству предметов;
- в) оценивание – операция по определению на основе выборочных данных числовых значений (оценок) параметров распределения, относящихся ко всей генеральной совокупности;
- г) статистика – функция аргументов, полученных по выборочным данным.
При оценивании числовых характеристик требуется, чтобы выборка была репрезентативной (представительной), т.е. обладала признаками, присущими всей генеральной совокупности, а оценка – удовлетворяла требованиям эффективности либо состоятельности. Последнее означает: а) отсутствие разницы между истинным значением искомого параметра 0 и математическим ожиданием его оценки ; б) минимальную величину дисперсии оценки
, что обеспечивает их сходимость по вероятности при росте объема выборки п:
(2.29)
где е – любое наперед заданное, сколь угодно малое положительное число.
В основе процедуры статистического оценивания лежит так называемый закон больших чисел, представляющий собой три теоремы.
1. Теорема Чебышева утверждает, что при неограниченном увеличении числа независимых, равноточных и свободных от систематических ошибок испытаний среднее арифметическое от результатов их измерения стремится по вероятности к математическому ожиданию тх измеряемой величины:
(2.30)
2. Теорема Бернулли является частным случаем предыдущей и констатирует, что частота m(А) наблюдений случайного события А стремится в аналогичных условиях к вероятности его возникновения:
(2.31)
3. Теорема Ляпунова (центральная предельная) представляет собой следующее утверждение: если случайная величина Y образуется суммированием нескольких других величин (Y = ΣXi), и дисперсия каждой из них примерно одинакова, то при любом законе распределения X. величина Y уже будет подчинена нормальному закону распределения.
Рис. 2.8. К обоснованию нормальности суммы случайных событий
Данная теорема теоретически закрепляет возможность применения нормального распределения в большинстве тех практически реальных ситуаций, когда на исследуемое случайное явление оказывает влияние сравнительно большое (n ≥ 30) число факторов, причем относительный вклад каждого из них невелик и соизмерим с остальными. Для подтверждения последней теоремы приведем рис. 2.8, иллюстрирующий, как меняется форма графика плотности распределения результирующей случайной величины Y по мере роста числа равномерно распределенных ее случайных составляющих Хi
В целом же закон больших чисел, как бы являясь аксиоматикой математической статистики, не только обосновывает возможность и необходимость столь широкого распространения нормального распределения в самых разнообразных практических приложениях, но также закладывает основу для интерпретации выборочного среднеарифметического математическим ожиданием, а частоты появления случайных событий – соответствующей вероятностью. Что же касается конкретных задач математической статистики и распространенных способов их решения, то они рассматриваются в заключительном параграфе данной главы.