Понятие оценки параметров

Сформулируем задачу оценки параметров в общем виде. Пусть распределение признака X — генеральной совокупности — задается функцией вероятностей (p(x/? 0) = Р(Х = х,) (для дискретной случайной величины X) или плотностью вероятности ср(х, б) (для непрерывной случайной величины X), которая содержит неизвестный параметр 9. Например, это параметр X в распределении Пуассона или параметры а и а2 для нормального закона распределения и т.д.

Для вычисления параметра 0 исследовать все элементы генеральной совокупности не представляется возможным. Поэтому о параметре 9 пытаются судить по выборке, состоящей из значений (вариантов) х х2, хп. Эти значения можно рассматривать как частные значения (реализации) п независимых случайных величин Xif Х2, Хп, каждая из которых имеет тот же закон распределения, что и сама случайная величина X.

Определение. Оценкой 0„ параметра 0 называют всякую

функцию результатов наблюдений над случайной величиной X (иначе -

статистику), с помощью которой судят о значении параметра 0:

Поскольку Х{, Х2,..., Хп случайные величины, то и оценка 0„ (в отличие от оцениваемого параметра 0 — величины неслучайной, детерминированной) является случайной величиной, зависящей от закона распределения случайной величины X и числа п.

Всегда существует множество функций от результатов наблюдений Х{, Х2,..., Хп (от п «экземпляров» («копий») случайной величины X), которые можно предложить в качестве оценки параметра 0. Например, если параметр 0 является математическим ожиданием случайной величины X, т.е. генеральной средней х0, то в качестве его оценки 0„ по выборке можно взять: среднюю арифметическую результатов наблюдений — выборочную среднюю х , моду Мо, медиану Меу полусумму наименьшего и наибольшего значений по выборке, т.е. тт + хтах)/2 и т.д. Какими свойствами должна обладать оценка 0,?, чтобы в каком-то смысле быть «доброкачественной» оценкой?

Назвать «наилучшей» оценкой такую, которая наиболее близка к истинному значению оцениваемого параметра, невозможно, так как выше отмечено, что 0/7 — случайная величина, поэтому невозможно предсказать индивидуальное значение оценки в данном частном случае. Так что о качестве оценки следует судить не по индивидуальным ее значениям, а лишь по распределению ее значений в большой сети испытаний, т.е. по выборочному распределению оценки. Если значения оценки 0Я концентрируются около истинного значения параметра 0, т.е. основная часть массы выборочного распределения оценки сосредоточена в малой окрестности оцениваемого параметра 0, то с большой вероятностью можно считать, что оценка 0„ отличается от параметра 0 лишь на малую величину. Поэтому, чтобы значение 0„ было близко к 0, надо, очевидно, потребовать, чтобы рассеяние случайной величины 0/7 относительно 0, выражаемое, например, математическим ожиданием квадрата отклонения оценки от оцениваемого пара- 2

метра М(Вп -0) , было по возможности меньшим. Таково основное у с л о в и е, которому должна удовлетворять «наилучшая» оценка. Рассмотрим наиболее важные свойства оценок.

Определение. Оценка 0/? параметра 0 называется несмещенной, если ее математическое ожидание равно оцениваемому параметру, т.е.

В противном случае оценка называется смещенной.

Если это равенство не выполняется, то оценка 0„, полученная по разным выборкам, будет в среднем либо завышать значение 0 (если М(0„)>0), либо занижать его (если М(0„) < 0). Таким образом, требование несмещенности гарантирует отсутствие систематических ошибок при оценивании.

Замечание. На первый взгляд приведенное выше определение любой оценки, как всякой функции результатов наблюдений, было бы более естественным и не таким расплывчатым, если бы в нем содержалось условие М(0„) = 0. К сожалению, этого сделать нельзя, так как практически важные оценки оказываются смещенными, хотя и слабо.

Если при конечном объеме выборки п М(Вп0, т.е. смещение оценки b(Qn) = М(0/7)- 0 Ф 0, но lim b(Qn) = 0 , то такая оценка 0;; называется асимп-

n-> ОО

тотически несмещенной.

Определение. Оценка 077 параметра 0 называется состоятельной, если она удовлетворяет закону больших чисел, т.е. сходится по вероятности к оцениваемому параметру:

или

В случае использования состоятельных оценок оправдывается увеличение объема выборки, так как при этом становятся маловероятными значительные ошибки при оценивании. Поэтому практический смысл имеют только состоятельные оценки. Если оценка состоятельна, то практически достоверно, что при достаточно большом п 0„ % 0.

Если оценка 0,7 параметра 0 является несмещенной, а ее дисперсия ст? -^0 при я —» оо, то оценка 0,, является и состоятельной. Это непосред-

0и

ственно вытекает из неравенства Чебышева:

Так, например, выборочная средняя х является несмещенной и состо- ятельной оценкой генеральной средней х0 (дисперсия —>0 при/?—» оо,

см. параграф 9.4), а отдельное выборочное наблюдение Xk(k = , 2, ..., /?) - несмещенной [M[Xk) = М(Х) = х0], но не состоятельной оценкой генеральной средней, так как ее дисперсия о2(Х,) = а2(х) = а2 постоянна и не уменьшается с ростом п.

Определение. Несмещенная оценка 0„ параметра 0 называется эффективной, если она имеет наименьшую дисперсию среди всех возможных несмещенных оценок параметра 0, вычисленных по выборкам одного и того же объема п.

~ 2

Так как для несмещенной оценки[1] М($п -0) есть ее дисперсия , то эффективность является решающим с в о й с т в о м, определяющим качество оценки.

Эффективность оценки 0„ определяют отношением

где а? и а? — соответственно дисперсии эффективной и данной оценок.

“я 0я

Чем ближе е к 1, тем эффективнее оценка. Если ? —» 1 при п —> со, то такая оценка называется асимптотически эффективной.

На практике в целях упрощения расчетов используются оценки, не обладающие высокой эффективностью. Так, например, генеральную среднюю х0 часто оценивают медианой Me выборки, в то время как эффективной оценкой х0 является выборочная средняя х (параграф 9.5). При нормальном распределении признака в генеральной совокупности можно показать, что асимптотическая эффективность этой оценки, т.е. е(Ме) = 2/я = 0,64 при п —»со. Это означает, что для получения той же точности и надежности оценки генеральной средней по выборочной средней нужно использовать лишь 64% объема выборки, взятого при оценке по медиане.

Если при тех же условиях для оценки генеральной средней х0 использовать статистику 0/z = (xmin +xmax)/2, то (см., например, [231) ее эффек- 24 In я

тивность e(Qn)~—-— с ростом п стремится к нулю, и относительно п2п

приемлемый результат оценивания (по сравнению с эффективной оценкой х) возможен при малом объеме выборки.

Другой пример. В практике статистического контроля качества продукции для оценки генерального среднего квадратического отклонения а широко используют оценку sR = R/dn , где R = xmax -xmin вариационный размах, dn коэффициент, зависящий от объема выборки п. При малых п эффективность оценки sR достаточно высока, но с увеличением п быстро падает. Поэтому удовлетворительная оценка а с помощью sR может быть достигнута лишь при п< 10.

В качестве статистических оценок параметров генеральной совокупности желательно использовать оценки, удовлетворяющие одновременно требованиям несмещенности, состоятельности и эффективности. Однако достичь этого удается не всегда. Может оказаться, что для простоты расчетов целесообразно использовать незначительно смещенные оценки или оценки, обладающие большей дисперсией по сравнению с эффективными оценками, и т.п. В то же время несостоятельные оценки обычно не используются.

  • [1] Для смещенной оценки, как нетрудно показать, М (0Я — 0)2 = +/r(0lf), где 6(0Л) - смещение оценки.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >