Оценка параметров генеральной совокупности по собственно-случайной выборке

Оценка генеральной доли. Пусть генеральная совокупность содержит N элементов, из которых М обладает некоторым признаком А. Следует

М

наити «на и лучшую» оценку генеральной доли р =—.

N

Рассмотрим в качестве такой возможной оценки параметра р его статистический аналог — выборочную долю w = —. а) Выборка повторная п

Выборочную долю можно представить как среднюю арифметическую п

ixk

альтернативных случайных величин[1] Xv Х2, ..., Хк,..., Х„, т.е. w-——, где

п

каждая случайная величина Хк (k - 1, 2, п) выражает число появлений признака в А’-м элементе выборки (т.е. при наличии признака Хк= 1, при его отсутствии Хк = 0) и имеет один и тот же закон распределения:

Действительно, вероятность того, что 1-й отобранный в выборку элемент обладает признаком А, согласно классическому определению вероят- М

ности равна р{Хх = 1) =—, так как из общего числа N элементов генер&чь-

ной совокупности М элементов обладают признаком А. Аналогично вероятность того, что 1-й элемент не обладает признаком А, равна

p(Xt = 0) Так как выборка повторная и каждый отобранный и обследованный элемент вновь возвращается в исходную совокупность, восстанавливая всякий раз ее первоначальные состав и объем, то вероятности p(Xk= 0) и p(Xk= 1) остаются теми же для любого элемента выборки, и закон распределения Xk(k = 1, 2,..., п) один и тот же — (9.10).

Случайные величины Xlf Х2, ..., Xk, ..., Хп независимы, так как независимы любые события Xk= 0, Xk= 1 (k = 1, 2, ..., п) и их комбинации. Например, независимы события Х{ = 1 и Х2 = 1, так как Рх{= (Х2 = 1) = М

= р(Х2 = 1) =—, т.е. вероятность того, что 2-й отобранный в выборку элемент обладает признаком А, не меняется в зависимости от того, обладал признаком Л 1-й элемент или нет, и т.д.

Теорема. Выборочная доля w-— повторной выборки есть несмещенная

п М

и состоятельная оценка генеральной доли р- —, причем ее дисперсия

N

где q = 1 - р.

? Докажем вначале несмещенность оценки w. Математическое ожидание и дисперсия частости события в п независимых испытаниях, в каждом из которых оно может наступить с одной и той же вероятностью р, равны соответственно

где q- - р (см. параграф 4.1).

Так как вероятность того, что любой отобранный в выборку элемент обладает признаком А, есть генеральная доля р, то из первого равенства вытекает, что частость, или выборочная доля, w есть несмещенная оценка генеральной доли р.

т

Осталось доказать состоятельность оценки w = —, которая

п

следует непосредственно из теоремы Бернулли (параграф 6.4):

ИЛИ

б) Выборка бесповторная

В случае бесповторной выборки случайные величины Xt, Х2п будут зависимыми. Рассмотрим, например, события Х{ = 1 и Х2 = 1. Теперь вероятность рх[=1 (^2 = l) ^ > так как отобранный элемент (в случае бесповторной выборки) в исходную совокупность не возвращается, то в ней остается всего N - 1 элементов, из которых обладающих признаком А М - 1. Эта

вероятность Рх1=i(^2 = 0 не Равна р(Х2 = l) = —> т.е. события Х{ = 1

и Х2= 1 — зависимые. Аналогично будут зависимы любые события Xfi= 1, Xk = 0 (k = 1, 2, ..., п), а значит, зависимы случайные величины Хх, Х2,

Однако и для бесповторной выборки выборочная доля является «хорошей» оценкой. Об этом свидетельствует следующая теорема.

777

Теорема. Выборочная доля w = — бесповторной выборки есть несмещен-

п М

ная и состоятельная оценка генеральной доли р = —, причем ее дисперсия

N

где q = 1 - p.

? Очевидно, что и для бесповторной выборки M[w) = р, т.е. w — несмещенная оценка для генеральной доли р = M/N. Это связано с тем, что математическое ожидание суммы любых случайных величин равно сумме их математических ожиданий (в том числе суммы зависимых случайных величин, каковой является выборочная доля w бесповторной выборки).

Найдем дисперсию выборочной доли для бесповторной выборки:

где р = М/N, q = 1 -MjN, т.е. верна формула (9.12) (при выводе формулы для а'2 использовали то, что случайная величина X = т в случае бесповторной выборки имеет гипергеометрическое распределение (см. параграф 4.4), и ее дисперсия определяется по формуле (4.16)). ?

Для того чтобы легче было понять формулу (9.12), рассмотрим ее частные случаи и убедимся в справедливости этой формулы. 1 2 [2] [3]

> Пример 9.5. Найти несмещенную и состоятельную оценку доли рабочих цеха с выработкой нс менее 124% по выборке, представленной в табл.

8.1.

Решение. Несмещенной и состоятельной оценкой генеральной доли Р(Х > 124) является выборочная доля

Оценка генеральной средней. Пусть из генеральной совокупности объема N отобрана случайная выборка Х{, Х2к,ХпУ где Хк случайная величина, выражающая значение признака у k-то элемента выборки {к = 1, 2,п). Следует найти «наилучшую» оценку для генеральной средней.

Рассмотрим в качестве такой возможной оценки выборочную среднюю[4] х (вспомним, что в примере 9.4 именно х явилась оценкой метода

п

YXk

наименьших квадратов для х0 ), т.е. х = ——.

п

а) Выборка повторная

Закон распределения для каждой случайной величины Xk(k = 1, 2,п) имеет вид

Действительно, вероятность того, что 1-й отобранный в выборку элемент имеет значение признака х согласно классическому определению

вероятности равна р(Хх1) = -^-, так как из общего числа N элементов

генеральной совокупности Nx элементов имеют значение признака хх. Так как выборка повторная и каждый отобранный и обследованный элемент возвращается в исходную совокупность, восстанавливая всякий раз ее первоначальные состав и объем, то вероятность p(Xk = xt) =— для любого

N

элемента выборки, т.е. для k = 1, 2, ..., п. Аналогично можно определить дг.

p(Xk = Xj) =~j^~ Для k = 1, 2,..., п г = 1, 2, ..., т и убедиться в том, что закон

распределения каждой случайной величины Хк один и тот же — (9.13).

Случайные величины Х{, Х2к,..., Хп независимы, так как независимы любые события Xk=Xj(k= 1,2,..., n;i= 1,2,..., т) и их комбинации. Например,

независимы события Х2 = хх и Х{х, ибо Рхх=Х{ (%2 =ri) = р{% 2 ) = у

т.е. вероятность того, что значение признака у 2-го отобранного в выборку

элемента равно хх, не меняется в зависимости от того, какое значение признака у 1-го элемента, и т.д.

Найдем числовые характеристики случайной величины Хр.

т.е. математическое ожидание и дисперсия каждой случайной величины Xkэто соответственно генеральная средняя и генеральная дисперсия.

Теорема. Выборочная средняя х повторной выборки есть несмещенная и состоятельная оценка генеральной средней xQ, причем

? Докажем вначале несмещенность оценки. Найдем математическое ожидание выборочной средней х, учитывая формулу (9.14):

т.е. х несмещенная оценка для х().

Найдем дисперсию выборочной средней х , учитывая формулу (9.15) и го, что Ху, Х2,..., Хк,..., Хп независимые случайные величины:

Осталось доказать состоятельность оценки х, которая следует непосредственно из теоремы Чебышева (6.14):

или

б) Выборка бесповторная

В этом случае случайные величины Х{, Х2,..., Хп будут зависимыми. Рассмотрим, например, события Х1 = х, и Х2 = х1.

Теперь вероятность Рх{х {^2= x) = ~jj—г> так как отобранный элемент (в случае бесповторной выборки) в исходную совокупность не возвращается, то в ней остается всего N - 1 элементов, из которых со значением признака — Ni - 1. Эта вероятность Рх,=х, (-^2=*i) не равна

р(Х2 = xi) = — , т.е. события Х{ - хх и Х2- х{ — зависимые. Аналогично

будут зависимыми любые события Xk=xt (/е = 1, 2,..., n,i = 1,2,..., яг), а значит, зависимы случайные величины Хх, Х2,..., Хк,..., Хп.

Однако и для бесповторной выборки выборочная средняя является «хорошей» оценкой. Об этом свидетельствует теорема.

Теорема. Выборочная средняя х бесповторной выборки есть несмещенная и состоятельная оценка генеральной средней х(), причем

Теорему принимаем без доказательства. Частные случаи формулы

(9.17) аналогичны формуле (9.12) (см. с. 279), т.е. при n ст72=а|, при п - N а'72 = 0.

t> Пример 9.6. Найти несмещенную и состоятельную оценку средней выработки рабочих цеха по данным выборки, представленной в табл. 8.1.

Решение. Несмещенная и состоятельная оценка генеральной средней х{) есть выборочная средняя х, найденная в примере 8.3, т.е. х =119,2 (%). ?

Оценка генеральной дисперсии. Па первый взгляд наиболее подходящей оценкой для генеральной дисперсии о2 является выборочная дисперсия л2. Следующая теорема свидетельствует о том, что s2 не является «наилучшей» оценкой.

Теорема. Выборочная дисперсия s2 повторной и бесповторной выборок есть смещенная и состоятельная оценка генеральной дисперсии а2.

? Принимая без доказательства состоятельность оценки л2, докажем,

что она — смещенная оценка. В соответствии с формулой (8.10) s2 22.

На основании свойства 3 средней арифметической (параграф 8.2) и дисперсии (параграф 8.3), если все значения признака уменьшить на одно и то

же число с, то средняя уменьшится на это число, т.е. х-с = х-с, а дисперсия не изменится:

Полагая с = х0, получим

а) Выборка повторная

Для повторной выборки выборочные значения рассматриваем как независимые случайные величины Х{, Х2.....Xk,..., Хп, каждая из которых имеет один и гот же закон распределения (9.13) с числовыми характеристиками (9.14) и (9.13). т.е. М(Хк)0, D(Xk) = a2,k = 1, 2,.... п.

Найдем математическое ожидание оценки s2:

Первый член в правой части

Поэтому

Второй член с учетом того, что х есть несмещенная оценка х0, т.е. М(х) = х0, и формулы (9.16),

б) Выборка бесповторная

Как уже рассмотрено выше, для бесиовторной выборки X,, Хъ..., Хп — зависимые случайные величины. Можно показать, что

(так как объем генеральной совокупности N, как правило, большой и N~N-1).

Итак, и для повторной выборки, и для бесповторной

YI — 1

Так как-<1 и М(л2) < а2, то выборочная дисперсия (в среднем, полу-

п

ченная по разным выборкам) занижает генеральную дисперсию. Поэтому, заменяя а2 на s2, мы допускаем систематическую погрешность в меньшую сторону. Чтобы ее ликвидировать, достаточно ввести поправку, умножив s2

ft

на-. Тогда с учетом (9.4) получим «исправленную» выборочную дисперсию

Так как смещение оценки b(s2) = M(s2)-c2 =-—-:

и

при п -> ос стремится

к нулю, т.е. Iim/>(.v2) = 0 , то .?>- есть асимптотически несмещенная оценка о-

п-1

Очевидно, что

т.с. s2 является несмещенной и состоятельной оценкой генеральной дисперсии ст2.

О Пример 9.7. Найти несмещенную и состоятельную оценку дисперсии случайной величины X — выработки рабочих цеха по данным выборки, представленной в табл. 8.1.

Решение. Несмещенной и состоятельной оценкой дисперсии случайной величины X (генеральной дисперсии) ст2 является «исправленная» выборочная дисперсия s2. В примере 8.6 вычислена выборочная дисперсия s2 = 87,48. На основании формулы (9.18) при п = 100

Разница между s2 и s2 заметна при небольшом числе наблюдений п.

При п> 30-40 s2 ~ s2, т.е. в качестве оценки для ст2 вполне можно использовать выборочную дисперсию s2.

  • [1] В учебнике случайные величины, как правило, обозначаются прописными буквами,а их значения — строчными. Выборочные среднюю и долю везде обозначаем для простотыстрочными буквами, соответственно х и w. При этом следует понимать, что до проведениянаблюдений, когда заранее неизвестно, какими они будут, х и w рассматриваем как случайные величины; после проведения наблюдений, когда получены их конкретные значения, — как неслучайные величины.
  • [2] При n
  • [3] При п = N o'J= 0, т.е. если предположить, что объем выборки равенобъему генеральной совокупности, то выборочная доля будет равна генеральной доле и ее дисперсия будет равна нулю.
  • [4] 2 См. замечание на с. 277.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >