Учебное пособие: Выборочный метод
Пусть плотность распределения ξ* изображена на рис. 1.9.3.
Рис. 1.9.3. Доверительные границы |
Выберем интервал (ξ – ε1 , ξ +ε2 ), в котором с достаточно близкой
к 1 вероятностью будет заключена величина ξ*, т. е.
P(-ε1 <ξ - ξ* <ε2 ) = l – α (1.9.5*)
где α - величина, близкая к нулю.
Это означает, что в большинстве выборок (доля которых составляет
1— α) ошибка выборки попадет в интервал (-ε1 , ε2 ), и лишь в относительно малом числе выборок (доля которых равна α) ошибка δ выйдет за пределы интервала (-ε1 , ε2 ). Поскольку производится одна выборка, то с практической достоверностью (т.е. с вероятностью 1 − α)можно полагать, что ее ошибка попадет в данный интервал, и, наоборот, практически невозможно (т. е. с вероятностью α),что она выйдет за границы интервала.
Но если ε1 <ξ - ξ* <ε2 , то ξ* - ε1 < ξ< ξ*+ ε 2 , и равенство (1.9.5*) запишется в виде:
P(ξ* - ε1 <ξ <ξ* +ε2 ) = l − α (1.9.5)
В силу изложенного
• интервал (ξ* - ε1 , ξ*+ε2 ) называется доверительным интервалом,
• числа ξ*- ε1 , ξ*+ε2 - доверительными границами,
• вероятность Р=1—α - доверительной вероятностью и
• α- уровнем значимости (существенности)
Доверительный интервал дополняет точечную оценку ξ * оценкой ошибки выборки, или интервальной оценкой параметра α.
Если для точечной оценки необходимо знать лишь выражение для ξ * как функцию данных выборки, то для построения доверительного интервала необходимо знать также закон распределения ξ *, с помощью которого рассчитывается вероятность (1.9.5).
Часто при симметричном характере распределения случайной величины ξ * относительно ξ можно и доверительный интервал рассматривать как симметричный относительно ξ . В таком случае уравнение (1.9.5) может быть заменено на более простое:
P(ξ* - ε <ξ <ξ* +ε) = P (│ξ - ξ*│<ε) = l – α (1.9.6)
Величина ε называется предельной ошибкой выборки.
С интервальной оценкой связано решение трех типов задач:
1) определение доверительного интервала по заданной доверительной вероятности Р= 1 – α и объему выборки п ;
2) определение доверительной вероятности по заданному доверительному интервалу и объему выборки;
3) определение необходимого объема выборки п по заданным доверительной вероятности и доверительному интервалу.
3.3 Оценка доли признака
Для точечной оценки доли признака в генеральной совокупности (р) естественно взять выборочную долю
р *=
где n — объем выборки,
т — количество единиц в выборке, обладающих данным признаком.
Можно доказать, что эта оценка является состоятельной, несмещенной, эффективной.
Вопрос об интервальной оценке рассмотрим сначала для случая возвратной выборки.
При такой организации выборки случайная величина p *, как известно из теории вероятностей, имеет биномиальный закон распределения. Расчет доверительного интервала с применением формулы биномиального закона связан с определенными вычислительными трудностями. Однако при достаточно большом объеме выборки (примерно n ≥ 20, пр ≥ 10) биномиальное распределение хорошо аппроксимируется нормальным распределением с параметрами