Учебное пособие: Выборочный метод
Так, если для оценки генеральной средней ξ = выбрана статистика
θ = Х* — выборочная средняя, то ее значения могут быть подсчитаны по результатам выборки как
Если для оценки генеральной дисперсии D выбрана статистика
θ =D* — выборочная дисперсия, то ее значения могут быть рассчитаны по формуле
Статистика θ есть случайная величина. В ряде случаев можно найти ее распределение.
Статистическая оценка должна быть возможно более точной. С этой целью к статистике θ предъявляются требования:
1) состоятельности,
2) несмещенности,
3) эффективности.
1) Свойство состоятельности означает, что распределение статистики θ с ростом объема выборки п концентрируется в сколь угодно малое окрестности параметра ξ (статистика θ стремится по вероятности к оцениваемому параметру ξ). Свойство состоятельности выражается предельным равенством: для любого столь угодно малого положительного числа ε
(1.9.1)
Свойство состоятельности может быть выражено двумя более жесткими требованиями, которые являются достаточными условиями состоятельности и которые легче поддаются практической проверке:
и (1.9.2)
2) Свойство несмещенности означает, что при любом конечном объеме выборки п центр рассеяния статистики θ (математическое ожидание случайной величины θ) совпадает со значением оцениваемого параметра генеральной совокупности:
М(θ) = ξ — для любого п. (1.9.3)
Рис. 1.9.1. Иллюстрация свойств состоятельности |
Естественно, что при заданном конечном объеме выборки п из различных возможных статистик для оценки параметра ξследует выбрать ту статистику, которая, являясь несмещенной, обладает в то же время минимальным рассеянием, т.е. имеет минимальную дисперсию. Последнее свойство получило название эффективности.
Рис. 1.9.2. Сравнение свойств трех статистик |
На рис. 1.9.2 показаны кривые распределения трех статистик. Из них θ и θ' — несмещенные и потому для построения оценки предпочтение должно быть отдано статистике θ' с меньшей дисперсией. Статистика θ" обладает еще меньшей дисперсией, однако она менее пригодна в качестве оценки, так как ее центр рассеяния смещен относительно параметра ξ`.
Статистику θ, принимающую для данной выборки определенное числовое значение, будем называть точечной оценкой параметра ξ и обозначать той же буквой, что и оцениваемый параметр, помечая ее звездочкой.
Для построения точечных оценок чаще всего применяют метод аналогии, т. е. для оценки параметров генерального распределения выбираются аналогичные параметры (характеристики) выборочного распределения.
Так, для оценки доли признака в генеральной совокупности p=M / N, генеральной средней и генеральной дисперсии
выбираются статистики (соответственно):
выборочная доля р*= ,
выборочная средняя
и выборочная дисперсия
При этом в результате дальнейшей проверки устанавливается, что первые две обладают свойством несмещенности, а последняя будет обладать этим свойством, если ее умножить на корректирующий множитель
Условия (1.9.2) и (1.9.3) позволяют для конечного n записать лишь приближенное равенство:
ξ≈ ξ* (1.9.4)
Так как выборка носит случайный характер, то для различных возможных выборок случайная величина ξ*может принимать различные значения. Поэтому возникает задача дополнить точечную оценку информацией о возможной ее погрешности, т. е. оценить ошибку выборки