Контрольная работа: Методи оцінювання параметрів та перевірка статистичних гіпотез
=
– емпіричне (вибіркове) середнє,
= 2
– емпірична (вибіркова) дисперсія.
Теорема 2.1 Нехай x1 , x2 , ..., xn – вибірка з розподілу F і g(x) – борелівська функція на R1 зі значенням в R1 . Якщо
G = g(x) F (dx) ¹¥,
то вибіркове значення величини G
= g(x) (dx) =
є спроможною й незміщеною оцінкою параметраG.
2.2 Метод максимальної правдоподібності
Нехай x = (x1 , x2 , ..., xn ) – вибірка з розподілом F( × ; q) = F( × ; q1 , q2 , …, qs ), що залежить від параметра q = (q1 , q2 , …, qs ) ∈Q⊂Rs . Параметр q∈Q невідомий, і його необхідно оцінити за вибіркою (x1 , x2 , ..., xn ).
Загальним (важливим як у теоретичному відношенні, так і в застосуваннях) методом одержання оцінок є метод максимальної правдоподібності, запропонований Фішером.
Означення. Функцією максимальної правдоподібності вибірки x = ( x 1 , x 2 , ..., x n ) будемо називати функцію L ( q ) = L ( q 1 , q 2 , …, q s ) параметра q ∈ Q , яка визначається рівністю L ( q ) = f ( x ; q ) = f ( x 1, x 2 , ..., x n ; q ) = f ( x 1 ; q ) f ( x 2 ; q ) …. f ( x n ; q ) , q ∈ Q , коли вибірковий вектор x = ( x 1 , x 2 , ..., x n ) абсолютно неперервний зі щільністю f ( x ; q ) = f ( x 1 , x 2 , …, xn ; q ), і рівністю L ( q ) = P ( x ; q ) = Р( x 1, x 2 , ..., x n ; q ) = Р ( x 1 ; q ) Р ( x 2 ; q ) …. Р ( x n ; q ) , q ∈ Q , коли вибірковий вектор x = ( x 1 , x 2 , ..., x n ) дискретний з розподілом P ( x ; q ) = = P ( x 1 , x 2 , …, xn ; q ).
Метод максимальної правдоподібності одержання оцінок полягає в тому, що за оцінку параметра q = (q1 , q2 , …, qs ) приймається точка = (, , ..., ), в якій функція максимальної правдоподібності L (q) досягає найбільшого значення, інакше кажучи, за оцінку параметра q визнається розв’язок рівняння
L () = L (q),
якщо такий розв’язок існує.
Означення. Оцінкою максимальної правдоподібності будемо називати точку , в якій функція максимальної правдоподібності досягає найбільшого значення.
Інакше кажучи, оцінкою максимальної правдоподібності параметра q будемо називати розв’язок рівняння L () = L ( q ).
Зазначимо, щоL (q) та lnL (q) досягають найбільшого значення в одних і тих же точках. Тому відшукувати точку, в якійL (q) досягає найбільшого значення, часто зручніше, роблячи це для lnL (q).
Логарифм від функції максимальної правдоподібності L(q) називають логарифмічною функцією максимальної правдоподібності.
Якщо L(q) = L (q1 , q2 , …, qs ) диференційовна по q1 , q2 , …, qs , то для того, щоб розв’язати рівняння
L (, , ..., ) = (2, …, (s ( (L (q1 , q2 , …, qs ), (2.2.1)
достатньо знайти стаціонарні точки функції lnL(q1 , q2 , …, qs ), розв’язуючи рівняння
lnL (q1 , q2 , …, qs ) = 0, i = 1, 2, …, s,
і, порівнюючи значення lnL(q1 , q2 , …, qs ) у стаціонарних і граничних точках множини Q, вибрати точку = (, , ..., ), в якій функція lnL(q1 , q2 , …, qs ) досягає найбільшого значення. Ця точка і буде розв’язкомрівняння(2.2.1).
Рівняння
ln L (q1 , q2 , …, qs ) = 0, i = 1, 2, …, s,
називають рівняннями максимальної правдоподібності.
Зауваження. Розв’язуючи рівняння максимальної правдоподібності
L () = L (q), необхідно відкинути всі корені, що мають вигляд = const. Оцінки, що не залежать від вибірки x1 , x2 , ..., xn , нас не цікавлять (оцінка – це функція вибірки).
3. Задача перевірки статистичних гіпотез
Постановка задачі перевірки статистичних гіпотез. Часто виникає необхідність у розв’язанні такої задачі: маємо стохастичний експеримент, що полягає в спостереженні випадкової величини x = (x1 , x2 , ..., xn ) зі значеннями в Rn або частини Rn , тобто в одержанні вибірки обсягом n. (Такі стохастичні експерименти описуються моделями типу { Rn , ℬn , Pθ }, Pθ ∈Ƥ, Ƥ = { Pθ ; q∈Q⊂Rs }, де Ƥ – деяка параметрична сукупність розподілів.) Щодо розподілу випадкової величини x = (x1 , x2 , ..., xn ) (відносно розподілу вибірки x) відомо тільки те, що він належить до класу Ƥ. З класу Ƥ вибираємо (з тих чи інших міркувань) один із розподілів, наприклад G, і як модель випадкової величини x = (x1 , x2 , ..., xn ) пропонуємо розглядати { Rn , ℬn , G}.
Наша мета полягає в тому, щоб за результатом x = (x1 , x2 , ..., xn ) експерименту (відомий він чи одержимо його потім) дійти висновку: експеримент може описуватися моделлю { Rn , ℬn , G} (G може бути розподілом випадкової величини x) або експеримент не може описуватися моделлю { Rn , ℬn , G} (G не може бути розподілом випадкової величини x). Зробити за результатом експерименту більш “сильний” висновок:G є розподілом випадкової величини x – не можна. Оскільки один і той же результат може з’явитися при багатьох різних розподілах, а не тільки при істинному.
У теорії перевірки статистичних гіпотез прийняті такі означення.