Курсовая работа: Критерій відношення правдоподібності для великих вибірок
Нехай випадкова величина і
деяке дійсне значення. Тоді ймовірність того, що випадкова величина
приймає значення менше за
називається функцією розподілу ймовірностей випадкової величини
і позначається
Якщо функція розподілу залежить від деякого параметра
, то писатимемо
Клас функцій розподілу
називатимемо класом допустимих розподілів спостережуваної випадкової величини
і позначатимемо
. Множина
така, що
і називається параметричною множиною. Той факт, що випадкова величина
має функцію розподілу з класу
будемо позначати
і називати розподілом випадкової величини. Статистичною моделлю експерименту називається впорядкована пара
де
вибірковий простір випадкової величини
клас розподілів цієї випадкової величини. Статистикою називають будь-яку випадкову величину, що залежить лише від вибірки
. Статистика
називається оцінкою невідомого параметра
розподілу
, якщо для кожної реалізації вибірки
значення
приймається за наближене значення параметра
. Статистика
називається незміщеною оцінкою параметра
, якщо
(тут
- це математичне сподівання, тобто
, якщо випадкова величина
має неперервну функцію розподілу( у цьому випадку
у точках існування похідної, і називається функцією щільності
), і
у дискретному випадку( тобто
набуває не більш, ніж зліченної кількості значень
відповідно з ймовірностями
,
не більш, ніж зліченна множина і
)). Позначимо через
клас незміщених оцінок для параметра
. Тоді, оптимальною оцінкою параметра
називається така статистика
, що
де і називається дисперсією випадкової величини
.
Нехай щільність розподілу випадкової величини
( або ймовірність – у дискретному випадку),
вибірка з розподілу
( тобто всі
мають розподіл
і є незалежними випадковими величинами),
реалізація вибірки. Функція
є щільністю розподілу випадкового вектора
. Якщо
розглядається при фіксованому значенні
, то така функція параметра
називається функцією правдоподібності. Оцінкою максимальної правдоподібності невідомого параметра
називається таке значення
, при якому
для заданого
.
Статистичною гіпотезою( або просто гіпотезою) називають будь-яке твердження щодо виду чи властивостей розподілу спостережуваної випадкової величини. Статистичні гіпотези надалі позначатимемо так: . Статистичною параметричною гіпотезою називається припущення про значення невідомого параметра
розподілу
Наведемо приклади параметричних гіпотез:
1)
2)
3) де
взагалі кажучи, деяка векторна функція
,
стала.
Взагальному випадку параметрична гіпотеза задається деякою підмножиною , до якої, за припущенням, належить невідомий параметр
. Тоді параметрична гіпотеза записується так:
. Альтернативна гіпотеза має вигляд:
; точки
називаються альтернативами. Якщо множина
містить лише одну точку, то гіпотезу
( альтернативу
) називають простою; у протилежному випадку гіпотезу( альтернативу) називають складною.
Правило, згідно якого висунута гіпотеза приймається або відкидається, називається статистичним критерієм( або просто критерієм) перевірки гіпотези
.
Нехай вибірка з розподілу
і висунута параметрична гіпотеза
(
може бути як скаляром, так і вектором і надалі будемо вважати його вектором, якщо не обумовлено протилежне). Потрібно визначити чи узгоджується запропонована гіпотеза із результатами проведеного експерименту. У такому випадку поступають наступним чином: будують таке правило( критерій), яке дозволяє на основі отриманих реалізацій вибірки
зробити висновок: прийняти гіпотезу
чи відхилити її( прийняти альтернативу
). Отже, критерій розбиває вибірковий простір
на дві множини
такі, що
, де
складається із тих точок, для яких гіпотеза
приймається, а множина
із точок, для яких
відхиляється. Множина
називається областю прийняття гіпотези, а множина
називається областю відхилення гіпотези, або критичною областю.
У процесі перевірки гіпотези можна прийти до правильного висновку або допустити помилку першого роду – відхилити
, коли гіпотеза вірна, чи помилку другого роду – прийняти
, коли вона хибна.
Ймовірності цих двох помилок можна виразити через функцію потужності критерію
:
. А саме: ймовірність похибки першого роду рівна
, а ймовірність похибки другого роду рівна
.
Число називають рівнем значущості критерію, якщо
.
Нехай , тоді
квантилем
розподілу
називається корінь рівняння
. Якщо функція
строго монотонна, то це рівняння має єдиний корінь; у протилежному випадку це рівняння має декілька коренів, і тоді
квантилем називають мінімальний серед коренів рівняння.
2. Критерій відношення правдоподібності для великих вибірок
Одним із найбільш універсальних методів побудови критеріїв перевірки складних гіпотез є метод відношення правдоподібності, суть якого полягає у наступному. Для перевірки гіпотези проти альтернативи
вводиться статистика відношення правдоподібності
де ,
функція правдоподібності. Разом із статистикою
вводиться статистика
Будемо вважати, що виконуються умови регулярності, що забезпечують існування, єдність і асимптотичну нормальність оцінки максимальної правдоподібності параметра
. Розглянемо випадок простої гіпотези.
Теорема. Нехай потрібно перевірити просту гіпотезу фіксована внутрішня точка множини
. Тоді для великих вибірок(
) при виконанні вказаних умов регулярності критерію відношення правдоподібності задається асимптотично критичною множиною
(1)
тобто при
де рівень значущості критерію.
Доведення. Покажемо, що з умов теореми слідує:
(2)
звідки випливає рівність (1). Якщо справедлива гіпотеза , то в силу спроможності оцінки максимальної правдоподібності при великих
точка
близька до
, тому для
можна записати розклад Тейлора відносно точки
: