Контрольная работа: Методи оцінювання параметрів та перевірка статистичних гіпотез
Зауваження . Питання про те, яким має бути рівень значущості, не є статистичною задачею. Здебільшого за рівень значущості приймають числа 0,10; 0,05; 0,01; 0,001 і т.д. Чим серйозніші наслідки помилки першого роду, тим меншим повинен бути рівень значущості.
4. Критерій c 2 , гіпотетичний розподіл залежить від невідомих параметрів
Нехай x = (x1 , x2 , ..., xn ) – вибірка з невідомого нам розподілу F. Щодо розподілу F висувається гіпотеза
H0 : F( × ) = G ( × ; q1 , q2 , …, qk ), ( q1 , q2 , …, qk ) = q∈Q.
РозподілG ( × ; q1 , q2 , …, qk ) визначенийзточністюдопараметрівq1 , q2 , …, qk . Параметриq1 , q2 , …, qk невідомі, причомущодозначенняцихпараметрівмиможемоматилишетуінформацію, якаміститьсяувибірціx = (x1 , x2 , ..., xn ). Інакшекажучи, гіпотезаH0 полягаєвтому, щоx = (x1 , x2 , ..., xn ) євибіркоюзрозподілу, що належитьдокласурозподілівG ( × ; q1 , q2 , …, qk ),( q1 , q2 , …, qk ) = q∈Q.
Наша мета – за реалізацію вибірки x = (x1 , x2 , ..., xn ) зробити висновок: відхиляти гіпотезу H0 чи не відхиляти?
Оскільки q1 , q2 , …, qk невідомі, природно за значення q1 , q2 , …, qk визнати їх оцінки, побудовані за вибіркою x1 , x2 , ..., xn , і, отже, як гіпотетичний розподіл розглядати G ( × ; q1 , q2 , …, qk ). Р. Фішер встановив, що коли гіпотеза H0 справедлива і оцінки q1 , q2 , …, qk одержані за методом максимальної правдоподібності, то розподіл відхилення
D (, G) =
між і G при n®¥ збігається до розподілу c2 з (r – 1 – k) ступенями вільності, де k – число параметрів, які оцінені з вибіркою x= (x1 , x2 , ..., xn ). Відхилення D (, G) будується наступним чино: ділимо X (простір вибіркових значень xi ) на скінченне число r (2 ≤ r < ∞) непересічних множин Xi ; pi (, , ..., k ) – імовірності попадання вибіркових значень до множин Xi , i =1, 2, ..., r, обчислені за гіпотетичним розподілом.
Таким чином, коли параметри оцінюються за вибіркою згідно з методом максимальної правдоподібності, ми можемо користуватися критерієм c2 у такому формулюванні:
Якщо гіпотезуH0 відхиляти при
D (, G) = >c2 a ; ( r - 1 - k )
і не відхиляти у противному разі, то з імовірністю a гіпотеза H0 буде відхилятися, коли вона справедлива.
5. Критерій c 2 як критерій незалежності
Нехай z = (x, h) – двовимірна випадкова величина (x набуває значень a1 , a2 , …, as ; h набуває значень b1 , b2 , …, bk ). Розподіл векторної випадкової величини z = (x, h) – спільний розподіл випадкових величин x та h (див.табл. 5.1) – нам невідомий. Невідомі й розподіли
компонент x та h відповідно.
Таблиця 5.1
xh | b1 | b2 | … | bk | Сума |
a1 | p1 1 | p1 2 | … | p1k | p1 × |
a2 | p21 | p22 | … | p2k | p2 × |
… | … | … | … | … | … |
as | ps1 | ps2 | … | psk | ps × |
Сума | p× 1 | p× 2 | … | p× k | 1 |
pi × = , i = 1, 2, …, s; p× j = , j = 1, 2, …, k.
= = = 1.
Щодо спільного розподілу випадкових величин x та h – компонент вектора z = (x, h) висувається гіпотеза
H0 : pi j = pi × p× j ; i = 1, 2, …, s;j = 1, 2, …, k,
тобто гіпотеза про незалежність випадкових величин x та h (ще говорять, гіпотеза про незалежність ознак).
Маємо результати n спостережень випадкової величини z = (x, h): “значення” (ai ,bi )випадкова величина z = (x, h) набула ni j разів, i =1, 2, ...,s;j= 1, 2, ..., k. Результати спостережень випадкової величини z = (x, h) зручно подати у вигляді так званої таблиці спряженості ознак (табл. 5.2).
Таблиця 5.2
xh | b1 | b2 | … | bk | Сума |
a1 | n1 1 | n1 2 | … | n1k | n1 × |
a2 | n21 | n22 | … | n2k | n2 × |
… | … | … | … | … | … |
as | ns1 | ns2 | … | nsk | ns × |
Сума | n× 1 | n× 2 | … | n× k | n |
ni × = , i = 1, 2, …, s; n× j = , j = 1, 2, …, k.
= = = n.
Наша мета – за результатами спостережень випадкової величини z = (x, h) (табл. 2.5.2) зробити висновок: відхиляти гіпотезу H0 про незалежність компонент x і h чи не відхиляти.
Для перевірки гіпотези H0 скористаємося критерієм c2 , коли гіпотетичний розподіл залежить від невідомих параметрів. Невідомими параметрами є pi × та p× j , i = 1, 2, …, s; j = 1, 2, …, k, причому
= 1; = 1.
В якості розбиття вибіркового простору
X = {(ai , bj ), i = 1, 2, …, s; j = 1, 2, …, k}
розглянемо підмножини
Xi j = {(ai , bj )}, i = 1, 2, …, s; j = 1, 2, …, k.
Відхилення емпіричного розподілу
, i = 1, 2, …, s; j = 1, 2, …, k,
від гіпотетичного
pi × p× j , i = 1, 2, …, s; j = 1, 2, …, k,
є