Реферат: Тести Чоу
Припустимо, що є дані тимчасового ряду по двох змінним і що в період вибірки відбулася структурна зміна, що розділяє спостереження на підвибірки А і В. На мал. Б регресії для підвибірок забезпечують цілком адекватну відповідність даним, обумовлюючи низькі значення UA і UB . Якби потрібно було оцінити об'єднану регресію, як на мал. А, то залишки в обох підвибірках в цілому були б значно більше.
Рівність між UP і (UA + UB ) матиме місце тільки при збігу коефіцієнтів регресії для об'єднаної регресії і регресій підвибірок. У загальному випадку при розділенні вибірки спостерігатиметься поліпшення якості рівняння, що можна представити як (UP – UA – UB ). Це має свою ціну: використовуються (k + 1) додаткових ступенів свободи, оскільки замість (k + 1) параметрів для однієї об'єднаної регресії ми тепер повинні оцінити в сумі (2k + 2) параметрів (k – число пояснюючих змінних, одиниця відповідає постійному члену). Проте, після розділення вибірки залишається непояснена сума квадратів залишків (UA + UB ) і, крім того (n – 2k – 2) ступенів свободи.
Тепер ми можемо визначити, чи є значущим поліпшення якості рівняння після розділення вибірки. Для цього використовується F-статистика:
Покращення якості рівняння / Використані ступені свободи |
= |
|
Непояснена дисперсія / Число решти ступенів свободи |
яка розподілена з (k + 1) і (n – 2k – 2) ступенями свободи.
Тепер, наприклад, давайте повернемося до випадку парної регресійної залежності ваги новонароджених від інтенсивності куріння їх матерів, і хай ми ще не вирішили, чи слід об'єднувати підвибірки, включаючих 584 матері, яка раніше не народжувала, і 380 матерів, які раніше народжували. Оцінювання об'єднаної регресії і регресій для підвибірок дає результати, показані в таблиці.
Вибірка |
Оцінене рівняння |
R2 |
Сума квадратів залишків |
Об’єднана вибірка |
y = 3418 – 7,2x (1) |
0,012 |
158,6 ∙ 106 |
Первістки |
y = 3363 – 4,0x (2) |
0,004 |
91,2 ∙ 106 |
Непервістки |
y = 3506 – 12,1x (3) |
0,039 |
63,5 ∙ 106 |
Відповідна F-статистика, отже, рівна:
Критичне значення F з 2 і 960 мірами свободи складає 6,91 (при рівні значущості в 0,1%), тому ми робимо висновок, що не слід оцінювати об'єднану регресію.