Лабораторная работа: Класична лінійна регресія
Крок 3. Вибирають . Відповідну незалежну змінну xj включають в лінійну модель, для якої за допомогою 1МНК знаходять оцінки параметрів:
де g - оцінки параметрів моделі, яка будується на основі нормалізованих даних.
Крок 4. Серед тих, що залишилися, значень вибирається максимальний і в модель вводиться наступна незалежна змінна xl .
.
Оцінюються параметри за допомогою відношення:
g r = rxy ,
де r – матриця парних коефіцієнтів кореляції між незалежними змінними;
ryx - вектор парних коефіцієнтів кореляції між залежною та незалежними змінними.
Звідси оператор оцінювання параметрів моделі:
Якщо немає обмеження на кількість введених змінних, обчислення виконуються до тих пір, поки не будуть включені всі змінні.
Зв’язок між оцінками параметрів моделі на основі нормалізованих і ненормалізованих змінних запишеться таким чином:
.
13. Тіснота зв’язку загального впливу від незалежних змінних на залежну визначається коефіцієнтами детермінації і множинної кореляції. Коефіцієнт детермінації без урахування числа ступенів свободи
з урахуванням ступенів свободи:
.
14. Коефіцієнт детермінації показує, на скільки процентів варіація залежної змінної визначається варіацією пояснюючих (незалежних) змінних.
Коефіцієнт кореляції є інваріантною оцінкою коефіцієнта детермінації. Він характеризує тісноту зв'язку між залежною і пояснювальними змінними. Визначається як корінь квадратний від R 2 .
15. Оскільки коефіцієнти детермінації і кореляції є вибірковими характеристиками, то їх числові значення також перевіряються на значущість згідно зі статистичними гіпотезами. Для перевірки значущості коефіцієнта кореляції використовується t-критерій.
Нульова гіпотеза: значення коефіцієнту кореляції несуттєво відрізняється від 0.
Розрахункове значення критерію визначається як:
Якщо розрахункове значення цього критерію t не менше за критичне (табличне) tтаб при вибраному рівні довіри a і ступені свободи n - m, тобто t³tтаб , нульова гіпотеза відхиляється і відповідний коефіцієнт кореляції є достовірним.
16. Гіпотеза про істотність зв'язку між залежною і незалежною змінними може бути перевірена з допомогою F-критерію. Нульова гіпотеза: всі коефіцієнти регресії несуттєво відрізняються від 0, тобто Н0 : b0 = b1 = …….. =bm = 0.
Розрахункове значення F-критерію визначається за формулою: