Дипломная работа: Регресійний аналіз інтервальних даних
Розділ І. Лінійна багатовимірна регресія
Нехай- деяка випадкова величина, флуктує навколо деякого невідомого значення параметра , тобто , де- флуктуація або похибка. Наприклад, похибка може бути властива самому експерименту, або похибка може виникати при вимірювані невідомого параметра .
Припустимо тепер, що можна представити у вигляді
де - відомі постійні величини, а – невідомі параметри, які потрібно оцінити.
Якщо величина змінюється і при цьому змінна набуває значень , тобто можна записати
(1.1)
У матричному вигляді, отримаємо:
Або
(1.2)
де .
Означення : Матриця розміру називається регресійною матрицею . При цьому її елементи обираються таким чином, щоб , тобто число лінійних незалежних стовпців дорівнювало , також матрицю називають матрицею повного рангу.
Але в деяких випадках приймає лише два значення 0, 1, тоді можливі випадки коли в матриці деякі рядки або стовпці збігаються, тобто є лінійно – залежними. В цьому випадку називають матрицею плану . Змінні називають регресорами (j=1,…,p-1), або предикторними змінними , а - називають відкликом.
Модель (1) або (2) лінійна відносно невідомих параметрів. Тому її називають лінійною моделлю .
Перед тим як оцінювати вектор , замітимо, що вся теорія будується для моделі (2).
Для оцінки невідомих параметрів використовують метод найменших квадратів (МНК), який полягає в мінімізації суми квадратів залишків. Необхідно мінімізувати величину:
(1.3)
за параметрами . Вираз (1.3) запишеться так:
(1.4)
Шукаємо градієнт :
Розв’язуємо рівняння:
Таким чином
(1.5)
Необхідно перевірити, що знайдена стаціонарна точка є точкою мінімуму функції . Справедлива така тотожність