Дипломная работа: Порушення основних припущень лінійного регресійного аналізу
В підрозділі 1.2 було знайдено рівняння простої лінійної регресії:
.
Нехай , тоді
, звідси
.
А , тоді
, звідси
.
Отже,
тобто і
некорельовані випадкові величини.
Порахуємо дисперсію (або
при заданому
).
(1.8.1)
Стандартне відхилення оцінки при заданому
є
(1.8.2)
Оскільки невідома, то замість неї використовують оцінку
, припускаючи, що модель коректна.
Оцінка стандартного відхилення має вигляд:
(1.8.3)
Ця величина досягає мінімального значення, коли , і зростає при віддаленні
від
в будь-якому напрямі.
%-ві довірчі інтервали для регресії мають вигляд:
або, що те ж саме,
Чим більша різниця між
та
, тим більше відхилення між
та
(довжина довірчого інтервалу). Останнє означає, що точність прогнозу різна в різних точках
.
Дві криві по обидві сторони від лінії регресії визначають %-ві довірчі границі й показують, як змінюються границі в залежності від зміни
. Ці криві – гіперболи.
Для того, щоб одержати ці криві, необхідно з’єднати неперервною лінією всі значення при всіх
(нижня гіпербола) та
при всіх
(верхня гіпербола).
1.9 Повторні спостереження. Неадекватність і “чиста” помилка
Побудована лінія регресії – це розрахункова лінія, яка базується на деякій моделі або припущеннях. Але припущення потрібно розглядати як попередні. При деяких обставинах (умовах) можна перевірити, чи коректна (адекватна) побудована модель.
Розглянемо випадок, коли в даних містяться повторні спостереження. Введемо додаткові позначення для множини спостережень при одному й тому ж значенні .
Нехай
–
спостережень при
,
–
спостережень при
,
. . . . . . . . .
–
спостережень при
,
при цьому .
Якщо спостереження повторюються (два рази або більше) при однакових значеннях , то ми можемо використати ці повторення для знаходження оцінки для дисперсії
. Про таку оцінку говорять, що вона представляє “чисту помилку”, оскільки, якщо
однакові, наприклад, для двох спостережень, то тільки випадкові варіації можуть впливати на результати
і створювати розсіювання між ними. Такі відмінності, як правило, забезпечують одержання надійної оцінки для
. Тому при плануванні експериментів має сенс ставити експерименти з повтореннями.
Оцінка величини , пов’язана з “чистою помилкою”, знаходиться так.