Реферат: Елементи дисперсійного аналізу і теорії кореляції
(8)
– рівняння регресії на .
Аналогічно визначаються умовне математичне сподівання випадкової величини і функція, а також рівняння регресії на :
(9)
Функції і (рівняння регресії), що уявляють інтерес, у загальному випадку невідомі, тому їх шукають у наближеному вигляді, причому звичайно обмежуються лінійним наближенням:
(10)
де і – параметри, що підлягають визначенню. Найчастіше для цього вживають метод найменших квадратів.
Функцію називають "найкращим наближенням" у сенсі методу найменших квадратів, якщо математичне сподівання
(11)
приймає найменше можливе значення. При цьому функцію називають середньоквадратичною регресією на .
У теорії ймовірностей доведено, що лінійна середня квадратична регресія на має вигляд
де
, ,
, ,
– коефіцієнт кореляції величин і ,
– кореляційний момент цих величин.
Можна показати, що кореляційний момент характеризує зв'язок між величинами і , зокрема, якщо вони незалежні, то
Коефіцієнт
називають коефіцієнтом регресії на , а пряму
(12)
називають прямою середньоквадратичної регресії на .
При підстановці знайдених значень і у формулу (11) отримуємо мінімальне значення функції , що дорівнює
Цю величину називають залишковою дисперсією випадкової величини щодо випадкової величини . Вона характеризує похибку, що виникає під час заміни лінійною функцією (10). При залишкова дисперсія дорівнює нулю, тобто в цих випадках лінійна функція (10) точно подає випадкову величину . Це означає, що при цьому та пов'язані лінійною функціональною залежністю.
Аналогічний вигляд має і пряма середньоквадратичної регресії на
(13)