Реферат: Елементи дисперсійного аналізу і теорії кореляції
Таким чином, значення кута між прямими регресії (12) і (13) характеризує тісноту зв’язку між випадковими величинами: чим менше кут, тим більш тісною є зв’язок.
2.3 Умовне середнє і вибіркова регресія
У математичній статистиці вводять вибіркові оцінки умовного математичного сподівання і регресії. У якості оцінки умовного математичного сподівання беруть умовне середнє , яке знаходять за вибірковими даними спостережень.
Умовним середнім називається середнє арифметичне значень випадкової величини , що спостерігаються за умови, яка випадкова величина при цьому має значення . Аналогічно визначається і умовне середнє , однак надалі для стислості викладення обмежимося в основному розглядом тільки і пов'язаними з ним питаннями.
Також як і умовне математичне сподівання , його вибіркова оцінка є функцією від змінної , що позначимо через і будемо називати вибірковою регресією на , а її графік – вибірковою лінією регресії на . Крім того, за аналогією з рівняннями (8) і (9) вводяться вибіркові рівняння регресії на і на , відповідно
(14)
(15)
2.4 Визначення параметрів вибіркового рівняння прямої лінії середньоквадратичної регресії за незгрупованих даних
Нехай під час дослідження кількісних ознак ( , ) у результаті незалежних випробувань отримано пар чисел: , ,...,. Будемо шукати функцію в лінійному наближенні (все аналогічно проводиться і для функції у випадку регресії на ). Крім того, у припущенні незгрупованих даних спостережень (різні значення ознаки і відповідні їм значення ознаки спостерігалися по одному разу) і можна замінити на і . Під час цього рівняння прямої лінії регресії на можна подати у вигляді
(16)
Кутовий коефіцієнт прямої (16) називається вибірковим коефіцієнтом регресії на і позначається . Він є оцінкою коефіцієнта регресії в рівнянні (10). Тепер рівняння (16) можна переписати
(17)
Підберемо параметри і так, щоб сума квадратів відхилень прямої (17) від точок , ,...,, побудованих за даними спостережень, була б мінімальною
(18)
де
– ордината, що спостерігається, і є відповідною до ,
– ордината точки, що лежить на прямій (17) і має абсцису ,
.
Підставивши значення з рівняння (17) у формулу (18), одержимо
(19)
Дорівнявши нулю частинні похідні і функції (19) одержимо систему двох лінійних алгебраїчних рівнянь щодо параметрів і для знаходження точки її мінімуму
(20)
де
, , ,
звідкіля остаточно знаходимо
Аналогічно визначається вибіркове рівняння прямої лінії регресії на .
2.5 Знаходження параметрів вибіркового рівняння прямої лінії середньоквадратичної регресії за згрупованими даними
При великій кількості спостережень одне й те ж саме значення може зустрітися раз, значення – раз, одна й та ж пара чисел може спостерігатися раз. Тому дані спостережень групують, тобто підраховують відповідні частоти , , . Усі згруповані дані записують у вигляді таблиці, що називають кореляційною.