Реферат: Елементи дисперсійного аналізу і теорії кореляції
Таким чином, значення кута між прямими регресії (12) і (13) характеризує тісноту зв’язку між випадковими величинами: чим менше кут, тим більш тісною є зв’язок.
2.3 Умовне середнє і вибіркова регресія
У математичній статистиці вводять вибіркові оцінки умовного математичного сподівання і регресії. У якості оцінки умовного математичного сподівання беруть умовне середнє
, яке знаходять за вибірковими даними спостережень.
Умовним середнім називається середнє арифметичне значень випадкової величини
, що спостерігаються за умови, яка випадкова величина
при цьому має значення
. Аналогічно визначається і умовне середнє
, однак надалі для стислості викладення обмежимося в основному розглядом тільки
і пов'язаними з ним питаннями.
Також як і умовне математичне сподівання , його вибіркова оцінка є функцією від змінної
, що позначимо через
і будемо називати вибірковою регресією
на
, а її графік – вибірковою лінією регресії
на
. Крім того, за аналогією з рівняннями (8) і (9) вводяться вибіркові рівняння регресії
на
і
на
, відповідно
(14)
(15)
2.4 Визначення параметрів вибіркового рівняння прямої лінії середньоквадратичної регресії за незгрупованих даних
Нехай під час дослідження кількісних ознак ( ,
) у результаті
незалежних випробувань отримано
пар чисел:
,
,...,
. Будемо шукати функцію
в лінійному наближенні (все аналогічно проводиться і для функції
у випадку регресії
на
). Крім того, у припущенні незгрупованих даних спостережень (різні значення
ознаки
і відповідні їм значення
ознаки
спостерігалися по одному разу)
і
можна замінити на
і
. Під час цього рівняння прямої лінії регресії
на
можна подати у вигляді
(16)
Кутовий коефіцієнт прямої (16) називається вибірковим коефіцієнтом регресії
на
і позначається
. Він є оцінкою коефіцієнта регресії
в рівнянні (10). Тепер рівняння (16) можна переписати
(17)
Підберемо параметри і
так, щоб сума квадратів відхилень прямої (17) від точок
,
,...,
, побудованих за даними спостережень, була б мінімальною
(18)
де
– ордината, що спостерігається, і є відповідною до
,
– ордината точки, що лежить на прямій (17) і має абсцису
,
.
Підставивши значення з рівняння (17) у формулу (18), одержимо
(19)
Дорівнявши нулю частинні похідні і
функції (19) одержимо систему двох лінійних алгебраїчних рівнянь щодо параметрів
і
для знаходження точки її мінімуму
(20)
де
,
,
,
звідкіля остаточно знаходимо
Аналогічно визначається вибіркове рівняння прямої лінії регресії на
.
2.5 Знаходження параметрів вибіркового рівняння прямої лінії середньоквадратичної регресії за згрупованими даними
При великій кількості спостережень одне й те ж саме значення може зустрітися
раз, значення
–
раз, одна й та ж пара чисел
може спостерігатися
раз. Тому дані спостережень групують, тобто підраховують відповідні частоти
,
,
. Усі згруповані дані записують у вигляді таблиці, що називають кореляційною.