Реферат: Елементи дисперсійного аналізу і теорії кореляції
Таблиця 3
![]() | ![]() | ||||
10 | 20 | 30 | 40 | ![]() | |
0,4 | 5 | – | 7 | 14 | 26 |
0,6 | – | 2 | 6 | 4 | 12 |
0,8 | 3 | 19 | – | – | 22 |
![]() | 8 | 21 | 13 | 18 | ![]() |
У першому рядку цієї таблиці дано перелік значень (10; 20; 30; 40) ознаки , що спостерігаються, а в першому стовпці – спостерігаємі значення (0,4; 0,6; 0,8) ознаки
. На перетинанні рядків і стовпчиків знаходяться частоти
пар значень ознак. Наприклад, частота 5 вказує, що пара чисел (10; 0,4) спостерігається 5 разів. Риска означає, що відповідна пара чисел, наприклад (20; 0,4), не спостерігається.
В останньому стовпчикові записані суми частот рядків. В останньому рядку записані суми частот стовпчиків. У нижньому правому куті таблиці, поміщена сума всіх частот (загальна кількість всіх спостережень ).
У випадку згрупованих даних з урахуванням очевидних співвідношень
,
,
,
систему рівнянь (20) можна переписати у виправленому вигляді
З рішення цієї системи ( ,
) знаходимо рівняння прямої регресії
Шляхом нескладних перетворень його можна переписати у вигляді
де ,
– вибіркові середні квадратичні відхилення величин
і
(21)
– вибірковий коефіцієнт кореляції.
Вибірковий коефіцієнт кореляції. Як відомо з теорії ймовірностей, якщо величини і
незалежні, коефіцієнт їхньої кореляції
, якщо
– величини
і
пов'язані лінійною функціональною залежністю. Тобто коефіцієнт кореляції
характеризує ступінь лінійного зв'язку між
і
.
Вибірковий коефіцієнт кореляції є оцінкою коефіцієнта кореляції
генеральної сукупності, тому він також характеризує міру лінійного зв'язку між величинами
і
.
3 Поняття про криволінійну кореляцію
Раніше ми обмежилися лінійним наближенням функцій регресії, рівнянь регресії, відповідно і кореляційного зв'язку. Однак теорію можна узагальнити і на наступні наближення.
Нехай дані спостережень над кількісними ознаками і
зведено до кореляційної таблиці. Тим самим значення
, що спостерігаються, розбито на групи; кожна група містить ті значення
, що відповідають визначеному значенню
. Для приклада розглянемо кореляційну таблицю 4.
Таблиця 4
![]() | ![]() | |||
10 | 20 | 30 | ![]() | |
15 | 4 | 28 | 6 | 38 |
25 | 6 | – | 6 | 12 |
![]() | 10 | 28 | 12 | ![]() |
![]() | 21 | 15 | 20 |
До першої групи відносяться ті 10 значень (4 рази спостерігалося значення
і 6 разів
), що відповідають
. До другої групи – ті 28 значень
(28 разів спостерігалося
і 0 разів
), що відповідають
. До третьої групи відносяться 12 значень
(6 разів спостерігалося
і 6 разів
).
Умовні середні тепер можна назвати груповими середніми: групова середня першої групи
групова середня другої групи
для третьої групи
Оскільки всі значення ознаки розбито на групи, можна уявити загальну дисперсію ознаки у вигляді суми внутрішньо групової і міжгрупової дисперсій