Контрольная работа: Корреляционный анализ
Таким образом, для решаемой задачи коэффициент корреляции может служить мерой силы стохастической взаимосвязи рассматриваемых случайных величин.
Вне рамок корреляционной модели равенство нулю коэффициента корреляции указывает лишь на некоррелированность исходных переменных, но не подтверждает отсутствие иной формы стохастической зависимости.
Коэффициент корреляции не имеет размерности и, следовательно, его можно использовать при анализе зависимости признаков, различающихся по мерным шкалам.
Значение по абсолютной величине не превосходит единицы.
Если , линейная связь между переменными и отсутствует.
Значение указывает на наличие функциональной линейной зависимости между ними.
По мере приближения к единице условные дисперсии стремятся к нулю, что свидетельствует о меньшем рассеянии значений переменных , относительно соответствующих линий регрессии и о более тесной связи между данными переменными.
Положительный знак коэффициента корреляции означает, что прямые регрессии имеют в координатной плоскости положительный тангенс угла наклона, с увеличением (или уменьшением) значения любой из переменных , пропорционально в среднем возрастает (соответственно убывает) значение другой переменной.
Отрицательный знак коэффициента корреляции указывает на обратную тенденцию.
Уравнения линейной парной регрессии
Функции регрессии на и на находятся с помощью формул, определяющих условные математические ожидания:
,
При этом условные плотности распределения вероятностей случайных величин , представляются в виде отношений известных безусловных плотностей распределения:
Дальнейшее интегрирование функций , по x , соответственно по y , непосредственно дает уравнение регрессии на , а также уравнение регрессии на :
;
,
; ,
где
- коэффициент регрессии на ;
- коэффициент регрессии на .
Линейный характер корреляционной зависимости между совместно нормально распределенными случайными величинами проявляется в том, что с изменением одной величины пропорционально изменяется условное математическое ожидание другой величины. Графики функций регрессии (именуемые линиями регрессии) представляют собой прямые.
В случае некоррелированности , , т.е. при , прямые регрессии на и на параллельны соответственно координатным осям и .
Парный коэффициент детерминации
Степень рассеяния значений (или ) относительно линии регрессии на (или на ) характеризуют (в среднем) условные дисперсии:
Расчетные формулы для и находятся подобно тому, как определялись функции регрессии на и на .
В итоге,
.
Квадрат коэффициента корреляции называется парным коэффициентом детерминации.