Курсовая работа: Процесс анализа информационных массивов
В статистической теории разработаны и на практике применяются различные модификации формул расчета данного коэффициента:
,(2.1)
где x – факторный признак;
y – результативный признак.
Выполнив несложные преобразования можно получить следующую формулу (2.2):
.(2.2)
При пользовании этой формулой отпадает необходимость вычислять отклонения индивидуальных значений признаков от средней величины, что исключает ошибку в расчетах при округлении средних величин.
Линейный коэффициент корреляции может принимать любые значения в пределах от -1 до +1. Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее связь между признаками. Знак при линейном коэффициенте корреляции указывает на направление связи - прямой зависимости соответствует знак плюс, обратной – знак минус.
На основе данных таблицы 1.1(2.1), с помощью формулы (2.2), было определено два коэффициента корреляции.
Во-первых, коэффициент корреляции, показывающий степень тесноты связи между себестоимостью и выручкой от продаж.
Пусть x1 – величина себестоимости проданных товаров, продукции, работ, услуг. Тогда, y – величина выручки от продажи товаров, продукции, работ, услуг.
Отсюда r = 0,98, связь является прямой и очень сильной. Что значит, с увеличением себестоимости увеличивается и выручка.
Во-вторых, рассчитан коэффициент корреляции, показывающий степень тесноты связи между расходами и выручкой от продаж. В данной ситуации x2 – величина коммерческих и управленческих расходов, а y – величина выручки от продажи товаров, продукции, работ, услуг.
Коэффициент корреляции равен 0,66, что говорит о прямой связи между признаками.
Тесноту связи между факторными признаками можно также рассчитать по формуле (2.1), заменяя результативный признак на факторный:
.
(2.3)
= 0,51.
Полученная величина свидетельствует о наличии прямой зависимости между значениями себестоимости и расходов.
Для наглядности была построена матрица парных коэффициентов корреляции:
y – величина выручки от продажи товаров, продукции, работ, услуг;
x1 – величина себестоимости проданных товаров, продукции, работ, услуг;
x2 – величина коммерческих и управленческих расходов.
Таблица 2.2
Матрица парных коэффициентов корреляции
y | x1 | x2 | |
y | 1,00 | 0,98 | 0,66 |
x1 | 0,98 | 1,00 | 0,51 |
x2 | 0,66 | 0,51 | 1,00 |
Матрица парных коэффициентов корреляции показывает, что результативный показатель наиболее тесно связан с показателем x1 .
Так как существует линейная связь между результативным и двумя факторными признаками, а также между парой факторных признаков, то имеет смысл рассчитать множественный коэффициент корреляции.
В данной работе множественный коэффициент корреляции был вычислен по формуле (2.4):
.(2.4)
= 0,99.
Связь между показателями сильная, факторы x1 и x2 практически полностью обуславливают величину y.
При построении модели связи, или регрессии, может возникнуть проблема мультиколлинеарности (наличие сильной корреляции между независимыми переменными, входящими в уравнение регрессии). Мультиколлинеарность существенно искажает результаты исследования.
Наиболее распространенный метод выявления коллинеарности основан на анализе парных коэффициентов корреляции. Он состоит в том, что две или несколько переменных признаются коллинеарными (мультиколлинеарными), если парные коэффициенты корреляции больше определенной величины. На практике наиболее часто считают, что два аргумента коллинеарны, если парный коэффициент корреляции между ними по абсолютной величине больше 0,8.
В данном примере парный коэффициент корреляции не превышает величины 0,8 (= 0,51), что говорит об отсутствии явления мультиколлинеарности.
2.2 Построение модели связи и оценка ее существенности
Как было выяснено в предыдущем пункте, зависимость результативного признака от факторных является прямолинейной. Факторные признаки не являются мультиколлинеарными и практически полностью обуславливают результативный признак, следовательно, все признаки необходимо включить в модель. Поэтому связь будет описываться такой моделью связи (2.5):
,(2.5)
где и – коэффициенты регрессии.