Контрольная работа: Выполнение корреляционного и регрессионного анализа
Оценку статистической значимости коэффициентов корреляции будем проводить при помощи t-критерия Стьюдента на уровне значимости α= 0,05.
Парный двухвыборочный t-тест для средних | ||
r = 0,454 | ||
Переменная 1 | Переменная 2 | |
Среднее | 927,08 | 258,42 |
Дисперсия | 1101362,746 | 73524,47289 |
Наблюдения | 10 | 10 |
Корреляция Пирсона | 0,454062283 | |
Гипотетическая разность средних | 0 | |
df | 9 | |
t-статистика | 2, 208751921 | |
P (T<=t) одностороннее | 0,027278104 | |
t критическое одностороннее | 1,833112923 | |
P (T<=t) двухстороннее | 0,054556208 | |
t критическое двухстороннее | 2,262157158 |
Расчетное значение критерия Стьюдента tр = 2,21 меньше критического tКРИТ = 2,306 (взято из таблицы t-распределений Стьюдента при числе степеней свободы n -2= 8 и величине погрешности α= 0,05), из чего делаем вывод о незначимости коэффициента корреляции.
Так как исключение данных по Брянской и Белгородской областям согласно ранее проведенному анализу не значительно влияет на коэффициент корреляции, то при нахождении t-критерия Стьюдента для выборки исходных данных при предположении 5 получим практически аналогичный результат.
Парный двухвыборочный t-тест для средних | ||
r = 0,455 | ||
Переменная 1 | Переменная 2 | |
Среднее | 696,0125 | 137,9125 |
Дисперсия | 607399,8755 | 9534,678393 |
Наблюдения | 8 | 8 |
Корреляция Пирсона | 0,510547416 | |
Гипотетическая разность средних | 0 | |
df | 7 | |
t-статистика | 2,149664636 | |
P (T<=t) одностороннее | 0,034323806 | |
t критическое одностороннее | 1,894578604 | |
P (T<=t) двухстороннее | 0,068647613 | |
t критическое двухстороннее | 2,364624251 |
Расчетное значение критерия Стьюдента tр = 2,15 меньше критического tКРИТ = 2,45 (взято из таблицы t-распределений Стьюдента при числе степеней свободы n -2= 6 и величине погрешности α= 0,05). Коэффициент корреляции незначим.
1.4. Сделать итоговые выводы.
Между показателями работы грузовых автомобилей крупных и средних организаций автомобильного транспорта в 2006 году существует умеренная статистическая взаимосвязь. Для проведения анализа данные по Брянской и Белгородской областям можно не учитывать.
Задание 2
2. По исходным данным выполнить регрессионный анализ:
2.1. Рассчитать параметры уравнения линейной парной регрессии;
Линейное уравнение парной регрессии имеет вид:
,
где - оценка условного математического ожидания y ;
b 0 , b 1 - эмпирические коэффициенты регрессии, подлежащие определению.
Эмпирические коэффициенты регрессии b 0 , b 1 будем определять с помощью инструмента Регрессия MS Excel.
ВЫВОД ИТОГОВ | ||||||||
Регрессионная статистика | ||||||||
Множественный R | 0,454062283 | |||||||
R-квадрат | 0, 206172557 | |||||||
Нормированный R-квадрат | 0,106944127 | |||||||
Стандартная ошибка | 991,7552465 | |||||||
Наблюдения | 10 | |||||||
Дисперсионный анализ | ||||||||
df | SS | MS | F | Значимость F | ||||
Регрессия | 1 | 2043636,965 | 2043636,965 | 2,078 | 0,187 | |||
Остаток | 8 | 7868627,751 | 983578,469 | |||||
Итого | 9 | 9912264,716 | ||||||
Коэффициенты | Стандартная ошибка | |||||||
Y-пересечение | 472,939 | 444,546 | ||||||
Переменная X 1 | 1,757 | 1,219 |
Таким образом, эмпирические коэффициенты регрессии соответственно равны b 0 = 472,94, b 1 = 1,76.
Тогда уравнение парной линейной регрессии, связывающей объемы перевозимых грузовыми автомобилями крупных и средних организаций автомобильного транспорта в 2006 году, y с величиной расходов на перевозку x , имеет вид:
2.2. Дать с помощью общего (среднего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом
Оценим тесноту статистической связи между расходами на перевозки, производимые грузовыми автомобилями крупных и средних организаций в 2006 году, x и их объемами y . Эта оценку производится с помощью коэффициента корреляции rxy .
Величина этого коэффициента рассчитана в п.1.2 и равна r = 0,454. Как говорилось выше, связь между переменными умеренная прямая.
Параметр R-квадрат представляет собой квадрат коэффициента корреляции rxy 2 и называется коэффициентом детерминации. Величина данного коэффициента характеризует долю дисперсии зависимой переменной y , объясненную регрессией (объясняющей переменной x ).
Соответственно величина 1 - rxy 2 характеризует долю дисперсии переменной y , вызванную влиянием всех остальных, неучтенных в эконометрической модели объясняющих переменных.
Таким образом, доля всех неучтенных в полученной эконометрической модели объясняющих переменных приблизительно составляет: 1 - 0, 206 = 0,794 или 79,4%. Степень связи объясняющей переменной x с зависимой переменной y определяется при помощи коэффициента эластичности, который для модели парной линейной регрессии определяется в виде:
.
Тогда
Следовательно, при изменении величины расходов на грузоперевозки на 1% их объем изменяется на 0,49%.
2.3. Оценить качество уравнения с помощью средней ошибки аппроксимации.
Средняя ошибка аппроксимации оценивается по зависимости: