Курсовая работа: Прогнозирование уровня жизни населения России
не имеют основного общего
13443,11
13736,3
13997,2
14165,3
Целями исследования зависимости между признаками являются доказательство наличия связи между признаками и изучение этой связи. Для доказательства наличия связи между двумя случайными величинами Х и У применяют корреляционный анализ. Если совместное распределение Х и У является нормальным, то статистические выводы основывают на выборочном коэффициенте линейной корреляции.
Проводим корреляционный анализ с помощью средств MS Excel.
Для построения матрицы коэффициентов парной корреляции необходимо выбирать команду меню Сервис/Анализ данных/Корреляция. Получаем матрицу коэффициентов парной корреляции:
Y | X1 | X2 | X3 | X4 | X5 | Х6 | Х7 | |
Y | 1 | |||||||
X1 | 0,969931131 | 1 | ||||||
X2 | 0,7835509 | 0,48104101 | 1 | |||||
X3 | 0,923776162 | 0,9886926 | 0,492782141 | 1 | ||||
X4 | 0,558603886 | 0,5149579 | 0,928738769 | 0,4412926 | 1 | |||
X5 | 0,983930312 | 0,91254885 | 0,658367796 | 0,8590448 | 0,81163832 | 1 | ||
Х6 | 0,957355231 | 0,94062346 | 0,619255408 | 0,8919184 | 0,76330753 | 0,996909112 | 1 | |
Х7 | 0,764378766 | 0,97883455 | 0,299515062 | 0,6317487 | 0,030756 | 0,496059331 | 0,550741128 | 1 |
Одним из условий регрессионной модели является предположение о функциональной независимости объясняющих переменных. Связь между факторами называется мультиколлинеарностью, которая делает вычисление параметров модели либо невозможным, либо затрудняет содержательную интерпретацию параметров модели. Считают явление мультиколлинеарности в исходных данных установленным, если коэффициент парной корреляции между двумя переменными больше 0.8. Дальнейший анализ модели проводим без X1, Х3, X4, Х6, X7.
Расчет коэффициентов линейной регрессии.
Для линейной аппроксимации в Excel существует функция ЛИНЕЙН(изв. зн. Y , изв. зн. X , константа, статистика) она возвращает массив значений описывающих кривую вида:
В результате получили полную статистическую информацию при аргументе Константа равном 1:
Линейная зависимость | ||
0.645 | 0.176 | 229.123 |
0.039 | 0.038 | 94.969 |
0.963 | 115.657 | #Н/Д |
441.156 | 34 | #Н/Д |
11802358 | 454805 | #Н/Д |
Полученные числа имеют следующий смысл:
m n |
m n-1 |
… |
b |
Sen |
Sen-1 |
… |
Seb |
R2 |
Sey | ||
F |
Df | ||
Ssreg |
Ssresid |
Se – стандартная ошибка для коэффициента m
Se b – стандартная ошибка для свободного члена b
R 2 – коэффициент детерминированности, который показывает как близко уравнение описывает исходные данные. Чем ближе он к 1, тем больше сходится теоретическая зависимость и экспериментальные данные.
Sey – стандартная ошибка для y
F – критерий Фишера определяет случайная или нет взаимосвязь между зависимой и независимой переменными