Контрольная работа: Выполнение корреляционного и регрессионного анализа
Средняя ошибка аппроксимации составляет:
Практически полагают, что значение средней ошибки аппроксимации не должно превышать 12-15% для грубого приближения регрессии к реальной зависимости. В нашем случае ошибка чрезмерна велика.
Воспользуемся результатами исследования, проведенного в п.1, т. е исключим из рассматриваемой выборки данные по Брянской и Белгородской областям.
В этом случае уравнение парной регрессии примет вид:
.
Доля неучтенных в полученной эконометрической модели объясняющих переменных составит: 1 - 0,260 = 0,74 или 74%.
Коэффициент эластичности составит:
,
а средняя ошибка аппроксимации:
Исключение точек выброса из рассматриваемой выборки снизило ошибку аппроксимации, однако её значение превышает допустимое значение.
2.4. Оценить статистическую надежность результатов регрессионного моделирования с помощью критерия Стъюдента и F-критерия Фишера.
Проведем более строгую оценку статистической надежности моделирования с помощью F-критерия Фишера.
Для этого проверим нулевую гипотезу H 0 о статистической незначимости полученного уравнения регрессии по условию: если при заданном уровне значимости α = 0,05 теоретическое (расчетное) значение F-критерия (F ) больше его критического значения (FКРИТ ), то нулевая гипотеза отвергается и полученное уравнение регрессии принимается значимым.
Расчетное значение F , определенное с помощью инструмента Регрессия MS Excel, составило F = 2,078.
Критическое значение FКРИТ определим при помощи статистической функции FРАСПОБР. Входными параметрами функции является уровень значимости (вероятность) и число степеней свободы 1 и 2. Для модели парной регрессии число степеней свободы соответственно равно 1 (одна объясняющая переменная) и n - 2 = 10 - 2 = 8.
FКРИТ = 5,318.
Расчетное значение F = 2,078 меньше критического FКРИТ = 5,318, поэтому нулевая гипотеза H 0 о статистической незначимости уравнения регрессии принимается, что подтверждает вывод, сделанный в п.2.3.
При расчете критериев Фишера для сокращенной выборки (исключая данные по Брянской и Белгородской областям) получаем аналогичный результат.
F = 2,115< FКРИТ = 5,987.
2.5. Сделать итоговые выводы.
1. Уравнение парной линейной регрессии, связывающее объемы перевозимых грузовыми автомобилями крупных и средних организаций автомобильного транспорта в 2006 году, y с величиной расходов на перевозку x , имеет вид:
При этом доля всех неучтенных в полученной эконометрической модели объясняющих переменных приблизительно составляет 79,4%, т.е. учтенными остаются лишь 20,6 % параметров.
Величина коэффициента эластичности говорит о том, что при изменении величины расходов на грузоперевозки на 1% их объем должен измениться на 0,49%.
Расчет средней ошибки аппроксимации (А = 96,62 %), а также анализ при помощи критерия Фишера показал, что полученное уравнение регрессии не соответствует реальной зависимости (в силу большой доли неучтенных в зависимости параметров).
2. Уравнение парной линейной регрессии для выборки исходных данных, исключающей данные по Брянской и Белгородской областям, которые по результатам выполнения задания 1 признаны точками выброса, имеет вид: