Контрольная работа: Прогноз годовой прибыли
Вероятность случайного формирования коэффициентов при факторах Х 2 и Х 4 превышает принятый уровень значимости a=0,05 (см. «P-Значение» втабл. 2 ), и эти коэффициенты не признаются статистически значимыми.
р ис. 2. Панель регрессионного анализа модели Y ( X 1 , X 2 , X 4 )
Таблица 2
Результаты регрессионного анализа модели Y ( X 1 , X 2 , X 4 )
Регрессионная статистика | |
Множественный R | 0,97292594 |
R-квадрат | 0,946584884 |
Нормированный R-квадрат | 0,944359254 |
Стандартная ошибка | 2,267611945 |
Наблюдения | 76 |
Дисперсионный анализ | ||||||||
df | SS | MS | F | Значимость F | ||||
Регрессия | 3 | 6560,929292 | 2186,98 | 425,31101 | 1,04571E-45 | |||
Остаток | 72 | 370,2286032 | 5,14206 | |||||
Итого | 75 | 6931,157895 | ||||||
Уравнение регрессии | ||||||||
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% | |
Y-пересечение | 75,43927547 | 0,998411562 | 75,5593 | 2,545E-70 | 73,44897843 | 77,4295725 | 73,44897843 | 77,42957252 |
X1 | 0,044670594 | 0,01380341 | 3,2362 | 0,0018316 | 0,017154 | 0,07218719 | 0,017154 | 0,072187188 |
X2 | -0,045296701 | 0,421363275 | -0,1075 | 0,914691 | -0,885269026 | 0,79467562 | -0,885269026 | 0,794675624 |
X4 | -0,239566687 | 0,013204423 | -18,1429 | 1,438E-28 | -0,265889223 | -0,2132442 | -0,265889223 | -0,213244151 |
3.По результатам проверки статистической значимости коэффициентов уравнения регрессии, проведенной в предыдущем пункте, строим новую регрессионную модель, содержащую только информативные факторы, к которым относятся:
· факторы, коэффициенты при которых статистически значимы;
· факторы, у коэффициентов которых t ‑статистика превышает по модулю единицу (другими словами, абсолютная величина коэффициента больше его стандартной ошибки).
К первой группе относится фактор Х 1 ко второй — фактор X 4 . Фактор X 2 исключается из рассмотрения как неинформативный, и окончательно регрессионная модель будет содержать факторы X 1 , X 4 .
Для построения уравнения регрессии скопируем на чистый рабочий лист значения используемых переменных (прил. 5) и проведем регрессионный анализ (рис. 3 ). Его результаты приведены в прил. 6 и перенесены в табл. 3 . Уравнение регрессии имеет вид:
ŷ = 75.38278 + 0.044918 ·x1 - 0.24031 ·x4
(см. «Коэффициенты» втабл.3 ).
р ис. 3. Панель регрессионного анализа модели Y ( X 1 , X 4 )
Таблица 3
Результаты регрессионного анализа модели Y ( X 1 , X 4 )
Регрессионная статистика | ||||||
Множественный R | 0,972922 | |||||
R-квадрат | 0,946576 | |||||
Нормированный R-квадрат | 0,945113 | |||||
Стандартная ошибка | 2,252208 | |||||
Наблюдения | 76 | |||||
Дисперсионный анализ | ||||||
df | SS | MS | F | Значимость F | ||
Регрессия | 2 | 6560,87 | 3280,435 | 646,7175 | 3,65E-47 | |
Остаток | 73 | 370,288 | 5,072439 | |||
Итого | 75 | 6931,158 | ||||
Уравнение регрессии | ||||||
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | |||
Y-пересечение | 75,38278 | 0,843142 | 89,40701 | 2,44E-76 | ||
X1 | 0,044918 | 0,013518 | 3,322694 | 0,001395 | ||
X4 | -0,24031 | 0,011185 | -21,4848 | 2,74E-33 |
Уравнение регрессии статистически значимо: вероятность его случайного формирования ниже допустимого уровня значимости a=0,05 (см. «Значимость F» втабл.3 ).
Статистически значимым признается и коэффициент при факторе Х 1 вероятность его случайного формирования ниже допустимого уровня значимости a=0,05 (см. «P-Значение» втабл. 3 ). Это свидетельствует о существенном влиянии ВВП в паритетах покупательной способностиX 1 на изменение годовой прибылиY .
Коэффициент при факторе Х 4 (годовой коэффициент младенческой смертности) не является статистически значимым. Однако этот фактор все же можно считать информативным, так как t ‑статистика его коэффициента превышает по модулю единицу, хотя к дальнейшим выводам относительно фактора Х 4 следует относиться с некоторой долей осторожности.
4.Оценим качество и точность последнего уравнения регрессии, используя некоторые статистические характеристики, полученные в ходе регрессионного анализа (см. «Регрессионную статистику » в табл. 3 ):
· множественный коэффициент детерминации
n
∑ ( ŷ i - y)2
R2 = _i=1 ____________ = 0.946576
n
∑( ŷ i - y)2
i=1
R 2 = показывает, что регрессионная модель объясняет 94,7 % вариации средней ожидаемой продолжительности жизни при рожденииY , причем эта вариация обусловлена изменением включенных в модель регрессии факторов X 1 , X 4 ;
· стандартная ошибка регрессии