Реферат: Зависимость производства ликеро-водочных изделий
При проверке на мультиколлениарность (коэффициенты частной корреляции и t-статистика) видно, что существует взаимосвязь между:
x1 | x2 | x3 | x4 |
x2 | x1 | x1 | |
x4 | x4 | x2 |
следовательно в модель включается Х5 и Х4, т.к. коэффициент парной корреляции Y-X4 (-0.5315) больше, чем коэффициенты парной корреляции Y-X1 (0.1170) и Y-X3 (-0.4266) и Y-Х2(-0.1890).
Способ 2.
Этот метод основан на анализе распределения корреляционной матрицы. Идея метода заключается в том что вводятся некоторые критерии на основе которого можно проверить о значимости отклонения корреляционной матрицы от ортогональной, для этого вводится величина:
Х^2= N-1-1/6(2*n+5)*ln|R|
по расчетам ХИ квадрат равно 80.469 больше табличного, значит между переменными существует мультиколлениарность. Для определения степени мультиколлениарности вводим величину:
W=(Cii-1)-(N-n)/(n-1)
где Сii - диагональный элемент матрицы обратной корреляционной.
Wii | Wii | f-критерий |
W11 | 3.622 | 0.0139 |
W22 | 1.93 | 0.12648 |
W33 | 6.18 | 0.00081 |
W44 | 2.181 | 0.08999 |
W55 | 6.225 | 0.00077 |
Данная таблица указывает, что наиболее коллениарна Х2, затем Х4 и можно сказать что Х3 и Х5 вовсе не коллениарны. Следовательно в модель лучше включить Х3 и Х5, но проведенный последующий регрессионный анализ указывает что лучше включать в модель Х2 и Х3, т.е. производство ликеро-водочных изделий (Y) зависит от валового сбора сахарной свеклы (X2) и потребления пива (X3).
Анализ уравнения регрессии говорит, что при росте Х5 на 1 единицу в своих единицах измерения увеличит Y на 1.0552 единицы в своих единицах измерения, Отклонения основного тренда носят случайный характер, а данная модель определяет Y на 96.71% ( R-квадрат). Относительная ошибка апроксимации указывает об адекватности математической модели. Степень рассеянности Y мала (дисперсия=3.909). Распределение Y является нормальным, в ряду нет автокорреляции нельзя , а проверка на стационарность случайного компонента с помощью Х^2 (Х^2=10.04) указывает что коэффициенты корреляции неоднородны.
Метод пресс .
Основан на выборе наилучшего уравнения регрессии для этого рассчитывают значения сумм квадратов расхождения:
Хi | отклонение | Хi | отклонение | Хi | отклонение | Хi | отклонение | Хi | отклонение |
1 | 9174.74 | 12 | 5598.67 | 123 | 5589.96 | 1234 | 538.735 | 12345 | 185.547 |
2 | 8969.93 | 13 | 7329.06 | 124 | 545.654 | 1235 | 217.694 | ||
3 | 7608.97 | 14 | 2226.17 | 125 | 217.86 | 1245 | 185.690 | ||
4 | 6674.29 | 15 | 256.857 | 134 | 1176.13 | 1345 | 236.652 | ||
5 | 305.611 | 23 | 7607.95 | 135 | 240.845 | 2345 | 224.784 | ||
24 | 256.856 | 145 | 256.53 | ||||||
25 | 227.26 | 234 | 3506.0 | ||||||
34 | 5628.28 | 235 | 224.949 | ||||||
35 | 275.868 | 245 | 226.924 | ||||||
45 | 266.522 | 345 | 236.662 |
Из таблицы видно лучше всего взять модель 25 или 125.
модель | R2 | дисперсия |
25 | 0.9756 | 3.3709 |
125 | 0.9766 | 3.3005 |
Последующая проверка говорит, что модель 25 наиболее выгодна. Значит
производство ликеро-водочных изделий (Y) зависит от 2- валового сбора сахарной свеклы (X2), 5- потребления водки (X5) на 97.66%.
Метод исключения .
Метод исключения основан на анализе коэффициентов регрессионного уравнения при условии, что переменная при этом коэффициенте в модель была включена последней.
переменные в моделе |
f-кри- терий | переменные в моделе |
f-кри- терий | переменные в моделе |
f-кри- терий | переменные в моделе |
f-кри- терий | переменные в моделе |
f-кри- терий |
Х1 | 3.1719 | Х1 | 0.5331 | Х1 | 0.7335 | ||||
Х2 | 4.1314 | Х2 | 1.7014 | Х2 | 3.0429 | Х2 | 1.8365 | ||
Х3 | 0.0115 | Х3 | 0.0121 | ||||||
Х4 | 2.5988 | Х4 | 8.6594 | ||||||
Х5 | 28.553 | Х5 | 394.844 | Х5 | 419.872 | Х5 | 23.6498 | ||
Fкр | 4.4100 | Fкр | 4.4100 | Fкр | 4.4100 | Fкр | 4.4100 | Fкр | 4.4100 |
Следовательно в модель включается только Х5. Данная модель определяет Y на 96.71%, значит потребление водки (X5) значительно влияет на производство ликеро-водочных изделий (Y).
Метод главных компонент .
Метод главных компонент был предложен К. Пирсоном в 1901 году, а в дальнейшем развит и доработан. Метод основан на стандартизации переменных для чего используют следующие формулы:
Zij=(Xij-Xiсред)Si ;
Si=[1/(n-1)*сумма(Xij-Xiсред)^2]^(1/2) ;
где Zij стандартизованные переменные;