Экономико-математическое моделирование / Контрольная работа: Побудова лінійної регресійної моделі

Контрольная работа: Побудова лінійної регресійної моделі

Як і раніше, замість точного значення дисперсії помилок σ² (яке невідомо в рамках вибіркового спостереження) варто підставити її оцінку, тоді стандартна помилка прогнозу показника стає рівною

Ця середньоквадратична помилка (чи стандартна помилка), як і випливало очікувати, пропорційна стандартній помилці регресії S і росте зі збільшенням різниці між прогнозним і середнім значеннями фактора . Гранична помилка для визначення довірчого інтервалу дорівнює

а границі довірчого інтервалу прогнозованого показника розширюються пропорційно квантилю t_α (n - 2) розподілу Стьюдента з (п - 2) ступенями вільності і рівнем значимості α.

Очевидно, з видаленням крапки прогнозного фактора хр від середнього зона довірчого інтервалу розширюється (рис.4). Це відповідає інтуїтивному сприйняттю помилок прогнозу, що звичайно зростають при видаленні від середніх показників. Максимальна точність прогнозу досягається в крапці х – х^* .

Рис. 4

7. Перевірка простої регресійної моделі на адекватність

Для оцінки знайденої економетричної моделі на адекватність порівнюють розрахункове значення критерію Фішера із табличним.

Розрахункове значення критерію Фішера знаходиться за формулою:

де ,

n – число спостережень,

m – число включених у регресію факторів, які чинять суттєвий вплив на показник.

Для даної надійної ймовірності р (а=1-р рівня значущості) і числа ступенів вільності k₁ =m, k₂ =n-m-1 знаходиться табличне значення F(a, k₁ , k₂ ). Отримане розрахункове значення порівнюється з табличним. При цьому, якщо F_роз > F(a, k₁ , k₂ ), то з надійністю р = 1-а можна вважати, що розглянута економетрична модель адекватна вихідним даним. У протилежному випадку з надійністю р розглянуту лінійну регресію не можна вважати адекватною.

8. F - критерій Фішера

Теорія статистичної перевірки гіпотез у додатку до регресійного аналізу розроблена англійським математиком Фишером.

Нехай Н₀ - гіпотеза про те, що статистичного зв'язку між X і Y немає (чи вона не істотна, статистично не значима), а Н₁ - гіпотеза про те, що зв'язок є (чи вона істотна, статистично значима). Припустимо, що виконується основна гіпотеза про відсутність зв'язку. У цьому випадку щире значення коефіцієнта регресії β = 0 і F-статистика стає рівною

Очевидно, що з ростом значення F (чи коефіцієнта детермінації R² ) збільшується ступінь статистичного зв'язку між фактором і показником (тому що вона прямо пропорційна коефіцієнту регресії і назад пропорційна випадковим помилкам моделі). Задамо імовірність:

як імовірність того, що при перевищенні розрахунковим значенням F (2.47) деякого критичного значення F_Kp гіпотеза про відсутність зв'язку Н₀ вірна. Очевидно, з імовірністю (1 - α) вона при тім же умові невірна. Закритичну область F > F_Kp будемо вважати областю дії гіпотези Н₁ , а докритичну F < F_Kp - областю дії гіпотези Н₀ . Тоді імовірність є імовірність помилки першого роду: α=P(H₀ |H₁ ), тобто імовірність прийняття основної гіпотези H₀ , тоді як насправді справедлива альтернативна гіпотеза Н₁ . Графічно ця імовірність визначається як площа під щільністю імовірності p(F) при F > F_k _p . Імовірність α (її іноді називають коефіцієнтом значимості) звичайно вибирають малої (рівної 0,05 чи 0,01), після чого для заданих значень імовірності а розраховуються чисельно критичні значення F_Kp відповідно з урахуванням залежності. Ці значення табулюються, тобто заносяться в таблиці критичних коефіцієнтів чи детермінації критичних значень F-статистики.

Рис. 5

Визначення значимості статистичного зв'язку для моделі лінійної регресії здійснюється по наступної методики. На основі вибіркових даних будується модель і визначається коефіцієнт детермінації R² , що потім порівнюється з критичним коефіцієнтом детермінації R² _Kp . Останній знаходять по таблиці критичних значень коефіцієнта детермінації. Вхідними даними таблиці є коефіцієнт значимості α = 0,05 (чи 0,01), номер стовпця таблиці к₁ = п - 1, номер рядка к₂₌ п -к, де к - число параметрів моделі (для двовимірної моделі до = 2 і використовується перший стовпчик таблиці). Нагадаємо, що параметр к₁ - це число ступенів волі чисельника F-статистики, к₂ - число ступенів волі знаменника F-статистики. Коефіцієнт детермінації можна перерахувати в F-статистику (критерій Фишера), у загальному випадку по формулі:

К-во Просмотров: 399

Бесплатно скачать Контрольная работа: Побудова лінійної регресійної моделі

>>> Скачать <<<