Курсовая работа: Решение задач с нормальными законами в системе "Статистика"
F 1 (1) =0,104743×224,228+2,046703×17,115+(-0,13635)×22,981=55,38211;
F 2 (1) =0,104743×151,827+2,046703×14,904+(-0,13635)×21,481=43,47791;
F 3 (1) =0,104743×147,313+2,046703×13,627+(-0,13635)×28,669=39,41138;
F 4 (2) =0,104743×152,253+2,046703×10,545+(-0,13635)×10,199=36,13924;
F 1 (2) =0,104743×46,757+2,046703×4,428+(-0,13635)×11,124=12,44351;
………………………………………………………………………………..
F 5 (2) =0,104743×63,979+2,046703×4,211+(-0,13635)×12,860=13,56655.
8. По совокупности найденных значений F(k) рассчитываются средние значения для каждого подмножества Mk :
9. Определяется общее среднее (константа дискриминации) для дискриминантных функций:
10. Выполняется распределение объектов подмножества М 0 по обучающим подмножествам М 1 и М 2 , для чего по каждому объекту (i = 1, 2, 3) рассчитываются дискриминантные функции:
F 1 (0) =0,104743×55,451+2,046703×9,592+(-0,13635)×12,840=23,68661
F 2 (0) =0,104743×78,575+2,046703×11,727+(-0,13635)×15,535=30,11366
F 3 (0) =0,104743×98,353+2,046703×17,572+(-0,13635)×20,458=23,68661
Затем рассчитанные значения дискриминантных функций F (0) сравниваются с общей средней F =28,3556.
Поскольку , то i -й объект подмножества М 0 относят к подмножеству М 1 при> 0 и к подмножеству М 2 при <0. С учетом этого в данном примере предприятия 2 и 3 подмножества М 0 относятся к М 1 , а предприятие 1 относится к М 2 .
Если бы выполнялось условие , то объекты М 0 относились к подмножеству М 1 , при и к подмножеству М 2 в противном случае.
11. Оценку качества распределения новых объектов выполним путем сравнения с константой дискриминации F значений дискриминантных функций Fi ( k ) =обучающих подмножеств М 1 и М 2 . Поскольку для всех найденных значений выполняются неравенства, и , то можно предположить о правильном распределении объектов и уже существующих двух классах и верно выполненной классификации объектов подмножества М 0 .
3.2 Пример решения задачи дискриминантным анализом в системе STATISTICA
Исходя из данных по 10 странам (рис. 3.1), которые были выбраны и отнесены к соответствующим группам экспертным методом (по уровню медицинского обслуживания), необходимо по ряду показателей классифицировать еще две страны: Молдавия и Украина.
Исходными показателями послужили:
Х1 – Количество человек, приходящихся на одного врача;
Х2 – Смертность на 1000 человек;
Х3 – ВВП, рассчитанный по паритету покупательной способности на душу населения (млн. $);
Х4 – Расходы на здравоохранение на душу населения ($).
Уровень медицинского обслуживания стран подразделяется на:
- высокий;
- средний (удовлетворительный);
- низкий.
Кол-во чел. на 1 врача | Расх. на здрав. | ВВП | Смертность | Класс | |
Азербайджан | 256 | 99 | 3000 | 9,6 | низкий |
Армения | 198 | 152 | 3000 | 9,7 | низкий |
Белоруссия | 222 | 157 | 7500 | 14 | высокий |
Грузия | 182 | 152 | 4600 | 14,6 | удовлетворительный |
Казахстан | 265 | 154 | 5000 | 10,6 | удовлетворительный |
Киргизия | 301 | 118 | 2700 | 9,1 | низкий |
Россия | 235 | 159 | 7700 | 13,9 | высокий |
Таджикистан | 439 | 100 | 1140 | 8,6 | низкий |
Туркмения | 320 | 125 | 4300 | 9 | удовлетворительный |
Узбекистан | 299 | 116 | 2400 | 8 | низкий |
Рис. 3.1
Используя вкладку анализ, далее многомерный разведочный анализ, необходимо выбрать дискриминантный анализ. На экране появится панель модуля дискриминантный анализ, в котором вкладка переменные позволяет выбрать группирующую и независимые переменные. В данном случае группирующая переменная 5 (класс), а независимыми переменными выступят 1-4 (кол-во человек на 1 врача; расходы на здравоохранение; ВВП на душу населения; смертность).
В ходе вычислений системой получены результаты: