Реферат: Классификация регионов РФ по доходам от услуг связи
После проведенного кластерного анализа было получено три дендрограммы. Наиболее точное разбиение на кластеры дает метод Варда, которая приведена ниже на рис. 2.1.1.
Рис 2.1.1
Рис 2.1.1 Дендрограмма метода Варда.
Проанализировав рисунок 2.1.1, можно прийти к выводу, что здесь наблюдается три кластера. Рассмотрим более подробно какие объекты принадлежат каждому из кластеров:
К первому кластеру относятся Сахалинская область, Республика Саха (Якутия) Хабаровский край, Приморский край, Челябинская область, Самарская область, Пермский край, Мурманская область, Республика Коми, Кемеровская область, Красноярский край, Алтайский край, Ростовская область, Республика Башкортостан, Волгоградская, Новосибирская, Томская и Воронежская области.
Во второе объединение включены Амурская область, Республика Хакасия, Иркутская область, Калининградская область, Тверская область, Волгоградская область, Архангельская область, Новгородская область, Республика Карелия, Смоленская область, Республика Мордовия, Псковская, Костромская, Ульяновская, Астраханская, Ярославская, Калужская, Саратовская, Пензенская область, Тульская, Рязанская, Владимирская области.
В третий кластер вошли Республика Алтай, Республика Адыгея, Забайкальский край, Кабардино-Балкарская Республика, Карачаево-Черкесская Республика, Республика Бурятия, Курская область, Республика Калмыкия, Чувашская Республика, Республика Марий Эл, Ивановская область, Республика Северная Осетия-Алания, Липецкая, Курганская, Кировская, Орловская, Брянская, Оренбургская, Тамбовская, Белгородская области и Удмуртская Республика.
Результаты, полученные методами ближнего и дальнего соседа, приведены на рисунках Приложения 4 . Причем, метод ближнего соседа не дал четкого разбиения данных на кластеры, а с помощью метода дальнего соседа мы получили всего 2 кластера. Очевидно, что более целесообразно использовать проанализированную выше дендрограмму метода Варда (рис.2.1.1).
2.2. Метод k -средних.
После того, как мы выяснили количество кластеров, можно использовать для дальнейшего анализа метод k-средних. Особенность метода k-средних состоит в том, что он строит k насколько можно различных кластеров. С помощью Евклидовой метрики и метода Варда мы получили разбиение на 3 объединения. Но я считаю, что более целесообразным будет разбить данные на 4 кластера.
Графическое изображение метода указано на рисунке 2.1.2, приведенном ниже. На нем представлены график средних значений каждого и 4х полученных кластеров.
Рис 2.2.1.
Рис 2.2.1. График средних для каждого кластера.
Определим принадлежность каждого из показателей к нужной группе и соответствующие расстояния до центра объединения. Соответствующие таблицы представлены в Приложении 5 в таблицах 1, 2, 3 и 4. Ниже представлена сводная таблица (табл.2.2.1) , в которой представлены все кластеры и расстояния.
Табл. 2.2.1
X1 | X2 | X3 | X4 | X5 | CASE_NO | CLUSTER | DISTANC | |
Белгородская область | -0,8131352 | 0,004701 | -0,2307317 | -0,4534437 | 0,2923749 | 1 | 1 | 0,46 |
Брянская область | -0,5913546 | -0,6507491 | -0,4627552 | -1,0226327 | -0,5713877 | 2 | 2 | 0,27 |
Владимирская область | -0,1888711 | -0,8146117 | -0,2686726 | 0,2366258 | -0,7135984 | 3 | 2 | 0,51 |
Воронежская область | 0,2590349 | 2,6265014 | 2,0493733 | -1,6559409 | -0,4880339 | 4 | 1 | 1,39 |
Ивановская область | -0,5783203 | -1,1112028 | -0,6918601 | 0,5398779 | -1,108734 | 5 | 2 | 0,57 |
Калужская область | 0,5040206 | 0,4618774 | -0,3066136 | 0,6423635 | -0,026406 | 6 | 3 | 0,29 |
Костромская область | -0,2101012 | 0,6667056 | -0,6736193 | 0,4931024 | -0,7718189 | 7 | 3 | 0,57 |
Курская область | -0,486389 | -1,4536755 | -0,5940892 | -0,4240119 | -0,1361659 | 8 | 2 | 0,37 |
Липецкая область | -0,0039223 | 1,1206048 | -0,4284624 | -1,0073912 | 0,1383929 | 9 | 1 | 0,59 |
Орловская область | -0,6052776 | -0,087062 | -0,5802262 | -0,5895655 | -0,6439247 | 10 | 2 | 0,44 |
Рязанская область | -0,3097347 | -0,4819707 | -0,4160586 | 0,5377756 | -0,1679804 | 11 | 3 | 0,40 |
Смоленская область | 0,2129211 | 1,4450526 | -0,5794965 | 1,2299473 | -0,1005337 | 12 | 3 | 0,63 |
Тамбовская область | -0,7343369 | 0,5274224 | -0,4985072 | -0,4655317 | -0,1864327 | 13 | 1 | 0,45 |
Тверская область | 1,6961655 | -0,694992 | -0,5532297 | 0,9734706 | -0,3127362 | 14 | 3 | 0,86 |
Тульская область | -0,122021 | 0,3094853 | -0,1687128 | -0,3199497 | -0,1431651 | 15 | 1 | 0,29 |
Ярославская область | 0,1330367 | 0,8059887 | -0,1169088 | 0,7874199 | 0,2379722 | 16 | 3 | 0,32 |
Республика Карелия | -0,5992542 | 1,1074958 | -0,3927103 | 0,8615249 | 0,1240764 | 17 | 3 | 0,53 |
К-во Просмотров: 162
Бесплатно скачать Реферат: Классификация регионов РФ по доходам от услуг связи
|