Курсовая работа: Многомерный статистический анализ в системе SPSS
Рис. 8 Исходные данные
Требуется:
1) определить оптимальное количество кластеров для разбиения регионов на однородные группы по всем группировочным признакам одновременно;
2) провести классификацию областей иерархическим методом с алгоритмом межгрупповых связей и отобразить результаты в виде дендрограммы;
3) проанализировать основные приоритеты денежных расходов и сбережений в полученных кластерах;
4) сравнить полученную классификацию с результатами применения алгоритма внутригрупповых связей.
Выполнение:
1) Определить оптимальное количество кластеров для разбиения регионов на однородные группы по всем группировочным признакам одновременно;
Для определения оптимального количества кластеров нужно воспользоваться Иерархическим кластерным анализом и обратиться к таблице «Шаги агломерации» к столбцу «Коэффициенты».
Эти коэффициенты подразумевают расстояние между двумя кластерами, определенное на основании выбранной дистанционной меры (Евклидово расстояние). На том этапе, когда мера расстояния между двумя кластерами увеличивается скачкообразно, процесс объединения в новые кластеры необходимо остановить.
В итоге, оптимальным считается число кластеров, равное разности количества наблюдений (17) и номера шага (14),после которого коэффициент увеличивается скачкообразно. Таким образом, оптимальное количество кластеров равно 3. (Рис.9)
статистический математический анализ кластерный
Рис. 9 Таблица «Шаги агломерации»
2) Провести классификацию областей иерархическим методом с алгоритмом межгрупповых связей и отобразить результаты в виде дендрограммы;
Теперь, используя оптимальное количество кластеров, проводим классификацию областей иерархическим методом. И в выходных данных обращаемся к таблице «Принадлежность к кластерам». (Рис.10)
Рис. 10 Таблица «Принадлежность к кластерам»
На Рис. 10 отчетливо видно, что в 3 кластер попали 2 области (Калужская, Московская) и г. Москва, во 2 кластер две (Брянская, Воронежская, Ивановская, Липецкая, Орловская, Рязанская, Смоленская, Тамбовская, Тверская), в 1 кластер – Белгородская, Владимирская, Костромская, Курская, Тульская, Ярославская.
Рис. 11 Дендрограмма
3) проанализировать основные приоритеты денежных расходов и сбережений, в полученных кластерах;
Для анализа полученных кластеров нам нужно провести «Сравнение средних». В выходном окне выводится следующая таблица (Рис. 12)
Рис. 12 Средние значения переменных
В таблице «Средних значений» мы можем проследить, каким структурам отдается наибольший приоритет в распределении денежных расходов и сбережений населения.
В первую очередь стоит отметить, что самый высокий приоритет во всех областях отдается покупке товаров и оплате услуг. Большее значение параметр принимает в 3 кластере.
2 место занимает прирост финансовых активов. Наибольшее значение в 1 кластере.
Наименьший коэффициент в 1 и 2 кластерах у «приобретение недвижимости», а в 3 кластере выявлено заметное уменьшение денег на руках у населения.