Курсовая работа: Многомерный статистический анализ в системе SPSS

Рис. 8 Исходные данные

Требуется:

1) определить оптимальное количество кластеров для разбиения регионов на однородные группы по всем группировочным признакам одновременно;

2) провести классификацию областей иерархическим методом с алгоритмом межгрупповых связей и отобразить результаты в виде дендрограммы;

3) проанализировать основные приоритеты денежных расходов и сбережений в полученных кластерах;

4) сравнить полученную классификацию с результатами применения алгоритма внутригрупповых связей.

Выполнение:

1) Определить оптимальное количество кластеров для разбиения регионов на однородные группы по всем группировочным признакам одновременно;

Для определения оптимального количества кластеров нужно воспользоваться Иерархическим кластерным анализом и обратиться к таблице «Шаги агломерации» к столбцу «Коэффициенты».

Эти коэффициенты подразумевают расстояние между двумя кластерами, определенное на основании выбранной дистанционной меры (Евклидово расстояние). На том этапе, когда мера расстояния между двумя кластерами увеличивается скачкообразно, процесс объединения в новые кластеры необходимо остановить.

В итоге, оптимальным считается число кластеров, равное разности количества наблюдений (17) и номера шага (14),после которого коэффициент увеличивается скачкообразно. Таким образом, оптимальное количество кластеров равно 3. (Рис.9)

статистический математический анализ кластерный

Рис. 9 Таблица «Шаги агломерации»

2) Провести классификацию областей иерархическим методом с алгоритмом межгрупповых связей и отобразить результаты в виде дендрограммы;

Теперь, используя оптимальное количество кластеров, проводим классификацию областей иерархическим методом. И в выходных данных обращаемся к таблице «Принадлежность к кластерам». (Рис.10)


Рис. 10 Таблица «Принадлежность к кластерам»

На Рис. 10 отчетливо видно, что в 3 кластер попали 2 области (Калужская, Московская) и г. Москва, во 2 кластер две (Брянская, Воронежская, Ивановская, Липецкая, Орловская, Рязанская, Смоленская, Тамбовская, Тверская), в 1 кластер – Белгородская, Владимирская, Костромская, Курская, Тульская, Ярославская.


Рис. 11 Дендрограмма

3) проанализировать основные приоритеты денежных расходов и сбережений, в полученных кластерах;

Для анализа полученных кластеров нам нужно провести «Сравнение средних». В выходном окне выводится следующая таблица (Рис. 12)

Рис. 12 Средние значения переменных

В таблице «Средних значений» мы можем проследить, каким структурам отдается наибольший приоритет в распределении денежных расходов и сбережений населения.

В первую очередь стоит отметить, что самый высокий приоритет во всех областях отдается покупке товаров и оплате услуг. Большее значение параметр принимает в 3 кластере.

2 место занимает прирост финансовых активов. Наибольшее значение в 1 кластере.

Наименьший коэффициент в 1 и 2 кластерах у «приобретение недвижимости», а в 3 кластере выявлено заметное уменьшение денег на руках у населения.

К-во Просмотров: 580
Бесплатно скачать Курсовая работа: Многомерный статистический анализ в системе SPSS