Реферат: Социальные различия имущественной обеспеченности населения в российских регионах
«Расстояние между окончательными кластерными центрами»
Кластер | 1 | 2 | 3 | 4 | 5 | 6 |
1 | 3,014 | 1,627 | 3,529 | 2,584 | 2,607 | |
2 | 3,014 | 1,774 | 1,804 | 2,578 | 4,928 | |
3 | 1,627 | 1,774 | 2,990 | 2,850 | 3,470 | |
4 | 3,529 | 1,804 | 2,990 | 2,120 | 5,665 | |
5 | 2,584 | 2,578 | 2,850 | 2,120 | 4,737 | |
6 | 2,607 | 4,928 | 3,470 | 5,665 | 4,737 |
В этой таблице показаны расстояния между кластерными центрами. На основании сопоставления данной таблицы со средними расстояниями в каждом из кластеров можно сделать вывод, насколько кластеры обособленны.
Таблица 11 «Значимость переменных при разбиении на 6 кластеров»
Sig. | |
zFond | ,000 |
zSdohod | ,000 |
zSzarplata | ,000 |
zSpensii | ,000 |
zChislMin | ,000 |
Из таблицы дисперсионного анализа можно проанализировать результаты кластеризации, оценив значимость всех переменных. Значимость всех переменных получилась удовлетворительной по уровню 0.05, это говорит о том, что все переменные оказывают достаточно сильное влияние на результаты кластеризации.
Вероятнее всего, явных кластеров в пространстве наших переменных не существует. Учитывая, что многие из исходных переменных имели распределение, близкое к нормальному, скорее всего, рабочая модель распределения регионов в социально-экономическом пространстве выглядит как общероссийский центр с основной массой регионов с характеристиками, близкими к среднероссийскому уровню и небольшое количество «периферийных» регионов, чья структура в силу особенностей конкретного региона заметно отличается от среднероссийской.
Это значит, что можно предложить другие, равнозначные варианты группировки. Разделить на другое количество кластеров, использовать другие показатели или их комбинации и т.д.
Выводы
В результате проделанной работы удалось обобщить и проанализировать исходные данные по социально-экономическому положению регионов РФ по состоянию на конец 2004 года. Был выбран метод проведения исследования и построения статистической модели. На основе иерархического кластерного анализа были сделаны предварительные выводы о возможном разбиении на кластеры. Окончательная кластеризация проведена с помощью метода k-средних.
В полученной 6-кластерной модели обнаружены значительные различия в социальном и экономическом развитии регионов, попавших в разные кластеры. Особенности каждого кластера были рассмотрены, также были предложены возможные причины данных особенностей. Был получен один большой кластер, отражающий характерное в среднем положение регионов по России, а также 5 более мелких, менее характерных для России кластера.
В работе удалось обнаружить, что большинство регионов находится в положении близком к среднему по всей России, и лишь небольшая часть регионов сильно отличается от средних показателей. В основном это было заметно на бедных регионах Кавказа и богатых регионов центральной части РФ. Примером может послужить Москва постоянно отделявшаяся в обособленный кластер.
Тем не менее, полученная группировка регионов может быть использована в дальнейшем. Ее можно верифицировать на более поздних данных. Если изменений мало, значит полученная классификация хотя и являлась одной из многих возможных, но всё-таки не случайна.
В работе использовались данные Росстата за 2004 год, которые к настоящему моменту уже несколько устарели. На веб-сайте Госкомстата [3] уже имеются данные о начисленных пенсиях, зарплатах и прожиточном минимуме даже за 2006 год, однако не все исследованы показатели даны в разрезе по регионам (например, индекс Джини или коэффициент фондов даны только в целом по России). Но если запастись свежим статистическим сборником (имеется аналогичный сборник 2006 года), например, то можно построить аналогичную модель по новым данным и сравнить. Возможно, ситуация осталась такой же, возможно появились какие-то изме?