Курсовая работа: Анализ деятельности кредитных организаций
Остальные главные компоненты определяются аналогичным способом.
Количество главных компонент равно количеству элементарных признаков.
Введем исходные данные в электронную таблицу STATGRAPHICS (48*8).
Анализ методом главных компонент состоит из нескольких этапов:
1) Необходимо получить данные о результатах анализа (таблица сводки) (рис.3)
рис.3 Сводка метода ГК
В Данной таблице содержится информация о результатах построения главных компонент: собственные значения главных компонент (eigenvalue ), упорядоченных по величине, процент дисперсии (percent of variance ), приходящейся на каждую выделенную главную компоненту, накопленный процент дисперсии (cumulative percentage ).
На основе полученных результатов можно седлать вывод о том, что первые 2 компоненты дают 80 процентов дисперсии, что достаточно для проведения анализа распределения компонентов в пространстве.
2) Далее проанализируем таблицу весов признаков (рис.4)
рис.4 Веса признаков в главных компонентах
Определим зависимость первой главной компоненты от признаков. Зависимость от того или иного признака определяется величиной признака.
Первая главная компонента в наибольшей степени зависит от 3 признаков:
объем кредитов, выданных физическим лицам, объем кредитов, выданных физическим лицам на покупку жилья, объем выданных ипотечных жилищных кредитов физическим лицам.
Ниже представлена проекция исследуемого множества на пространство трех ГК (рис.5).
рис.5 Проекция исследуемых объектов в пространство трех ГК
Из рис.5 видно, что исследуемая совокупность разделилась на три класса.
3) Определим значащие признаки в составе главных компонент по следующей формуле:
, где [wkj ] – подмножество, участвующих в названии весовых коэффициентов j - й компоненты,
[wj ] – все весовые коэффициенты j-й компоненты.
Ниже представлена таблица весовых коэффициентов первой ГК.
В соответствии с вышепредставленной формулой коэффициент информативности рассчитывается следующим образом:
= 0,8
Ки1 принадлежит интервалу [0,75,0,95], что говорит об определении ГК1 влиянием следующих признаков: объем выданных кредитов физическим лицам, объем кредитов, выданных физическим лицам на покупку жилья, объем выданных ипотечных жилищных кредитов физическим лицам.
4) Правило классификации на основе анализа методом главных компонент выглядит следующим образом:
ГК1 =объем выданных кредитов физическим лицам *0,49+ объем кредитов, выданных физическим лицам на покупку жилья *0,53+ объем выданных ипотечных жилищных кредитов физическим лицам *0, 52
Если объем выданных кредитов физическим лицам = малое, объем кредитов, выданных физическим лицам на покупку жилья = малое, объем выданных ипотечных жилищных кредитов физическим лицам =малое, объем выданных кредитов индивидуальным предпринимателям = малое, то класс = 1
Если объем выданных кредитов физическим лицам = среднее, объем кредитов, выданных физическим лицам на покупку жилья = среднее, объем выданных ипотечных жилищных кредитов физическим лицам = среднее, объем выданных кредитов индивидуальным предпринимателям = среднее, то класс = 2
Если объем выданных кредитов физическим лицам = большое, объем кредитов, выданных физическим лицам на покупку жилья = большое, объем выданных ипотечных жилищных кредитов физическим лицам = большое, объем выданных кредитов индивидуальным предпринимателям = большое, то класс = 3
В первый класс вошли объекты под номерами: 1-9, 11-17,19-28, 30-37, 39-42, 48,50,53,56.
Во второй класс вошли объекты под номерами: 42, 47, 51,38,52,55,45
В третий класс вошел один объект под номером: 10,18,29,43,46,49,54
2.2 Кластерный анализ
Кластерный анализ предназначен для разбиения множества объектов на заранее неизвестное или в редких случаях заданное количество групп (кластеров) на основании некоторого математического критерия качества классификации кластеризации.
Введем исходные данные в электронную таблицу Statgraphics. Первый этап анализа – построение дендрограммы. Нажать на кнопку «Graphical options » меню окна «Cluster Analysis », выбрать отображение в виде дендрограммы (Dendrogram ) и нажать ОК.
На дендрограмме видны три дерева. По вертикальной оси отложено расстояние для каждого шага работы агломеративного иерархического алгоритма кластеризации.На горизонтальной оси показаны наблюдения, скомбинированные в соответствии с проведенным анализом.
Поскольку на дендрограмме можно увидеть отчетливую картину трех группировок и имен наблюдений, вошедших в выделенные кластеры, то следовательно, для более подробного рассмотрения группировок следует задать их количество равным 3.
Введем исходные данные в электронную таблицу STATGRAPHICS (50*8).
Первый шаг анализа - построение дендрограммы для трех кластеров (рис.6). При построении необходимо учитывать виды расстояний: между объектами – «City-Block», между кластерами «Ward’sMethod».
рис.6 Трехкластерная дендрограмма
Второй шаг получение сводки кластерного анализа (рис.7).
рис.7 Сводка кластерного анализа
Данная сводка содержит информацию о числе кластеров, количестве объектов в каждом кластере и соответствующем проценте населенности.