Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?


Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Модули кластерного и дискриминантного анализа





 

Попытаемся классифицировать данные, для чего используем методы кластерного и дискриминантного анализа.

Для проведения кластерного анализа выберем 5 числовых переменных и пронормируем их.

1. Для начала возьмём 5 кластеров. Получаем следующие данные:

 

 

 

 

Таблица дисперсионного анализа указывает на то, что дополнительно можно исключить из анализа переменные "Среднемесячный расход" (т.к. 70,9 ненамного меньше 79,1) и "Возраст" (74,8>75,2)

 

Судя по графику, также можно попробовать разбить на 4, 3 или 2 кластера.

 

Сначала определим требуемое число кластеров, а затем будем удалять переменные (или смотреть сочетания этих параметров).

 

2. Рассмотрим 5 переменных и 4 кластера.

 

 

 

Получили хорошие данные по расстояниям между кластерами, единственное, небольшое расстояние между 4 и 3 кластером, что говорит о том, что надо попробовать разбить выборку на 3 кластера.

 

 

Опять из общей картины выбивается показатель "Возраст", а также уменьшилась разница между дисперсиями внутри классов и между классами.

 

На графике видим, что возможно соединение 3 и 4 кластера. Поэтому разбиваем данные на три кластера.

 

 

 

Получили 3 почти равноотстоящих друг от друга кластера.

 

 

Но уже явно не подходит переменная Возраст (F малое, а р значительно больше, чем 0,05), следовательно, эту переменную надо исключить из кластерного анализа..

На графике чётко просматриваются 3 кластера.

 

4. Исключим переменную "Возраст" и разобьём выборку на 3 кластера.

 

 

Получаем маленькие расстояния между 2 и 3 кластером.

 

 

На графике видим три различных кластера. Таки образом выбрано оптимальное число кластеров (3) и определен состав переменных, позволяющих наилучшим образом разделить кредитозаемщиков на группы однородности.







Date: 2015-08-15; view: 350; Нарушение авторских прав



mydocx.ru - 2015-2024 year. (0.007 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию