Полезное:
Как сделать разговор полезным и приятным
Как сделать объемную звезду своими руками
Как сделать то, что делать не хочется?
Как сделать погремушку
Как сделать так чтобы женщины сами знакомились с вами
Как сделать идею коммерческой
Как сделать хорошую растяжку ног?
Как сделать наш разум здоровым?
Как сделать, чтобы люди обманывали меньше
Вопрос 4. Как сделать так, чтобы вас уважали и ценили?
Как сделать лучше себе и другим людям
Как сделать свидание интересным?
Категории:
АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника
|
Модули кластерного и дискриминантного анализа
Попытаемся классифицировать данные, для чего используем методы кластерного и дискриминантного анализа. Для проведения кластерного анализа выберем 5 числовых переменных и пронормируем их. 1. Для начала возьмём 5 кластеров. Получаем следующие данные:
Таблица дисперсионного анализа указывает на то, что дополнительно можно исключить из анализа переменные "Среднемесячный расход" (т.к. 70,9 ненамного меньше 79,1) и "Возраст" (74,8>75,2)
Судя по графику, также можно попробовать разбить на 4, 3 или 2 кластера.
Сначала определим требуемое число кластеров, а затем будем удалять переменные (или смотреть сочетания этих параметров).
2. Рассмотрим 5 переменных и 4 кластера.
Получили хорошие данные по расстояниям между кластерами, единственное, небольшое расстояние между 4 и 3 кластером, что говорит о том, что надо попробовать разбить выборку на 3 кластера.
Опять из общей картины выбивается показатель "Возраст", а также уменьшилась разница между дисперсиями внутри классов и между классами.
На графике видим, что возможно соединение 3 и 4 кластера. Поэтому разбиваем данные на три кластера.
Получили 3 почти равноотстоящих друг от друга кластера.
Но уже явно не подходит переменная Возраст (F малое, а р значительно больше, чем 0,05), следовательно, эту переменную надо исключить из кластерного анализа.. На графике чётко просматриваются 3 кластера.
4. Исключим переменную "Возраст" и разобьём выборку на 3 кластера.
Получаем маленькие расстояния между 2 и 3 кластером.
На графике видим три различных кластера. Таки образом выбрано оптимальное число кластеров (3) и определен состав переменных, позволяющих наилучшим образом разделить кредитозаемщиков на группы однородности. Date: 2015-08-15; view: 350; Нарушение авторских прав |