Дискриминантный анализ. Проведем дискриминантный анализ, используя в качестве группирующей переменной номера кластеров для каждого кредитозаемщика
Проведем дискриминантный анализ, используя в качестве группирующей переменной номера кластеров для каждого кредитозаемщика, полученные посредством кластерного анализа. Из таблицы результатов следует, что переменную возраст надо исключить, так как р значительно больше, чем 0,05.

После реализации программы дополнительно пришлось исключить также и переменную сумма кредита. При этом лямбда Уилкса достигла своего минимального (из всех реализаций модуля) значения - 0,149.

На рис. представлен график рассеяния канонических корней.

Наибольший вес при дискриминации имеет переменная Стоимость кредита, так как лямбда Уилкса будет равна 0,44, если исключить эту переменную из процедуры дискриминации, наименьший – переменная Среднемесячный расход, так как Лямбда Уилкса будет равна всего 0,158.
Критерий Chi-Square показывает, что надо рассматривать только два канонических корня, т.е. использовать две дискриминантные функции


Таблица средних значений показывает, что первая каноническая функция лучше всего выделяет первый кластер. Вторая – третий кластер.

Матрица классификации свидетельствует о том, что вторая группа клиентов была классифицирована корректно на 100%, первая - на 93%, а третья - 54%. 3 представителя первой группы и 5 из третьей группы были ошибочно отнесены ко второй группе, и один клиент из 3й группы - в 1-ю.

По таблице классификации наблюдений можно посмотреть, какие наблюдения классифицированы неверно, например это №27, 45, 57, 68, 76, 84, 99, 103, 136. Неверно классифицированные наблюдения помечены *. Аналогичную информацию можно получить из таблицы апостериорных вероятностей. Наблюдение отнесено программой к тому классу для которого апостериорная вероятность больше.

Date: 2015-08-15; view: 820; Нарушение авторских прав Понравилась страница? Лайкни для друзей: |
|
|