Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?


Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Построение дерева решений





На первом этапе обработки данных обычно используются опции системы, установленные по умолчанию. Нажимаем кнопку Construct Classifier и затем в появившемся окне диалога (рис. 9.2) сразу нажимаем OK (предполагается, что файл данных USR.data уже загружен). Система выдает окно результатов, которые выглядят следующим образом (рис. 9.3).

Рис. 9. 2. Окно диалога для задания опций алгоритма конструирования классификатора

Рис. 9. 3. Результы построения начального дерева решений

В первой строке отчета о результатах дается информация об используемой версии системы See5 и текущее время. Затем в следующих двух строках говорится о том, что классифицирующей переменной служит diagnosis и прочтенный файл данных USR.data содержит 74 объекта, каждый из которых описан 11 признаками.

В следующих строках отчета отображено построенное дерево решений. Его можно проинтерпретировать следующим образом:

ЕСЛИ Index больше 0.69 и Speed больше 18 ТО класс № 3, иначе

ЕСЛИ Index больше 0.69 и Speed не больше 18 и Thickness не больше 46 ТО класс № 1 и т. д.

Каждая ветка дерева заканчивается указанием номера класса, к которому она приводит. Сразу за номером следует запись вида (n) или (n/m). Например, самая первая ветка заканчивается записью (12.0). Это означает, что данной ветке соответствует 12 объектов из определенного (третьего) класса. Последняя ветка заканчивается записью 1 (6.0/1.0), из чего следует, что эта ветка описывает класс № 1 и сюда попадает 6 объектов, из которых 1 попадает ошибочно. Величины n или m могут оказаться дробными в случае, когда на какую‑либо ветку придется некоторое число объектов с неизвестными значениями признаков.

В следующем разделе отчета приводятся характеристики сконструированного классификатора, оцениваемые на обучающей выборке. Здесь мы видим, что построенное дерево решений имеет 9 веток (size = 9), а ошибка классификации наблюдается на 5 объектах, что составляет 6,8 %.

В завершающей части отчета дается таблица с детальным разбором результатов классификации. Исходя из данных этой таблицы, можно сказать, что из 1‑го класса (здоровые почки) правильно классифицируется 20 объектов, а 2 объекта ошибочно относятся к классу 2; среди объектов 2‑го класса (множественные кисты) 35 диагностируются правильно и 2 ошибочно признаются здоровыми; все объекты 3‑го класса (гидронефроз) классифицируются правильно за исключение одного объекта, попадающего в класс № 2.

В заключение система See5 выдает сообщение о затраченном на решение времени. В нашем случае оно составило 0,5 с. Здесь надо отметить вообще очень высокую скорость работы алгоритма See5, позволяющую оперативно обрабатывать высокоразмерные массивы информации, содержащие тысячи и десятки тысяч записей.

Можно еще более подробно разобрать результаты нашей классификации. Для этого нажмем в главном окне See5 кнопку Cross-Reference (перекрестная ссылка). Система выдаст окно, в левой половине которого нарисовано построенное дерево решений, а в правой половине перечисляются объекты, попавшие на ту или иную ветвь дерева. Чтобы выделить интересующую ветвь нужно щелкнуть по ней левой кнопкой мыши (справа от ветви появится темный круг – на рис. 9.4 на него указывает стрелка). Кроме того, если щелкнуть мышью по номеру какого‑либо объекта из правого поля, то система выдаст еще одно окно с именем Case, в котором приводятся значения признаков и выделенного объекта. В случае, показанном на Рис. 9.3., нас заинтересовала ветвь (Index <= 0.69 и Age <= 43), на которой находится 10 объектов из 1‑го класса и 1 объект из 2‑го класса.

Рис. 9. 4. Отображение результатов классификации в окне перекрестных ссылок

Date: 2015-07-22; view: 765; Нарушение авторских прав; Помощь в написании работы --> СЮДА...



mydocx.ru - 2015-2024 year. (0.007 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию