Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?


Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Учет стоимости различных ошибок классификации





До сего момента, анализируя данные по ультразвуковой диагностике заболеваний, мы считали все виды ошибок классификации эквивалентными. Мы давали оценку качества построенного классификатора, просто подсчитывая общее число ошибок. Но в реальной жизни стоимость различных ошибок может быть разной. Например, если мы ошибочно сочтем здорового человека больным и направим его на дополнительное обследование, это будет не так страшно, как в случае ошибочного отнесения больного к группе здоровых. Соответственно, при оценке качества построенного дерева решений часто бывает необходимо вводить в анализ веса различных ошибок.

В системе See5 для учета стоимости различных ошибок классификации создается специальный файл *.costs. Он содержит строки следующего вида:

предсказанный класс, истинный класс: стоимость ошибки

где «стоимость ошибки» – неотрицательное действительное число.

Число строк, характеризующих комбинации «предсказанный класс – истинный класс», в этом файле может быть любым. Если стоимость какой‑либо ошибки не определена явно, то система назначает эту стоимость равной 1.

Предположим, что стоимость ошибочного отнесения больных почек к классу здоровых в нашем случае будет равна 10, а стоимость всех остальных видов ошибок равна 5. Тогда файл для учета различной стоимости ошибок USR.costs может выглядеть следующим образом:

| costs file for USR

1, 2: 10 | стоимость ошибочного отнесения класса 2 к классу 1

1, 3: 10 | стоимость ошибочного отнесения класса 3 к классу 1

2, 1: 5 | стоимость ошибочного отнесения класса 1 к классу 2

2, 3: 5 | стоимость ошибочного отнесения класса 3 к классу 2

3, 1: 5 | стоимость ошибочного отнесения класса 1 к классу 3

3, 2: 5 | стоимость ошибочного отнесения класса 2 к классу 3

Результаты обработки данных с разделением на обучающую и контрольную выборки (по 50 %) и с учетом стоимости различных ошибок приведены на рис. 9.9.

Для редактирования файла стоимости различных ошибок классификации следует его вызвать из меню Edit | costs file и внести необходимые изменения в автоматически инициализированном редакторе WordPad. Можно исключить учет стоимости ошибок, если поставить флажок Ignore costs file в окне диалога для задания параметров алгоритма построения деревьев решений (рис. 9.2).

 

Рис. 9. 9. Результаты классификации с учетом стоимости различных ошибок

Date: 2015-07-22; view: 448; Нарушение авторских прав; Помощь в написании работы --> СЮДА...



mydocx.ru - 2015-2024 year. (0.004 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию