Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?


Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Подготовка данных для See5





Построение деревьев решений – система See5/C5.0

Система See5/C5.0 (Windows 95/98/NT) http://www.rulequest.com предназначена для анализа больших баз данных, содержащих до сотни тысяч записей и до сотни числовых или номинальных полей. Результат работы See5 выражается в виде деревьев решений и множества if–then правил. Система проста в обращении и не требует от пользователя специфических знаний в области прикладной статистики. Стоимость See5 – $ 740, некоммерческая версия для обучения ограничена количеством анализируемых записей (до 200).

Проиллюстрируем процесс работы See5 на реальном примере из области медицинской диагностики. Исходные данные в рассматриваемом случае относятся к задаче дифференциальной диагностики заболеваний почек. Данные были получены в Российской медицинской академии /А. Н. Хитрова, 1996/.

Фрагмент исходных данных приведен в табл. 9.1. Это как раз тот вид данных, для обработки которых более всего подходит See5. Каждый объект (пациент) здесь принадлежит к одному из небольшого числа классов (здоров, множественные кисты, гидронефроз) и описывается 11 разнотипными признаками.

Задача See5 состоит в предсказании диагностического класса какого‑либо объекта по значениям его признаков. При этом, как мы увидим, See5 конструирует классификатор в виде дерева решений, которому, в свою очередь, может быть поставлено в соответствие некоторое множество логических правил.

Подготовка данных для See5

Каждой задаче, решаемой в системе See5, требуется присвоить свое собственное имя. Пусть в нашем случае это имя будет USR (UltraSonic Research). В процессе решения See5 использует и формирует несколько файлов с одинаковым именем и различными расширениями. Важно точно соблюдать правила записи имен и расширений (система различает строчные и прописные буквы). Кроме того, отметим, что See5 поддерживает только латинские шрифты.

Таблица 9. 1. Фрагмент исходных данных по дифференциальной диагностике заболеваний почек

Признак Объект 1 Объект 2 ...
Состояние почки diagnosis Множественные кисты Гидронефроз ...
Возраст пациента (число полных лет) Age     ...
Пол пациента Sex .Женщина (F) Мужчина(M) ...
Правая или левая почка LR Правая почка (R) Левая почка (L) ...
Длина почки (мм) Length     ...
Ширина почки (мм) Width     ...
Толщина почки (мм) Thickness     ...
Толщина паренхимы (мм) Thickpar     ...
Средняя скорость кровотока (см/сек) Speed 2,3   ...
Индекс резистентности Index 0,584 0,614 ...
Ускорение артериального потока в систолу (см/сек2) Accel     ...

Date: 2015-07-22; view: 1248; Нарушение авторских прав; Помощь в написании работы --> СЮДА...



mydocx.ru - 2015-2024 year. (0.007 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию