Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?


Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Файл имен переменных





Для работы See5 самыми необходимыми и существенными являются два файла – имен переменных и данных. В файле имен переменных с расширением *.names даются названия используемых признаков и классов.

Среди признаков различают две важные подгруппы:

номинальные признаки (discrete attribute), количественные признаки (continuous attribute) и метки;

явно определенные признаки, значения которых берутся непосредственно из файла данных, и неявно определенные признаки, задаваемые формулами (чаще всего употребляются явно определенные признаки).

Файл имен переменных USR.names в нашей задаче выглядит следующим образом:

diagnosis. | the target attribute

diagnosis: 1, 2, 3

Age: continuous

Sex: F, M

LR: L, R

Length: continuous

Width: continuous

Thickness: continuous

Thickpar: continuous

Speed: continuous

Index: continuous

Accel: continuous

Целевой признак diagnosis принимает три значения: 1 – в классе «здоровая почка»; 2 – в классе «множественные кисты» и 3 – в классе «гидронефроз». Признаки Age (возраст), Length (длина почки), Width (ширина почки), Thickness (толщина почки), Thickpar (толщина паренхимы), Speed (средняя скорость кровотока), Index (индекс резистентности), и Accel (ускорение артериального потока в систолу) являются количественными. Признак Sex (пол пациента) может иметь два значения F (female) и M (male), а признак LR (левая или правая почка) принимает значения L или R. Порядок записи имен переменных должен соответствовать их порядку в файле данных.

При подготовке файла имен переменных следует иметь в виду, что пробелы, пустые строки и знаки табуляции игнорируются системой (кроме, конечно случаев, когда они применяются в именах переменных). Вертикальная черта ‘|’ предназначена для записи напоминаний или комментариев.

После имени каждой явно определенной переменной вставляется двоеточие ‘:’, а затем следует характеристика этой переменной. Возможные следующие характеристики:

- continuous – количественный признак;

- список значений переменной, разделенных запятой (для дискретной, номинальной переменной);

- максимальное значение N для дискретной переменной (эту характеристику рекомендуется применять очень осторожно, так как здесь исключается дополнительная проверка данных при их вводе в анализ);

- ignore – для признака, исключаемого из анализа;

- label – метка для идентификации отдельного объекта.

После имени каждой неявно определенной переменной также следует двоеточие и далее записывается формула. В формуле используются где необходимо скобки, а дискретные признаки ограничиваются кавычками. Ниже приведены доступные операторы.

- +, -, *, /, % (mod), ^ (возведение в степень)

- >, >=, <, <=, =, <> или!= (не равно)

- and, or

- sin(...), cos(...), tan(...), log(...), exp(...), int(...) (целая часть от)

В зависимости от применяемой формулы конечный результат может быть как количественным, так и давать логическое значение true/false.

Date: 2015-07-22; view: 731; Нарушение авторских прав; Помощь в написании работы --> СЮДА...



mydocx.ru - 2015-2024 year. (0.006 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию