Полезное:
Как сделать разговор полезным и приятным
Как сделать объемную звезду своими руками
Как сделать то, что делать не хочется?
Как сделать погремушку
Как сделать так чтобы женщины сами знакомились с вами
Как сделать идею коммерческой
Как сделать хорошую растяжку ног?
Как сделать наш разум здоровым?
Как сделать, чтобы люди обманывали меньше
Вопрос 4. Как сделать так, чтобы вас уважали и ценили?
Как сделать лучше себе и другим людям
Как сделать свидание интересным?
Категории:
АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника
|
Файл имен переменныхДля работы See5 самыми необходимыми и существенными являются два файла – имен переменных и данных. В файле имен переменных с расширением *.names даются названия используемых признаков и классов. Среди признаков различают две важные подгруппы: номинальные признаки (discrete attribute), количественные признаки (continuous attribute) и метки; явно определенные признаки, значения которых берутся непосредственно из файла данных, и неявно определенные признаки, задаваемые формулами (чаще всего употребляются явно определенные признаки). Файл имен переменных USR.names в нашей задаче выглядит следующим образом: diagnosis. | the target attribute diagnosis: 1, 2, 3 Age: continuous Sex: F, M LR: L, R Length: continuous Width: continuous Thickness: continuous Thickpar: continuous Speed: continuous Index: continuous Accel: continuous Целевой признак diagnosis принимает три значения: 1 – в классе «здоровая почка»; 2 – в классе «множественные кисты» и 3 – в классе «гидронефроз». Признаки Age (возраст), Length (длина почки), Width (ширина почки), Thickness (толщина почки), Thickpar (толщина паренхимы), Speed (средняя скорость кровотока), Index (индекс резистентности), и Accel (ускорение артериального потока в систолу) являются количественными. Признак Sex (пол пациента) может иметь два значения F (female) и M (male), а признак LR (левая или правая почка) принимает значения L или R. Порядок записи имен переменных должен соответствовать их порядку в файле данных. При подготовке файла имен переменных следует иметь в виду, что пробелы, пустые строки и знаки табуляции игнорируются системой (кроме, конечно случаев, когда они применяются в именах переменных). Вертикальная черта ‘|’ предназначена для записи напоминаний или комментариев. После имени каждой явно определенной переменной вставляется двоеточие ‘:’, а затем следует характеристика этой переменной. Возможные следующие характеристики: - continuous – количественный признак; - список значений переменной, разделенных запятой (для дискретной, номинальной переменной); - максимальное значение N для дискретной переменной (эту характеристику рекомендуется применять очень осторожно, так как здесь исключается дополнительная проверка данных при их вводе в анализ); - ignore – для признака, исключаемого из анализа; - label – метка для идентификации отдельного объекта. После имени каждой неявно определенной переменной также следует двоеточие и далее записывается формула. В формуле используются где необходимо скобки, а дискретные признаки ограничиваются кавычками. Ниже приведены доступные операторы. - +, -, *, /, % (mod), ^ (возведение в степень) - >, >=, <, <=, =, <> или!= (не равно) - and, or - sin(...), cos(...), tan(...), log(...), exp(...), int(...) (целая часть от) В зависимости от применяемой формулы конечный результат может быть как количественным, так и давать логическое значение true/false.
|