|
|
1
0
统计/机器学习中处理分类特征的主要方法是通过一种称为 one-hot encoding . 以以下数据为例:
假设你想根据给定病例的动物类型(观察/行/受试者等)预测结果(无论是什么)。这样做的方法是编码
在那里,基数的动物列
k
已编码到
k
新列指示给定值的特定类别/属性的存在或不存在
从那里,你可以使用任何你想根据(现在不同编码的)动物列预测结果的模型。但一定要将一只动物(一组)作为对照组从模型中剔除。在这种情况下,可以拟合逻辑回归模型
|
|
|
Chris · ROC公制in train(),插入符号包 7 年前 |
|
Hanjo Odendaal · 使用配方和插入符号预处理的差异 7 年前 |
|
|
mlevy · 插入符号中的折叠与训练错误 7 年前 |
|
|
onur öztornacı · 插入符号包中的数据分区和过度拟合 7 年前 |