![]() |
1
4
这种方法很简单 影响编码 分类变量。 如果您的分类列具有类别{C1、C2、C3、…},然后按如下方式进行碰撞编码:
在训练期间,对于每个类别(Ci),它计算平均输出(给定该类别,即后验概率)与因变量的总体期望值(先验)之间的差值。有关影响编码的更多参考,请参阅本文 https://arxiv.org/abs/1611.09477v3 (第10页) 在测试阶段,为了将测试数据的分类变量转换为其影响代码,它使用了与训练数据相同的预期值“y”。因为这是一个期望值,所以训练数据的样本数是否比测试数据多并不重要(只要“y”在两个数据集中的分布相似)。 |
![]() |
Morph3us · 我如何确定谁将赢得罗马尼亚下一届预选赛?[关闭] 7 月前 |
![]() |
explorer · AWS SageMaker项目模板创建失败 11 月前 |
|
me0076 · 使用LLM提取多个实体 1 年前 |
![]() |
Chinmaya Tewari · 创建新csv文件时权限被拒绝 1 年前 |
![]() |
Seán Healy · LSTM或变压器模型是否有任何可逆实现? 1 年前 |