代码之家  ›  专栏  ›  技术社区  ›  SunilS

如何在构建ml模型时使用有序的分类变量?

  •  -1
  • SunilS  · 技术社区  · 6 年前

    我正试图建立一个逻辑回归模型,我的许多特征已经排序分类变量。我认为虚拟变量可能没有用处,因为它用相等的权重处理每个类别。那么,我需要像对待数字一样对待有序的分类变量吗?

    提前谢谢。

    1 回复  |  直到 6 年前
        1
  •  1
  •   Deepak M    6 年前

    有序的分类值称为“ 依次的 “数据挖掘中一个值小于或大于另一个值的属性。可以将这些值视为标称值或连续值(数字)。 将其视为数字(连续)的一些利弊是:

    赞成的意见:

    • 这使您在选择分析和 保留排序中的信息。对很多人来说更重要 分析员,它允许您轻松地分析数据。

    欺骗:

    • 这种方法需要假设数值距离 每一组后续类别之间是相等的。否则 根据域的不同,可以使间隔变大。