代码之家  ›  专栏  ›  技术社区  ›  Fractale

数据集不平衡时多类分类的最佳损失函数?

  •  2
  • Fractale  · 技术社区  · 7 年前

    我目前正在使用交叉熵损失函数,但对于不平衡数据集,性能不是很好。

    有更好的功能丧失吗?

    1 回复  |  直到 7 年前
        1
  •  11
  •   Shai    7 年前

    它是一个 主题广泛,但我想,你应该试试 focal loss :由 Tsung-Yi Lin, Priya Goyal, Ross Girshick, Kaiming He and Piotr Dollar 处理目标检测中的不平衡预测。自从引入以来,它也被用于分词。
    焦距损失的概念是在强调误差梯度的同时,减少损失和梯度,以便进行正确(或几乎正确)的预测。

    如图所示:
    enter image description here

    蓝色曲线是规则的交叉熵损失:一方面,即使分类良好的例子,它也有不可忽略的损失和梯度;另一方面,对于分类错误的例子,它有较弱的梯度。