代码之家  ›  专栏  ›  技术社区  ›  haxtar

训练损失减少,开发损失增加

  •  1
  • haxtar  · 技术社区  · 7 年前

        两种情况下,

      1. BLUE line表示训练集性能的摘要。
      2. 损失:

        • 提前停止 :这似乎是最直观的,但损失图似乎表明损失水平只有在dev set loss is observed中出现分歧后才会出现;此提前停止的起始点,那么,似乎不容易决定。
          • 如果在损失和准确度中观察到的模式确实表明过度拟合,有没有其他方法来抵消我没有考虑过的过度拟合?
            1. 训练精度随着步数的增加而提高,而开发精度则随着步数的增加而降低。

            下图说明了培训步骤数量的损失和准确性。

            • 这个 行表示dev set性能的摘要。

            Loss

            enter image description here

            • 添加L2正则化
            • 交叉验证 this

            1. 如果在损失和准确度中观察到的模式确实表明过度拟合,有没有其他方法来抵消我没有考虑过的过度拟合?

            谢谢——任何见解都会受到赞赏。

    1 回复  |  直到 7 年前
        1
  •  3
  •   Jeremy Bare    7 年前