代码之家  ›  专栏  ›  技术社区  ›  rifqi affan maulana

使用lfw数据集进行数据训练时验证精度低

  •  0
  • rifqi affan maulana  · 技术社区  · 7 月前

    所以我训练了400个图像数据集标签,这些标签由大约900张图像组成,分为80%的训练和20%的验证。我在这里遵循tensorflow的指南( https://www.tensorflow.org/tutorials/images/transfer_learning_with_hub )

    这是我的数据集( https://drive.google.com/drive/folders/1yIEig6K3g3Y2gFudkE0ca64UzkQtsORA?usp=drive_link )

    这是使用MTCNN预处理的数据集

    我应该更改我的数据集吗?

    1 回复  |  直到 7 月前
        1
  •  0
  •   Ibram AI    7 月前

    根据我的经验,使用400个标签进行训练,每个标签只有900个图像,这意味着每个标签只有2-3个图像(我看到几个标签在训练数据集或测试数据集中只有一个图像),这对可建模的有效学习和泛化来说是一个相当大的挑战。

    即使你能以某种方式找到模型的完美微调,它仍然很有可能成为过度拟合的模型,这是糟糕模型的标志。它在训练中只记住几个图像,不学习重要特征。

    我的建议是:

    1. 收集更多数据,在人工智能中,拥有更多(*和高质量)的数据总是更可取的
    2. 减少标签,我不知道预训练模型中每个标签有多少数据,但最好有相似数量的数据来提供平衡的数据集组合
    3. 如果你在收集数据方面有问题,那么对图像进行增强,有几种增强选项,如饱和度变化、旋转、温度变化等。