代码之家  ›  专栏  ›  技术社区  ›  DouHuanmin

除了使用Tanh()函数外,还有什么规则可以用来将嵌入向量约束在(-1,1)的范围内吗?

  •  0
  • DouHuanmin  · 技术社区  · 1 年前

    我发现我的想法的性能很差,嵌入维度很高。我认为这个问题与激活功能有关。你能帮帮我吗? 我试图用arctan()替换tanh(),但效果仍然很差,有什么好的策略吗? enter image description here

    1 回复  |  直到 1 年前
        1
  •  0
  •   Chih-Hao Liu    1 年前

    您可以使用各种类型的激活函数,激活函数的选择取决于您的目标任务。

    在许多情况下,通常使用ReLU或Leaky ReLU函数。有关激活功能的更多详细信息和基准测试,您可以参考论文: Activation Functions in Deep Learning: A Comprehensive Survey and Benchmark

    enter image description here

    要实现这些激活功能,您可以导航到 PyTorch nn module