![]() |
1
1
即使相同的符号被用于输入和输出,在每一端使用不同的表示也是完全可以接受的。交叉熵是两个概率分布的函数。在这种情况下,这两个分布是模型给出的SoftMax分布,以及“正确”字节上的点质量。 对于问题1,是的,这就是在输入和输出方面正在做的事情(尽管实现可能会被优化)。 要回答问题2,最常见的是在每个步骤形成SoftMax分布,然后从中进行采样。 |
![]() |
Ze0ruso · 做模型。eval()在代码中的位置有什么关系? 2 年前 |
![]() |
rkraaijveld · sklearn的Coef。线性回归为无 3 年前 |
![]() |
Adam · 如何在多个模型上并行运行PyTorch推理? 3 年前 |
![]() |
Ofek Nourian · 完全连通的简单自回归模型预测 3 年前 |