|
1
4
这不太对。这些细胞对应于图像的一个分区,如果一个物体的中心位于该分区内,神经元就学会了响应。 但是, 感受野 这些输出神经元比细胞大得多,实际上覆盖了整个图像。因此,它能够识别并在比指定的“中心单元”大得多的对象周围绘制边界框。 因此,一个细胞集中在输出神经元的接收场的中心,但它是一个小得多的部分。它也有点武断,例如,人们可以想象有重叠的细胞——在这种情况下,当一个物体位于其细胞重叠区域的中心时,你会期望相邻的神经元同时开火。 |
|
|
2
0
锚定可以具有任意大小和纵横比,与网格大小无关。如果您的数据集主要有大的前景对象,那么您应该初始化锚定为大的。如果只需要对锚进行小的调整,Yolo就会学得更好。 每个预测实际上使用来自整个图像的信息。通常来自图像其余部分的上下文有助于预测。例如,车辆下方的黑色像素可能是轮胎或阴影。 该算法并不真正“知道”对象中心所在的单元。但在训练过程中,我们掌握了来自地面真相的信息,我们可以训练它去猜测。经过足够的训练,它最终非常擅长猜测。工作的方式是将最接近地面的锚定指定给对象。其他定位点被分配给其他对象或背景。分配给背景的锚应该具有较低的置信度,而分配给对象的锚则被评估为其边界框的IOU。因此,训练会强化一个锚来提供高信心和准确的边界框,而其他锚则会提供低信心。你问题中的例子不包括任何低置信度的预测(可能是为了保持简单),但实际上,低置信度的预测比高置信度的预测要多得多。 |
|
|
Hui Liu · 为什么在透视投影过程中需要使用齐次坐标作为相机/世界坐标? 10 月前 |
|
|
Flush · 如何在计算机视觉的多类分类任务中分割数据集? 1 年前 |
|
|
fampkin · 下载Yolov8.Net时出现问题 2 年前 |