边界框定位与损失函数 · 预测 → 逼近真值
检测画面(猫)
真值 GT · 猫
预测 Pred
Loss = 红绿数字的距离
预测向量 = 置信度(1) + 位置(4) + 类别(n)
① 位置 (x, y, w, h) —— 回归·比距离
x
y
w
h
真值
.18
.49
.28
.30
预测
.70
.20
.12
.08
② 类别得分 —— 分类·比 one-hot
猫
狗
鸟
车
one-hot
1
0
0
0
预测
.12
.45
.15
.28
“猫”得分 0.12 → 0.99
总损失 L = L
reg
+ L
cls
高
① 初始预测:框偏、类别错 → 损失大
▶ 重播