边界框定位与损失函数 · 预测 → 逼近真值
检测画面(猫) 真值 GT · 猫 预测 Pred Loss = 红绿数字的距离 预测向量 = 置信度(1) + 位置(4) + 类别(n) ① 位置 (x, y, w, h) —— 回归·比距离 x y w h 真值 .18 .49 .28 .30 预测 .70 .20 .12 .08 ② 类别得分 —— 分类·比 one-hot one-hot 1 0 0 0 预测 .12 .45 .15 .28 “猫”得分 0.12 → 0.99 总损失 L = Lreg + Lcls ① 初始预测:框偏、类别错 → 损失大
▶ 重播