Softmax 把 logits 变概率 · one-hot 标签 · 选对损失
原始分数 logits
指数化
e
zᵢ
Softmax 概率(和 = 1)
共用同一分母 → 改一个分数,全部概率都变
one-hot 真实标签
只有正确类=1,其余=0
预测=取最大概率所在位置 → 猫 ✓
损失函数怎么选?
回归任务(预测连续数值)
MSE 均方误差
L = (1/n) Σ ( f(xᵢ) − yᵢ )²
衡量预测偏离真实有多远
多分类任务(预测离散类别)
交叉熵 Cross-Entropy
C.E. = − Σ yᵢ · ln(ŷᵢ)
配 Softmax 概率 + one-hot 标签,对齐分布
Softmax 是模型输出的连续概率;one-hot 是真实标签的 0/1 表示;交叉熵把两者对齐
▶ 重播