Softmax 把 logits 变概率 · one-hot 标签 · 选对损失 原始分数 logits 指数化 ezᵢ Softmax 概率(和 = 1) 共用同一分母 → 改一个分数,全部概率都变 one-hot 真实标签 只有正确类=1,其余=0 预测=取最大概率所在位置 → 猫 ✓ 损失函数怎么选? 回归任务(预测连续数值) MSE 均方误差 L = (1/n) Σ ( f(xᵢ) − yᵢ )² 衡量预测偏离真实有多远 多分类任务(预测离散类别) 交叉熵 Cross-Entropy C.E. = − Σ yᵢ · ln(ŷᵢ) 配 Softmax 概率 + one-hot 标签,对齐分布 Softmax 是模型输出的连续概率;one-hot 是真实标签的 0/1 表示;交叉熵把两者对齐