激活函数 阶跃 · Sigmoid · ReLU · 引入非线性
阶跃函数(弃用) 1 0 处不可导 ✗ Sigmoid(输出层 / 二分类) 1 0 σ(z)=1/(1+e⁻ᶻ) · 压缩到 (0,1) ReLU(隐藏层首选) 0 max(0, z) · 正半轴导数恒 1 负区→0 (Dead) Sigmoid 导数 σ′(z)=σ(z)(1−σ(z)) — 钟形,峰值仅 0.25 0.25 0 饱和区 ≈ 0 饱和区 ≈ 0 越乘越小 → 梯度消失 所以深层隐藏层改用 ReLU