网络结构与前向传播
全连接 MLP · 加权求和 + 激活
输入层
x₁
x₂
x₃
隐藏层 1
σ
σ
σ
σ
隐藏层 2
σ
σ
σ
σ
输出层
ŷ
单个神经元 · 两步计算
x₁
x₂
x₃
w₁
w₂
w₃
Σ
+b
① s = b + Σ xᵢwᵢ
σ
a
② a = σ(s)
逐层重复「加权求和 + 激活」→ 输出预测;缺了非线性 σ,再多层也只等价于一层线性变换
▶ 重播