网络结构与前向传播 全连接 MLP · 加权求和 + 激活
输入层 x₁ x₂ x₃ 隐藏层 1 σ σ σ σ 隐藏层 2 σ σ σ σ 输出层 ŷ 单个神经元 · 两步计算 x₁ x₂ x₃ w₁ w₂ w₃ Σ +b ① s = b + Σ xᵢwᵢ σ a ② a = σ(s) 逐层重复「加权求和 + 激活」→ 输出预测;缺了非线性 σ,再多层也只等价于一层线性变换