深度学习 1.0 · 三大经典架构
① CNN 卷积 · 图像
② RNN 循环 · 序列
③ GAN 对抗 · 生成
Input 图像
Conv
卷积
提局部特征
Pool
下采样
FC
分类
边缘 → 纹理 →
部件 →
物体 → 类别
里程碑:LeNet → AlexNet → ResNet → YOLO
ResNet 关键 = 残差学习 + 跳连,让网络做到极深
x
F(x)
+
relu( F(x) + x )
x 跳连直达(shortcut)
隐藏状态 h 沿时间步横向传递,处理序列
情感:褒义
Many-to-one
Many-to-many · 语音识别
逐帧输出有重复,CTC 用空白符 ∅ 对齐并折叠
你
你
∅
好
好
你 好
折叠重复 · 消歧义
z
N(0,1)
噪声
生成器 G
努力造假图
假图 x̂
真图
判别器 D
辨真 / 假
真 ? 假 ?
对抗博弈 → G 学会模拟真实数据分布
▶ 重播