深度学习 2.0：Transformer 与大模型