大语言模型
导论
LLM = AI⊃ML⊃DL 最核心一层;本质是「逐 token 预测下一个词」的自回归生成
人工智能 AI
机器学习 ML
深度学习 DL
大模型
LLM
LLM
读入已写全部
吐出新 token
拼回末尾
每步只吐 1 个 token,再回头看全部已写内容
→ 直到吐出 <EOS> 才算写完
▶ 重播