大语言模型 导论 LLM = AI⊃ML⊃DL 最核心一层;本质是「逐 token 预测下一个词」的自回归生成
人工智能 AI 机器学习 ML 深度学习 DL 大模型LLM LLM 读入已写全部 吐出新 token 拼回末尾 每步只吐 1 个 token,再回头看全部已写内容 → 直到吐出 <EOS> 才算写完