训练三阶段 · 缩放法则 · 能力边界规模放大 → 幂律降损 → 预训练/微调/RLHF