杨植林：AI 训练真的进入“第三阶段”了吗？

2026 年 3 月 25 日，中关村论坛年会上，Moonshot 的杨植林抛出了一个挺炸裂的观点：大模型训练已经正式进入了由 AI 主导的“第三阶段”。

听起来很宏大，对吧？所谓的“范式转移”，就是大模型不再单纯依赖“自然数据 + 人工标注”，而是进化成了“高度自动化的自我演进”。

为了把这事说清楚，杨植林把整个过程拆解成了三个阶段：

第一阶段（约 3 年前）：还是老样子，靠吃互联网上的海量数据，再让一堆人费老劲去标注、微调价值观。
第二阶段（去年，即 2025 年）：引入了大规模强化学习（RL）。虽然还是研究人员在干活，但得他们手动挑那些高质量的任务，通过奖励机制去“哄”模型变强。
第三阶段（2026 年及以后）：这才是重点。研究人员退居二线，变成了"AI 算力调度者”。具体活计全交给 AI 了：它自己生成测试任务、自己搭建环境、甚至自己琢磨新的网络架构。

说真的，读到“根本性变革”这几个字时，我心里多少有点打鼓。

以前我们是手把手教 AI，现在变成了 AI 自己教自己？这听起来既让人兴奋，又有点不安。

具体到技术上，这次“进化”主要体现在三件事上：

如果这真能落地，研究人员的角色确实变了，从“训练者”变成了负责分配算力的“调度者”。

不过，关于“行业影响与未来展望”那部分，我有点忍不住想吐槽一下，那种“指数级加速”、“战略协同”、“迈向 AGI"的排比句，读起来太像标准的公关通稿了。

杨植林确实提到了 Moonshot 的布局：Kimi 要继续拓展边界，还要搞一个基于开源社区的“协同演进技术生态系统”。最后，他把这一切拔高到了“通往 AGI 的关键里程碑”，说这是从“人类教 AI"到"AI 指导研发”的质变，标志着 AI 从“被动学习”迈向了“自主探索”。

说实话，听到“通往 AGI"这种词，我既期待又觉得有点遥远。

这里先解释一下文中提到的 Tokens：就是大模型处理与生成的基本数据单元，在这个语境下，它代表了用于训练和评估的原始数据量级。

最后留个问题给大家：
如果 AI 真的能完全自主地完成训练，我们自己这些“老师”还有存在的必要吗？还是说，我们最终会变成那个只能按按钮的“算力调度员”？

（注：文中提及的"Tokens"指代大模型处理与生成的基本数据单元，在此语境下代表了用于训练和评估的原始数据量级。）

近期新闻