AI-NEWS · 2026年 3月 26日

杨植林:AI 训练进入第三阶段

杨植林:AI 训练真的进入“第三阶段”了吗?

2026 年 3 月 25 日,中关村论坛年会上,Moonshot 的杨植林抛出了一个挺炸裂的观点:大模型训练已经正式进入了由 AI 主导的“第三阶段”。

听起来很宏大,对吧?所谓的“范式转移”,就是大模型不再单纯依赖“自然数据 + 人工标注”,而是进化成了“高度自动化的自我演进”。

为了把这事说清楚,杨植林把整个过程拆解成了三个阶段:

  • 第一阶段(约 3 年前):还是老样子,靠吃互联网上的海量数据,再让一堆人费老劲去标注、微调价值观。
  • 第二阶段(去年,即 2025 年):引入了大规模强化学习(RL)。虽然还是研究人员在干活,但得他们手动挑那些高质量的任务,通过奖励机制去“哄”模型变强。
  • 第三阶段(2026 年及以后):这才是重点。研究人员退居二线,变成了"AI 算力调度者”。具体活计全交给 AI 了:它自己生成测试任务、自己搭建环境、甚至自己琢磨新的网络架构。

说真的,读到“根本性变革”这几个字时,我心里多少有点打鼓。

以前我们是手把手教 AI,现在变成了 AI 自己教自己?这听起来既让人兴奋,又有点不安。

具体到技术上,这次“进化”主要体现在三件事上:

  1. 任务与环境合成:不再需要人类预设考题,AI 利用海量 Tokens 自己出题、自己搭环境。
  2. 奖励参数定义:以前得人工设定奖励函数的参数,现在 AI 自己去试错,找到最合适的参数。
  3. 架构深度探索:以前是架构师画图,现在是 AI 直接去挖掘和尝试新的网络结构。

如果这真能落地,研究人员的角色确实变了,从“训练者”变成了负责分配算力的“调度者”。

不过,关于“行业影响与未来展望”那部分,我有点忍不住想吐槽一下,那种“指数级加速”、“战略协同”、“迈向 AGI"的排比句,读起来太像标准的公关通稿了。

杨植林确实提到了 Moonshot 的布局:Kimi 要继续拓展边界,还要搞一个基于开源社区的“协同演进技术生态系统”。最后,他把这一切拔高到了“通往 AGI 的关键里程碑”,说这是从“人类教 AI"到"AI 指导研发”的质变,标志着 AI 从“被动学习”迈向了“自主探索”。

说实话,听到“通往 AGI"这种词,我既期待又觉得有点遥远。

这里先解释一下文中提到的 Tokens:就是大模型处理与生成的基本数据单元,在这个语境下,它代表了用于训练和评估的原始数据量级。

最后留个问题给大家:
如果 AI 真的能完全自主地完成训练,我们自己这些“老师”还有存在的必要吗?还是说,我们最终会变成那个只能按按钮的“算力调度员”?

(注:文中提及的"Tokens"指代大模型处理与生成的基本数据单元,在此语境下代表了用于训练和评估的原始数据量级。)

火龙果频道