腾讯混元刚发布的 Hy3preview 模型,才两周时间,数据就炸了。
最直观的就是调用量。跟上一代 Hy2 比起来,Token 用量翻了 10 倍不止。更别提内部那些工具了,像 WorkBuddy、Codebuddy 还有 Qclaw,因为代码生成和智能体构建的需求,调用量直接涨了 16.5 倍。在外面,OpenRouter 的周榜上,它不管是总调用量、市场份额,还是编程、工具调用这些高级场景,都排第一。
这背后的推手其实很具体:就是代码和智能体。开发者现在特别想要好用的代码生成和理解能力,而不仅仅是能聊天的机器人。再加上腾讯搞了个“社区驱动”的测试策略,先在 OpenRouter 上免费放出来,让开发者去折腾。这一招很管用,收集到的真实反馈让模型迭代得飞快。
说实话,这种“让用户边用边改”的模式,看起来才是大模型快速变强的关键路径。
行业里也有个明显的感觉:国产大模型正在从“只会聊天的”变成“能干活的人”。以前那种简单的问答机器人,现在得进化成能执行复杂任务的“行动者”。调用量一大,模型在实际环境里试出来的逻辑和边界,就会越来越准。
这也意味着,大模型真正落地的机会,可能不在 C 端那种花哨的聊天界面,而在 B 端的企业流程里。怎么把模型塞进现有的自动化工作流,怎么让企业里的员工直接用它提效,这才是接下来最该解决的问题。
(注:数据对比基于腾讯混元系列,排名参考 OpenRouter 平台。)
