Qwen3.6-Max 编程能力“断档”领先

阿里巴巴刚扔出了通义千问（Qwen）系列的新“王炸”——Qwen3.6-Max-Preview。

这玩意儿目前只是个早期预览版，但如果你现在就能在 QwenStudio 里跑起来，或者通过阿里云百炼（BaiLian）API 用 qwen3.6-max-preview 这个名称直接调用，那确实有点东西。

官方放出的数据确实有点吓人：在几个权威的测试里，它拿了历史最高分。特别是编程这块，提升得有点“不讲道理”：

世界知识和指令遵循也没落下，理解能力分别涨了 2.3 分和 2.8 分。

说实话，看到 SkillsBench 和 SciCode 涨了快 10 分，我的第一反应是：这不仅仅是能写代码了，而是彻底改变了玩法。

以前的 AI 助手，也就是帮你在光标旁边补两行代码，或者解释一下报错。但 Qwen3.6-Max-Preview 看起来像是个真正的“工程师”。它似乎能独立搞定复杂的科研计算，甚至能处理全栈开发任务。这种从“辅助工具”到“独立干活”的跨越，比单纯的数据增长更有意思。

另外，中文能力这块的 5.3 分提升，对国内开发者来说可能是个实打实的利好。现在用英文模型写中文注释或者处理中文技术文档，经常半斤八两。但这次阿里明显是下了功夫做本地化适配的，这点上，它比那些国际竞品要顺手得多。

名字里带着"Preview"，确实让人有点犹豫。不过官方话说得很清楚：这还在活跃开发阶段。

这意味着什么？意味着你现在看到的那些分数，可能还不是天花板。它还在长身体，后续版本说不定能再跳个级。这种动态增长的特性，反而让现在的“预览版”显得更有价值——你是在用一把还在打磨的“未来武器”。

Qwen3.6-Max-Preview 的发布，确实让通义千问在智能体编程这块领域有了全球领先的架势。

它不仅仅是阿里技术实力的展示，更重要的是，它可能正在悄悄改变我们写代码、搞开发的方式。如果你也是开发者，不妨去试试这个预览版，看看它能不能真的帮你省下一点“调 bug"的时间。

（注：数据基于官方发布内容，实际效果因人而异，且模型仍在迭代中。）

近期新闻