AI-NEWS · 2026年 5月 22日

网易有道小宇 4.0 开源了啥

网易有道刚把“小宇”4.0 放出来了,这次不一样,彻底变成多模态模型。不仅能看懂文字、图片,还能听声音,关键是,这次他们把核心代码全开源了。

说实话,在这个大家都把模型藏起来的圈子里,有道的这一步挺大胆。

到底强在哪?

咱们直接看干货:

  1. 能听懂各种花样:以前模型要么只能聊天,要么只能看图。小宇 4.0 不一样,它能把文字、声音、画面混在一起处理。你发个带图又带语音的复杂指令,它大概率能接得住。
  2. 数学脑子转得快:别看它才 270 亿参数(27B),在算数和逻辑推理这块,它居然能跟那些几百亿参数的“巨无霸”掰手腕,甚至更准。这对做编程、解题的开发者来说,是个真家伙。
  3. 翻译更顺了:有道老本行是翻译。这次底层引擎重写了,不再死板地逐字对译,读起来像人说的,流畅度明显上了一个台阶。

为啥要开源?

以前大厂都恨不得把模型捂在手里,但这次有道反其道而行,把多模态模型和 TTS(文本转语音)引擎都放到了 GitHub 上。

特别是那个 TTS,号称"3 秒情感克隆”。你拿一段录音进去,模型能学着说话人的语气和情绪,生成新声音。这对想做虚拟主播、游戏配音的公司来说,省下的开发成本可能比买模型的钱还多。

另外,他们改进了“思维链”(CoT)。简单说,就是让模型“想清楚再回答”。这一改,推理时用的算力变少了,对中小开发者更友好,不用为了跑个模型把服务器烧穿。

这意味着什么?

有道的这一步,不仅仅是发了一个新工具。它把“说话、看图、算数”这些最基础的能力打包送出去了。

以前大家做 AI 应用,得一个个去调大模型的接口,或者自己从头练模型,门槛高得吓人。现在,只要调用有道的开源接口,就能把这些能力串起来。

这可能会让 AI 应用的开发从“拼算力”变成“拼创意”。毕竟,当底层能力变得足够便宜且好用时,开发者们才敢放手去折腾各种新点子,而不是先算算服务器能扛多久。

当然,完全开源也意味着风险。如果社区随便用,能不能守住质量底线?这还得看大家怎么折腾。但至少,现在大家都有机会看看,网易到底把模型练到了什么程度。

火龙果频道