AI-NEWS · 2026年 7月 4日

字节引擎发布 Mamoda 2.5:广告治理迈入视频化新阶段

7 月 3 日,字节引擎把自家研发的 Mamoda 2.5 模型推了出来。这次升级的核心,是把广告风控从“只看文字”变成了“能看懂视频”。

以前是怎么做的?
Mamoda 1.0 版只能识别文本。遇到视频广告?基本就是听天由命——要么完全不管,要么只能人工盯着看。这导致很多带着违规画面的视频悄悄流了出去,或者因为画面里有些许敏感词就被直接掐断。

现在变成了什么样?
2.5 版不一样了。它不再满足于提取几帧关键图,而是真的去“看”视频。模型会分析视频里的每一帧,理解动作和场景的逻辑。比如,它能看出视频里的人在演示某种违规操作,而不仅仅是识别字幕里有没有脏话。

这解决了什么实际问题?
说实话,做风控的都知道一个死循环:要么太严,把正常的广告误杀了,商家投诉不断;要么太松,违规视频满天飞,平台风险巨大。
Mamoda 2.5 试图打破这个僵局。因为大模型能读懂视频深层的语义,它比人工更敏锐,能抓出那些藏在画面细节里的隐患。结果就是,真正该管的管住了,正常的好广告少被误伤,生态安全有了点保障。

行业里怎么看?
这次发布其实挺有意思。以前大家都觉得视频审核太难,成本高、效率低,所以总拖后腿。字节直接把多模态大模型的技术拿过来用,相当于给整个行业打了个样:原来视频也能像文本一样被“管”得这么细。对于急着要精细化管控视频内容的广告主来说,这算是个好消息。

总的来说,Mamoda 2.5 的发布,算是填平了广告治理里那个最大的坑——视频化。虽然技术落地还有距离,但至少方向对了,路铺得更宽了些。

火龙果频道