字节引擎发布 Mamoda 2.5：广告治理迈入视频化新阶段

7 月 3 日，字节引擎把自家研发的 Mamoda 2.5 模型推了出来。这次升级的核心，是把广告风控从“只看文字”变成了“能看懂视频”。

以前是怎么做的？
Mamoda 1.0 版只能识别文本。遇到视频广告？基本就是听天由命——要么完全不管，要么只能人工盯着看。这导致很多带着违规画面的视频悄悄流了出去，或者因为画面里有些许敏感词就被直接掐断。

现在变成了什么样？
2.5 版不一样了。它不再满足于提取几帧关键图，而是真的去“看”视频。模型会分析视频里的每一帧，理解动作和场景的逻辑。比如，它能看出视频里的人在演示某种违规操作，而不仅仅是识别字幕里有没有脏话。

这解决了什么实际问题？
说实话，做风控的都知道一个死循环：要么太严，把正常的广告误杀了，商家投诉不断；要么太松，违规视频满天飞，平台风险巨大。
Mamoda 2.5 试图打破这个僵局。因为大模型能读懂视频深层的语义，它比人工更敏锐，能抓出那些藏在画面细节里的隐患。结果就是，真正该管的管住了，正常的好广告少被误伤，生态安全有了点保障。

行业里怎么看？
这次发布其实挺有意思。以前大家都觉得视频审核太难，成本高、效率低，所以总拖后腿。字节直接把多模态大模型的技术拿过来用，相当于给整个行业打了个样：原来视频也能像文本一样被“管”得这么细。对于急着要精细化管控视频内容的广告主来说，这算是个好消息。

总的来说，Mamoda 2.5 的发布，算是填平了广告治理里那个最大的坑——视频化。虽然技术落地还有距离，但至少方向对了，路铺得更宽了些。

火龙果频道

近期新闻

AI-NEWS · 2026年 7月 4日

字节引擎发布 Mamoda 2.5：广告治理迈入视频化新阶段

您可能还喜欢...

AI-NEWS · 2026年 7月 4日

您可能还喜欢...

稳定性AI新功能升级图像生成能力

Google 新招：显存省 6 倍，速度快 8 倍

Veo2全球首发AI视频