AI-NEWS · 2025年 11月 6日

美团全猫开源登顶

美团"全能猫"重磅登场:LongCat-Flash-Omni多模态大模型开源即登顶,实时交互极速流畅

核心亮点

开源即SOTA:美团最新开源的大模型LongCat-Flash-Omni在多项基准测试中超越多个闭源竞品,实现了罕见的"开源即达到业界最优"突破。

技术特性

多模态能力

  • 全模态支持:实时整合文本、语音、图像、视频
  • 精准任务控制:能够处理结合物理逻辑和空间推理的复杂跨模态任务
  • 环境适应性
    • 高噪声环境下仍能准确提取语音语义
    • 对模糊图像或短视频片段能快速定位关键信息并生成结构化答案

架构创新

  • 端到端统一架构:不同于传统多模态模型独立处理各模态分支,LongCat采用集成设计
  • 统一表示空间:文本、音频和视觉数据在同一表示空间中对齐和推理
  • 渐进式训练策略:先巩固语言基础,再逐步引入图像、语音和视频数据

性能优化

  • 极速响应:得益于Flash推理引擎和轻量化设计
  • 低硬件要求:在普通消费级GPU上即可实现流畅对话
  • 近零延迟:用户在使用美团官方LongCat应用或网页版时几乎感受不到输入与响应间的延迟

开放生态

  • 开发者:可通过Hugging Face获取模型权重
  • 普通用户:可直接在应用内体验
  • 战略意义:展示美团对AI基础设施技术的信心,推动国内多模态生态发展

行业影响

在AI竞争从"单模态精度"转向"多模态协作"的关键时刻,LongCat-Flash-Omni的出现既代表了技术边界的突破,也重新定义了应用场景。当外卖平台能训练出与国际巨头匹敌的多模态大模型时,中国AI发展的下半场可能才刚刚开始。

火龙果频道