AI-NEWS · 2025年 8月 5日

腾讯开源混元大模型

腾讯混元团队发布四款开源小规模模型

模型规格

  • 参数规模:0.5B、1.8B、4B、7B四档
  • 硬件适配:消费级GPU(笔记本/智能手机/智能座舱/智能家居)
  • 核心优势:支持垂直领域低成本微调

技术特性

  1. 融合推理架构

    • 推理速度快
    • 性价比高
    • 双思维模式:
      • 快速思维:简洁输出(适合简单任务)
      • 慢速思维:复杂推理(含完整解题步骤)
  2. 关键能力

    • 智能体能力
      • 任务规划
      • 工具调用
      • 复杂决策(通过强化学习奖励信号设计优化)
      • 实际应用场景:深度搜索/Excel操作/旅行规划
    • 长文本处理
      • 原生上下文窗口:256k
      • 处理能力:
        • 40万汉字
        • 50万英文单词
        • 相当于同时记忆3部《哈利波特》完整内容
  3. 部署支持

    • 单卡部署
    • 终端设备直连(部分PC/智能手机/平板)
    • 支持主流推理框架:
      • SGLang
      • vLLM
      • TensorRT-LLM
    • 多量化格式支持

性能表现

  • 公共测试集领先成绩:
    • 语言理解
    • 数学能力
    • 逻辑推理

应用场景

业务领域 应用案例
腾讯会议 AI助手完整理解会议内容
微信读书 "AI问书"助手处理整本书籍
腾讯手机管家 垃圾短信识别(毫秒级拦截,零隐私上传)
智能座舱 双模型协作架构解决车载环境痛点

生态支持

  • 开源平台
    • GitHub
    • HuggingFace
  • 芯片平台
    • Arm
    • 高通
    • 英特尔
    • 联发科

注:模型已在腾讯多个业务场景完成实用性验证,覆盖从边缘设备到云端、从通用到专业领域的多样化需求。

火龙果频道