腾讯混元团队发布四款开源小规模模型
模型规格
- 参数规模:0.5B、1.8B、4B、7B四档
- 硬件适配:消费级GPU(笔记本/智能手机/智能座舱/智能家居)
- 核心优势:支持垂直领域低成本微调
技术特性
-
融合推理架构:
- 推理速度快
- 性价比高
- 双思维模式:
- 快速思维:简洁输出(适合简单任务)
- 慢速思维:复杂推理(含完整解题步骤)
-
关键能力:
- 智能体能力:
- 任务规划
- 工具调用
- 复杂决策(通过强化学习奖励信号设计优化)
- 实际应用场景:深度搜索/Excel操作/旅行规划
- 长文本处理:
- 原生上下文窗口:256k
- 处理能力:
- 40万汉字
- 50万英文单词
- 相当于同时记忆3部《哈利波特》完整内容
- 智能体能力:
-
部署支持:
- 单卡部署
- 终端设备直连(部分PC/智能手机/平板)
- 支持主流推理框架:
- SGLang
- vLLM
- TensorRT-LLM
- 多量化格式支持
性能表现
- 公共测试集领先成绩:
- 语言理解
- 数学能力
- 逻辑推理
应用场景
业务领域 | 应用案例 |
---|---|
腾讯会议 | AI助手完整理解会议内容 |
微信读书 | "AI问书"助手处理整本书籍 |
腾讯手机管家 | 垃圾短信识别(毫秒级拦截,零隐私上传) |
智能座舱 | 双模型协作架构解决车载环境痛点 |
生态支持
- 开源平台:
- GitHub
- HuggingFace
- 芯片平台:
- Arm
- 高通
- 英特尔
- 联发科
注:模型已在腾讯多个业务场景完成实用性验证,覆盖从边缘设备到云端、从通用到专业领域的多样化需求。