腾讯云正式推出混元A13B模型API服务
价格信息
- 输入价格:0.5元/百万Tokens
- 输出价格:2元/百万Tokens
模型特点
架构创新
- 行业首个13B级MoE(混合专家)开源混合推理模型
- 紧凑设计:总参数量80B,激活参数仅13B
- 性能对标同架构领先开源模型
- 推理速度更快,性价比显著提升
技术优势
- 支持原生256K上下文窗口
- 在多个长文本数据集表现优异
- 创新融合推理模式:
- 支持快速思考与慢速思考模式自由切换
- 兼顾输出效率与特定任务准确性
开发者友好性
- 严格条件下仅需一张中端GPU卡即可部署
- 无缝集成开源主流推理框架生态
- 支持多种量化格式
- 相同输入输出规模下,整体吞吐量是前沿开源模型2倍以上
训练技术创新
预训练阶段
- 训练语料达20T tokens,覆盖多领域
- 构建适用于MoE架构的Scaling Law联合公式
- 为MoE架构设计提供量化工程指导
后训练阶段
- 采用多阶段训练方法
- 显著提升模型推理能力和泛化性
应用情况
- 腾讯内部使用量最大的大语言模型之一
- 已应用于400+业务场景
- 日均请求量超1.3亿次