豆包大模型1.6-Vision正式发布,成本较前代降低约50%
发布日期:2025年9月30日
发布平台:火山引擎官方微博
核心亮点
豆包大模型1.6-Vision是豆包大模型家族中首个具备工具调用能力的视觉深度思考模型,在通用多模态理解和推理能力方面显著增强,并支持Responses API。
三大核心优势
1. 工具调用实现更精准视觉理解
- 差异化能力:通过工具调用将图像融入思维链
- 精准处理:支持定位、裁剪、选点、划线、缩放、旋转等图像操作
- 仿生推理:模拟人类"从全局扫描到局部聚焦"的视觉推理过程
- 效果提升:增强推理可解释性,高效准确完成图像操作
2. 更高效的应用开发
- API支持:支持Responses API
- 开发灵活:开发者可自主选择调用工具
- 效率提升:显著减少Agent开发过程中的代码量,提高开发效率
3. 更高的模型性价比
- 成本对比:相比前代视觉理解模型豆包-1.5-thinking-vision-pro
- 降幅显著:整体成本降低约50%
- 性能提升:以更低成本解锁更强性能,性价比进一步提升
技术特点
- 首款具备工具调用能力的视觉深度思考模型
- 增强的通用多模态理解和推理能力
- 支持Responses API接口
该模型的发布标志着在视觉理解领域取得重要突破,为AI技术应用发展提供了新的动力。