Alibaba Cloud 宣布第三次下调大模型价格
今年5月和9月,阿里巴巴云进行了两次降价后,再次宣布针对其大型模型的价格调整。这是今年的第三轮调价。
降价幅度分析
- Tongyi Qianwen 系列视觉理解模型:整体降幅超过80%。
- Qwen-VL-Plus 模型:价格下降了81%,每千token的成本降至仅0.0015元,创下在线最低价记录;高性能的Qwen-VL-Max则降至每千token 0.003元,降幅达85%。根据新定价,1元可处理大约600张720P图像或1700张480P图像。
Qwen-VL 系列模型概述
Qwen-VL 系列是阿里巴巴云发布的多模态模型之一,在开源社区中成为最受欢迎的模型。其强大的视觉推理能力可以识别各种分辨率和纵横比的图像,理解超过20分钟的长视频,并具备智能代理(如手机、机器人)执行任务的视觉理解能力。
降价原因
- 基础设施优化:阿里巴巴云通过不断的技术进步和优化,显著提高了推断效率。
- 经济规模效应:随着模型使用量呈指数级增长,成本进一步降低。弹性AI计算力调度系统结合Bailian分布式推理加速引擎,大幅减少了模型推理的成本并加快了推理速度。
新的KV Cache计费模式
为减少用户在大模型API调用中的成本,阿里巴巴云推出了新的KV Cache计费模式。通过自动缓存上下文以避免重复计算,此模式显著降低了模型调用的成本,特别适用于长文本、代码补全、多轮对话和特定文本摘要场景。
结论
随着阿里巴巴云不断优化基础设施和技术,Qwen-VL系列视觉理解模型的降价不仅使AI技术更加普及,也为开发者和企业带来更多的应用机会。通过持续提升性能并降低使用成本,阿里巴巴云推动了AI技术的广泛采用和应用,为各行各业的数字化转型提供了更强大的技术支持。