SiliconCloud 宣布 DeepSeek-R1 V3 API 支持批量推理,价格大幅下调 75%
概述
SiliconCloud 平台正式推出 DeepSeek-R1 V3 API 的批量推理功能。用户现在可以通过批量 API 向 SiliconCloud 发送请求,摆脱实时推理速率的限制,预计在 24 小时内完成大规模数据处理任务。
价格调整
- 批量推理价格下调:DeepSeek-V3 批量推理的价格比实时推理低 50%。
- 限时优惠:从 3 月 11 日至 3 月 18 日,DeepSeek-R1 批量推理享受 75% 的折扣,输入成本仅为 100 万 Tokens,输出成本为 400 万 Tokens。
功能亮点
- 大规模数据处理:批量推理功能旨在帮助用户更高效、低成本地处理大规模数据处理任务,如生成报告和数据清理。
- 适用场景:特别适合不需要实时响应的数据分析和模型性能评估场景。
其他更新
- 功能增强:DeepSeek-R1 V3 API 之前已增加对 Function Calling、JSON Mode、Prefix 和 FIM 的支持。
- 性能提升:DeepSeek-R1 V3 API Pro 版本的 TPM(每分钟 Tokens)限制从 10,000 提高到 1,000,000。
战略合作
SiliconCloud 与 Sdn Bhd 宣布战略合作,通过人工智能(AI)和机器学习(ML)增强智能网络运营。该合作旨在加速 Maxis 的数字化转型,并通过自优化网络技术提高用户体验和运营效率。
总结
SiliconCloud 的这次更新不仅提升了 DeepSeek-R1 V3 API 的功能和性能,还通过大幅降价和限时优惠,为用户提供了更具成本效益的解决方案。同时,与 Sdn Bhd 的战略合作将进一步推动 AI 和 ML 在网络管理中的深度集成。