xAI发布最快语音助手API:支持实时中文搜索与情感控制,成本仅0.05美元/分钟
根据AIbase报道,埃隆·马斯克旗下的人工智能公司xAI于2024年12月18日正式发布了Grok Voice Agent API。该产品以极具竞争力的价格和卓越性能,在实时语音AI领域引发了性能与成本效益的双重风暴。
核心亮点
1. 极致的成本效益
- 价格:每分钟连接成本仅为0.05美元,显著低于市场主流竞争对手。
- 性能:在音频推理基准测试中排名第一,响应速度比竞争对手快近5倍。
- 延迟:初始音频延迟小于1秒,确保近乎实时的交互体验。
2. 强大的技术特性
- 多语言支持:自动检测并自由切换包括中文在内的数十种语言。
- 实时能力:深度整合实时网络搜索与推理功能,使回答能跟上最新的网络信息。
- 扩展功能:支持外部工具调用、情感控制及多种语音选项,帮助开发者构建富有表现力且能执行实际任务的AI智能体。
3. 便捷的开发者体验
- 兼容性:完全兼容OpenAI实时API规范,为开发者提供了向高性能、低成本解决方案无缝迁移的可能性。
- 成熟度:基于成熟的语音技术栈,已在特斯拉车辆和移动应用中得到广泛应用。
行业意义
此次发布标志着马斯克在实时对话AI领域挑战行业格局的关键一步。通过提供高性能、低成本的语音交互解决方案,xAI有望推动语音AI技术在更广泛场景中的普及与应用。
信息来源:AIbase,发布日期:2024年12月18日
