AI-NEWS · 2025年 12月 19日

xAI发布实时中文语音助手

xAI发布最快语音助手API:支持实时中文搜索与情感控制,成本仅0.05美元/分钟

根据AIbase报道,埃隆·马斯克旗下的人工智能公司xAI于2024年12月18日正式发布了Grok Voice Agent API。该产品以极具竞争力的价格和卓越性能,在实时语音AI领域引发了性能与成本效益的双重风暴。

核心亮点

1. 极致的成本效益

  • 价格:每分钟连接成本仅为0.05美元,显著低于市场主流竞争对手。
  • 性能:在音频推理基准测试中排名第一,响应速度比竞争对手快近5倍
  • 延迟:初始音频延迟小于1秒,确保近乎实时的交互体验。

2. 强大的技术特性

  • 多语言支持:自动检测并自由切换包括中文在内的数十种语言。
  • 实时能力:深度整合实时网络搜索与推理功能,使回答能跟上最新的网络信息。
  • 扩展功能:支持外部工具调用、情感控制及多种语音选项,帮助开发者构建富有表现力且能执行实际任务的AI智能体。

3. 便捷的开发者体验

  • 兼容性:完全兼容OpenAI实时API规范,为开发者提供了向高性能、低成本解决方案无缝迁移的可能性。
  • 成熟度:基于成熟的语音技术栈,已在特斯拉车辆和移动应用中得到广泛应用。

行业意义

此次发布标志着马斯克在实时对话AI领域挑战行业格局的关键一步。通过提供高性能、低成本的语音交互解决方案,xAI有望推动语音AI技术在更广泛场景中的普及与应用。


信息来源:AIbase,发布日期:2024年12月18日

火龙果频道