Inworld 发布新一代 TTS-1.5 模型:实时语音、低延迟与多语言支持
近日,AI 公司 Inworld 正式发布了其最新的文本转语音模型 TTS-1.5。该模型以其自然且富有表现力的实时语音、低延迟及多语言支持,吸引了广泛关注。
核心特性与数据亮点
1. 极低的成本
- 价格:使用成本约为 0.005美元/分钟。
- 市场竞争力:官方宣称,此价格比市场上同类产品便宜 25倍,具有显著的价格优势。
2. 卓越的实时性能
- 延迟:实现了低于 250毫秒 的实时延迟,用户在对话中几乎感觉不到延迟。
- 技术提升:语音合成技术的改进不仅大幅提升了速度,还优化了模型的表达力和稳定性。
3. 广泛的应用前景
技术的进步为多种应用场景开辟了新可能性,尤其是在游戏和虚拟现实的对话系统中。低延迟是提升对话真实感的关键,而 TTS-1.5 在此方面的创新为实现更真实的对话体验铺平了道路。
市场反响
用户已在社交平台上对该技术表现出浓厚兴趣,并期待在自己的项目中应用这一新模型。
本文信息整理自 AIbase,发布日期:2026年1月22日。
