ElevenLabs 发布 Turbo 2.5 模型概要
新模型特点:
- 多语言支持:Turbo 2.5 支持包括印地语、法语、西班牙语、普通话在内的32种语言。
- 速度提升:生成速度提高了3倍,延迟降低到300毫秒。相较于 Turbo v2,英语文本到语音速度提高了25%。
- 新增语言:首次支持越南语、匈牙利语和挪威语的文本到语音转换。
- 轻松集成:现有用户只需更新API的 model_id 即可切换到新模型。
主要优势:
- 高性能:适合需要快速响应和高质量输出的动态互动场景。
- 快速生成:能够迅速生成多种语言的AI语音,应用广泛。
- 简易集成:通过 Audio Native 将内容转变为播客,提升可访问性和用户参与度。
- 企业级准备:API具备SOC2和GDPR合规性,确保数据安全。
目标应用领域:
- 会话式 AI:如兔子的 r1 设备和 Vocode 提供逼真的语音。
- 教育和培训:Praktika.ai 利用 ElevenLabs TTS 提升 AI 导师能力。
- 娱乐:Kindroid 为 AI 伙伴提供语音支持。
- 内容创作:Aug X Labs 与 ElevenLabs 合作推出 Augie Storyteller。
API 计划:
-
专业计划 (Pro Plan):
- 每月字符限制:500,000 (~600 分钟音频)
- 额外字符费用:$0.24/1000 字符
- 声音数:160
- 音频质量:128 和 192 kbps, 44.1kHz
-
规模计划 (Scale Plan):
- 每月字符限制:2,000,000 (~2,400 分钟音频)
- 额外字符费用:$0.18/1000 字符
- 声音数:660
- 音频质量:128 和 192 kbps, 44.1kHz
-
企业计划 (Enterprise Plan):
- 自定义字符限制和声音
- 音频质量:128 和 192 kbps, 44.1kHz
API接口:https://elevenlabs.io/api
总结与分析
ElevenLabs 推出的 Turbo 2.5 模型显著提升了速度和效率,支持更多语言,特别是在首次支持越南语、匈牙利语和挪威语的情况下,增加了其全球市场的竞争力。对于企业用户,新的模型不仅能快速生成高质量的语音,还具有强大的数据安全保障。这将大大促进在会话式AI、教育培训、娱乐和内容创作等领域的应用,同时通过不同的API计划满足各类客户需求,从中小企业到大型企业均可受益。
Source:https://xiaohu.ai/p/11508