AI-NEWS · 2024年 7月 22日

ElevenLabs 发布Turbo 2.5模型 速度提高了3倍 支持中文等32种语言

ElevenLabs 发布 Turbo 2.5 模型概要

新模型特点:

  1. 多语言支持:Turbo 2.5 支持包括印地语、法语、西班牙语、普通话在内的32种语言。
  2. 速度提升:生成速度提高了3倍,延迟降低到300毫秒。相较于 Turbo v2,英语文本到语音速度提高了25%。
  3. 新增语言:首次支持越南语、匈牙利语和挪威语的文本到语音转换。
  4. 轻松集成:现有用户只需更新API的 model_id 即可切换到新模型。

主要优势:

  1. 高性能:适合需要快速响应和高质量输出的动态互动场景。
  2. 快速生成:能够迅速生成多种语言的AI语音,应用广泛。
  3. 简易集成:通过 Audio Native 将内容转变为播客,提升可访问性和用户参与度。
  4. 企业级准备:API具备SOC2和GDPR合规性,确保数据安全。

目标应用领域:

  • 会话式 AI:如兔子的 r1 设备和 Vocode 提供逼真的语音。
  • 教育和培训:Praktika.ai 利用 ElevenLabs TTS 提升 AI 导师能力。
  • 娱乐:Kindroid 为 AI 伙伴提供语音支持。
  • 内容创作:Aug X Labs 与 ElevenLabs 合作推出 Augie Storyteller。

API 计划:

  1. 专业计划 (Pro Plan)

    • 每月字符限制:500,000 (~600 分钟音频)
    • 额外字符费用:$0.24/1000 字符
    • 声音数:160
    • 音频质量:128 和 192 kbps, 44.1kHz
  2. 规模计划 (Scale Plan)

    • 每月字符限制:2,000,000 (~2,400 分钟音频)
    • 额外字符费用:$0.18/1000 字符
    • 声音数:660
    • 音频质量:128 和 192 kbps, 44.1kHz
  3. 企业计划 (Enterprise Plan)

    • 自定义字符限制和声音
    • 音频质量:128 和 192 kbps, 44.1kHz

API接口:https://elevenlabs.io/api

总结与分析

ElevenLabs 推出的 Turbo 2.5 模型显著提升了速度和效率,支持更多语言,特别是在首次支持越南语、匈牙利语和挪威语的情况下,增加了其全球市场的竞争力。对于企业用户,新的模型不仅能快速生成高质量的语音,还具有强大的数据安全保障。这将大大促进在会话式AI、教育培训、娱乐和内容创作等领域的应用,同时通过不同的API计划满足各类客户需求,从中小企业到大型企业均可受益。

Source:https://xiaohu.ai/p/11508