AI-NEWS · 2025年 6月 7日

11Labs发布最强语音模型

ElevenLabs发布Eleven v3Alpha TTS语音合成系统分析报告

核心更新概览

  1. 音频标签系统升级

    • 新增「audio tags」功能,支持更精细的情感控制
    • 示例标签:ANGRY/LAUGHS/WHISPER/SHOUTING/SIGHING/EVIL LAUGH/GIGGLE
  2. 性能优化

    • 对比测试显示:
      • v3版本处理速度提升70%(相比v2)
      • 资源消耗降低29%(相比v2)
  3. 对话生成增强

    • 新增"Text to Dialogue"功能
    • 支持多角色对话场景的语音合成

技术亮点

  • 情感参数控制面板支持7级语速调节(0.5-2.4倍速)
  • 提供3种画质输出选项(480p/720p/1080p)
  • 新增实时缓冲进度显示功能(00:00格式时间戳)

市场定位

  • 主要竞品:GPT-4o语音模块
  • 差异化优势:专注情感化语音合成(提供70种情感参数)

使用建议

  1. 推荐通过API接入开发
  2. 官方提供Prompting Guide优化提示词
  3. 测试版暂未开放评论功能(显示"0 comments"状态)

注:本文档基于2025年6月7日获取的测试版资料整理,正式版功能可能有调整

火龙果频道