AI-NEWS · 2025年 6月 7日

11Labs发布最强语音模型

ElevenLabs发布Eleven v3Alpha TTS语音合成系统分析报告

核心更新概览

音频标签系统升级
- 新增「audio tags」功能，支持更精细的情感控制
- 示例标签：ANGRY/LAUGHS/WHISPER/SHOUTING/SIGHING/EVIL LAUGH/GIGGLE
性能优化
- 对比测试显示：
  - v3版本处理速度提升70%（相比v2）
  - 资源消耗降低29%（相比v2）
对话生成增强
- 新增"Text to Dialogue"功能
- 支持多角色对话场景的语音合成

技术亮点

情感参数控制面板支持7级语速调节（0.5-2.4倍速）
提供3种画质输出选项（480p/720p/1080p）
新增实时缓冲进度显示功能（00:00格式时间戳）

市场定位

主要竞品：GPT-4o语音模块
差异化优势：专注情感化语音合成（提供70种情感参数）

使用建议

推荐通过API接入开发
官方提供Prompting Guide优化提示词
测试版暂未开放评论功能（显示"0 comments"状态）

注：本文档基于2025年6月7日获取的测试版资料整理，正式版功能可能有调整

火龙果频道

您可能还喜欢...