AI-NEWS · 2025年 6月 28日

ElevenLabs发布语音设计工具V3

ElevenLabs Voice Design v3 功能分析报告

一、核心功能概述

  1. AI语音设计系统
    • 支持多角色语音生成(70+预设模板)
    • 提供语音参数精细调节功能(年龄/音色/语速等8项维度)

二、技术亮点

  1. 多语言支持

    • 美式南方口音(深度参数80)
    • 日式英语(含"soft,whiskery"特征)
    • 法式英语(含"seductive"特征)
  2. 特色语音模型

    | 角色类型       | 核心特征参数                     | 年龄参数 |
    |----------------|----------------------------------|---------|
    | 老牛仔         | gravelly,deep                   | 80      |
    | 日本武士       | husky,composed                  | -       |
    | 巫婆           | croaky,harsh(高频特征)          | -       |
    | 宙斯           | deep,powerful(戏剧化处理)       | -       |
    

三、交互设计

  1. 播放控制面板

    • 支持0.5-2倍速调节(7档位)
    • 分辨率选择(480p/720p/1080p)
    • 画中画/全屏模式切换
  2. API集成

    • 当前处于Alpha测试阶段
    • 支持prompt直接调用(示例显示外星人问候语生成)

四、市场定位分析

  1. 差异化优势

    • 相比传统TTS增加「角色化演绎」维度
    • 情感参数精确到"grumpy/frustrated"等细分状态
  2. 潜在应用场景

    • 游戏NPC语音(巫婆/宙斯等角色)
    • 有声书旁白(老牛仔叙事风格)
    • 虚拟助手人格化(法式优雅人设)

五、改进建议

  1. 增加东亚语言支持(当前侧重欧美语系)
  2. 开发实时语音转换功能
  3. 添加方言参数调节选项

火龙果频道