AI-NEWS · 2025年 7月 25日

字节跳动发布Seed 2.0

字节跳动Seed团队发布实时同传大模型Seed LiveInterpret 2.0

核心突破

  • 翻译准确度:接近专业译员水平
  • 延迟时间:仅3秒极低延迟
  • 语音克隆:支持实时音色克隆,输出与说话人音色一致的翻译语音

技术特点

  1. 全双工架构

    • 基于端到端语音生成与理解框架
    • 支持中英双向翻译
    • 可实时处理多路语音输入
  2. 零样本语音克隆

    • 无需预先采集声音样本
    • 通过实时对话即可合成"原声"翻译
    • 测试案例:成功模仿《西游记》猪八戒和《红楼梦》林黛玉音色

性能表现

指标 数据表现 对比优势
多人会议场景准确率 中英双向翻译准确率超70% 传统系统提升60%+
单人演讲场景准确率 翻译准确率超80% 接近专业译员水平
首字输出延迟 语音转文本平均2.21秒 行业领先水平
语音输出延迟 语音转语音平均2.53秒 平衡质量与延迟

专业评测结果

  1. 语音转文本任务

    • 中英翻译质量平均得分74.8/100
    • 超过第二名基线系统58%(47.3分)
  2. 语音转语音任务

    • 中英翻译质量平均得分66.3/100
    • 评测维度包含:翻译准确度、输出延迟、语速、发音和流畅度

技术优势对比

  • 传统系统延迟降低60%+
  • 实现真正的"边听边说"翻译
  • 智能平衡翻译质量、延迟和语音输出节奏
  • 适应不同语言特性,保证长信息场景下的自然流畅

火龙果频道