AI-NEWS · 2025年 7月 25日

字节跳动发布Seed 2.0

字节跳动Seed团队发布实时同传大模型Seed LiveInterpret 2.0

核心突破

翻译准确度：接近专业译员水平
延迟时间：仅3秒极低延迟
语音克隆：支持实时音色克隆，输出与说话人音色一致的翻译语音

技术特点

全双工架构：
- 基于端到端语音生成与理解框架
- 支持中英双向翻译
- 可实时处理多路语音输入
零样本语音克隆：
- 无需预先采集声音样本
- 通过实时对话即可合成"原声"翻译
- 测试案例：成功模仿《西游记》猪八戒和《红楼梦》林黛玉音色

性能表现

指标	数据表现	对比优势
多人会议场景准确率	中英双向翻译准确率超70%	传统系统提升60%+
单人演讲场景准确率	翻译准确率超80%	接近专业译员水平
首字输出延迟	语音转文本平均2.21秒	行业领先水平
语音输出延迟	语音转语音平均2.53秒	平衡质量与延迟

专业评测结果

语音转文本任务：
- 中英翻译质量平均得分74.8/100
- 超过第二名基线系统58%（47.3分）
语音转语音任务：
- 中英翻译质量平均得分66.3/100
- 评测维度包含：翻译准确度、输出延迟、语速、发音和流畅度

技术优势对比

传统系统延迟降低60%+
实现真正的"边听边说"翻译
智能平衡翻译质量、延迟和语音输出节奏
适应不同语言特性，保证长信息场景下的自然流畅

火龙果频道

您可能还喜欢...