火山引擎发布豆包语音识别模型2.0，提升多语言识别准确率

发布日期：2025年12月5日
来源：AIbase

核心摘要

火山引擎正式发布豆包语音识别模型2.0（Doubao-Seed-ASR-2.0）。此次升级不仅在推理能力上实现显著提升，还支持对多种语言及视觉信息的精准识别，标志着语音识别技术的又一次重要进步。

模型升级后具备了多模态理解能力，可同时分析文本和视觉信息。

模型支持对13种海外语言的精准识别，包括日语、韩语、德语、法语等。此项多语言支持将有效拓展其在跨语言应用场景的使用范围，提升全球用户的交互体验。

豆包语音识别模型2.0现已于火山引擎方舟体验中心上线，并提供对外服务的API接口，方便企业与开发者集成该技术。

火山引擎表示，未来将继续推动该模型的演进，致力于在多模态、多场景环境下实现更精准的语音转文字服务，为用户提供高效解决方案。

火山引擎发布豆包语音识别模型2.0，充分展现了其在人工智能领域持续的创新能力和技术实力，预计将对行业标准与用户体验产生积极影响。

注：本文整理自AIbase的新闻报道，已移除原材料的导航栏、广告、推荐阅读列表及其他无关信息，仅保留核心新闻事实与细节。