钉钉与通义实验室联合推出新一代语音识别大模型Fun-ASR
模型概述
2025年8月22日,钉钉与通义实验室语音团队联合宣布推出新一代语音识别大模型Fun-ASR。该模型具备卓越的语音识别能力,能够理解家装、畜牧等十大行业的专业术语,并支持根据企业需求进行专用模型的定制化训练。
核心能力
- 多行业术语识别:精准转录各类语音信号,具备多行业术语识别能力
- 多语言支持:处理不同语言和口音
- 上下文理解:结合上下文信息实现更精准的语音转录
- 企业定制:支持企业根据自身业务特点进行模型定制训练
应用集成
目前Fun-ASR已成功集成到钉钉多个功能模块:
- 会议字幕与同声传译
- 智能会议纪要
- 语音助手
这些功能的推出旨在为企业提供稳定、高效、可扩展的语音识别基础,特别适用于需要高语境理解和识别准确度的企业场景。
未来发展计划
虽然Fun-ASR目前已具备相当功能,但其潜力尚未完全发掘。未来双方将继续在以下领域进行探索和升级:
- 方言识别
- 噪声鲁棒性
- 多语言支持
- 企业深度定制
通过持续努力,双方希望进一步提升语音转录的准确性和实用性,推动更多企业业务场景的智能化升级。
关键要点
- Fun-ASR语音识别大模型能够理解多行业术语
- 已集成到钉钉各项功能中,支持企业定制化训练
- 未来将继续增强方言识别和噪声鲁棒性等能力