AI-NEWS · 2025年 8月 23日

钉钉发布语音大模型

钉钉与通义实验室联合推出新一代语音识别大模型Fun-ASR

模型概述

2025年8月22日,钉钉与通义实验室语音团队联合宣布推出新一代语音识别大模型Fun-ASR。该模型具备卓越的语音识别能力,能够理解家装、畜牧等十大行业的专业术语,并支持根据企业需求进行专用模型的定制化训练。

核心能力

  • 多行业术语识别:精准转录各类语音信号,具备多行业术语识别能力
  • 多语言支持:处理不同语言和口音
  • 上下文理解:结合上下文信息实现更精准的语音转录
  • 企业定制:支持企业根据自身业务特点进行模型定制训练

应用集成

目前Fun-ASR已成功集成到钉钉多个功能模块:

  • 会议字幕与同声传译
  • 智能会议纪要
  • 语音助手

这些功能的推出旨在为企业提供稳定、高效、可扩展的语音识别基础,特别适用于需要高语境理解和识别准确度的企业场景。

未来发展计划

虽然Fun-ASR目前已具备相当功能,但其潜力尚未完全发掘。未来双方将继续在以下领域进行探索和升级:

  • 方言识别
  • 噪声鲁棒性
  • 多语言支持
  • 企业深度定制

通过持续努力,双方希望进一步提升语音转录的准确性和实用性,推动更多企业业务场景的智能化升级。

关键要点

  • Fun-ASR语音识别大模型能够理解多行业术语
  • 已集成到钉钉各项功能中,支持企业定制化训练
  • 未来将继续增强方言识别和噪声鲁棒性等能力

火龙果频道