Reverie推出专为印度优化的语音识别模型,性能超越Deepgram
模型概述
在庆祝公司成立16周年之际,Reverie Language Technologies推出了一款专为印度多样化语言环境设计的语音转文本(STT)模型。该模型不仅能识别印地语和英语,还能处理印地英语混合语(Hinglish)及其他混合语言,极大满足了银行、呼叫中心等行业的需求。
性能表现
- API调用量:过去一年处理了300万次API调用
- 准确率:在独立测试中比Deepgram高出约4.2%
- 响应速度:比Deepgram快1.5倍
核心技术优势
多语言理解能力
- 支持英语和印地语数字识别(如英语"twenty-three"和印地语"तेईस")
- 能够识别全印度各地的姓名,考虑拼写和发音差异
- 理解印度人使用数字的习惯和英印混合语句
方言覆盖范围
除Hinglish外,还推出了针对以下印度语言的STT模型:
- 泰米尔语、泰卢固语、孟加拉语
- 马拉地语、古吉拉特语、卡纳达语
- 马拉雅拉姆语、阿萨姆语、奥里亚语、旁遮普语
每个模型都针对特定方言和口音进行独立训练,更真实地反映当地语言使用方式。
实际应用案例
一家大型金融服务公司使用Reverie的STT引擎处理了超过15,000个多语言催收电话,在数字和支付识别方面实现了高准确率。
部署与功能
- 部署方式:通过Reverie API平台提供,支持云端或本地部署
- 特色功能:
- 特定领域语言包
- 数字和姓名消歧
- 热词增强功能
- 所有功能可通过同一API配置
专家观点
Reverie研发负责人Pranjal Nayak表示:"我们的研发始终专注于印度独特的语言挑战,这款Hinglish模型就是成果之一。它能让AI代理的表现更加自然和人性化。"
