AI-NEWS · 2025年 11月 14日

Reverie发布印度语音模型

Reverie推出专为印度优化的语音识别模型,性能超越Deepgram

模型概述

在庆祝公司成立16周年之际,Reverie Language Technologies推出了一款专为印度多样化语言环境设计的语音转文本(STT)模型。该模型不仅能识别印地语和英语,还能处理印地英语混合语(Hinglish)及其他混合语言,极大满足了银行、呼叫中心等行业的需求。

性能表现

  • API调用量:过去一年处理了300万次API调用
  • 准确率:在独立测试中比Deepgram高出约4.2%
  • 响应速度:比Deepgram快1.5倍

核心技术优势

多语言理解能力

  • 支持英语和印地语数字识别(如英语"twenty-three"和印地语"तेईस")
  • 能够识别全印度各地的姓名,考虑拼写和发音差异
  • 理解印度人使用数字的习惯和英印混合语句

方言覆盖范围

除Hinglish外,还推出了针对以下印度语言的STT模型:

  • 泰米尔语、泰卢固语、孟加拉语
  • 马拉地语、古吉拉特语、卡纳达语
  • 马拉雅拉姆语、阿萨姆语、奥里亚语、旁遮普语

每个模型都针对特定方言和口音进行独立训练,更真实地反映当地语言使用方式。

实际应用案例

一家大型金融服务公司使用Reverie的STT引擎处理了超过15,000个多语言催收电话,在数字和支付识别方面实现了高准确率。

部署与功能

  • 部署方式:通过Reverie API平台提供,支持云端或本地部署
  • 特色功能
    • 特定领域语言包
    • 数字和姓名消歧
    • 热词增强功能
    • 所有功能可通过同一API配置

专家观点

Reverie研发负责人Pranjal Nayak表示:"我们的研发始终专注于印度独特的语言挑战,这款Hinglish模型就是成果之一。它能让AI代理的表现更加自然和人性化。"

火龙果频道