AI-NEWS · 2025年 10月 30日

AI语音播客上线

SoulX-Podcast语音模型发布:支持90分钟不间断播客生成

核心特性

长时稳定生成

  • 时长突破:可连续生成超过90分钟对话内容
  • 稳定性保证:长时间运行无稳定性衰减
  • 应用场景:特别适合长播客、访谈、故事讲述等场景

多语言与方言支持

  • 双语支持:中文(普通话)和英语
  • 方言集成:支持多种中国方言无缝切换
  • 副语言控制:精确模拟笑声、叹息、停顿等情感表达

零样本克隆与迁移

  • 无需训练:直接克隆特定声音和语调
  • 个性化定制:支持个性化语音定制
  • 创作便利:降低开发门槛,提供无限创作空间

行业影响

应用领域拓展

  • 媒体领域:挑战传统录音棚模式
  • 娱乐产业:小团队高效制作高质量播客
  • 教育应用:提供新的内容创作方式

发展趋势

  • 实时交互:未来将向实时互动方向发展
  • 跨平台集成:预计实现更广泛平台整合

相关AI新闻摘要

同日重要发布

  1. 腾讯混元:推出中国首个交互式AI播客,支持实时语音或文字提问
  2. 抖音:发布自动多人语音合成系统,98%角色识别准确率

其他AI进展

  • NVIDIA:推出"Omniverse DSX Blueprint"AI数据中心设计
  • MiniMax:开源M2大模型,成本仅为竞争对手的8%
  • 蚂蚁集团:开源扩散语言模型推理框架dInfer,速度提升10.7倍

技术意义

SoulX-Podcast的发布标志着AI语音技术从短期演示向实际应用的重要转变,为内容创作者提供了更强大的工具支持,有望推动AI语音在多个行业的规模化应用。

火龙果频道