小红书发布新一代对话合成模型FireRedTTS-2，助力AI播客制作

模型概述

小红书智创音频技术团队于2025年9月15日正式推出新一代对话合成模型FireRedTTS-2，标志着对话生成技术的又一重要突破。该模型旨在解决现有对话合成方案中的多个痛点，包括灵活性差、发音错误频繁、说话人切换不稳定以及韵律自然度不足等问题。

FireRedTTS-2对其核心模块进行了全面升级，特别是在离散语音编码器和文本转语音合成模型方面。通过采用双Transformer模型架构，显著提升了合成语音的自然度和连贯性。

在多项主客观评估中，FireRedTTS-2展现出业界领先的性能表现：

该模型不仅能够生成高质量的播客音频，还支持：

技术团队计划继续优化模型，包括：

模型的技术报告已发布在arXiv上，并提供专门的Demo体验和代码链接供开发者使用。

发布时间：2025年9月15日
开发团队：小红书智创音频技术团队