AI-NEWS · 2025年 9月 13日

MiniMax音乐时长增至4分钟

MiniMax发布Music 1.5音乐生成模型:时长增至4分钟,支持中文传统乐器

核心突破

2025年9月12日,MiniMax正式推出新一代音乐生成模型Music 1.5,标志着AI音乐创作领域的重大突破。该模型将生成音乐时长从原先的片段级提升至完整的4分钟作品,实现了"一人即乐队"的音乐创作新时代。

四大技术特性

1. 强可控性

  • 支持通过自然语言描述定制音乐风格、情绪和场景
  • 提供16种音乐风格11种情绪类型10种场景设定的精细化控制
  • 高级模式支持为歌曲不同段落(前奏、主歌、副歌)分别编排特定歌词

2. 自然饱满的人声

  • 生成的声音更加通透真实,音色自然饱满
  • 演唱过渡平滑无断裂,极大丰富了歌曲的情感表达
  • 支持生成不同音质特征的人声色调和演唱风格

3. 丰富的编曲层次

  • 采用细粒度建模技术处理乐器音色
  • 编曲层次清晰,演奏技法多样
  • 特别支持中国传统民族乐器的生成,如在《江南雨与诗》歌曲中呈现多种民乐音色

4. 清晰的歌曲结构

  • 前奏、主歌、副歌段落区分明确
  • 副歌高潮部分突出,结尾自然
  • 提供真正的"叙事级"听觉体验

技术基础

Music 1.5基于MiniMax自研的多模态能力(文本、语音、视觉),利用文本模型的力量实现对文本描述的更强理解和控制。不仅支持对歌曲风格、情感色彩和适用场景的整体控制,还能实现对人声特征的细粒度控制。

应用场景

  • 专业音乐创作的AI灵感激发
  • 影视、游戏、短视频背景音乐的快速定制
  • 虚拟偶像歌曲和MV制作
  • 企业品牌专属音频内容生成
  • 通过API接口为全球开发者提供集成服务

可用性与体验

模型已面向全球开放,用户可登录minimaxi.com/audio/music进行体验。Music 1.5继续提供全球最高性价比的服务,无论是应用程序、工具还是创意工作流,都能轻松集成,成为"24小时创意伙伴"。

行业意义

Music 1.5的发布不仅降低了音乐创作门槛,更回归听觉本质,让"好听"的音乐自然发生。该模型支持流行、爵士、摇滚、布鲁斯等多种流派,特别加强对中国传统音乐的支持,正在重塑音乐创作生态。

火龙果频道