AI-NEWS · 2025年 11月 19日

ElevenLabs一站式生成多媒

ElevenLabs推出革命性更新：一站式生成图像、视频和音乐

核心更新

多模态AI领军企业ElevenLabs正式宣布：全新的"图像与视频平台"现已上线！这不再仅仅是一个语音工具，而是一个集成了图像生成、视频生成、语音合成、音乐创作和音效设计的超级AI内容工厂。

平台核心功能

一站式闭环创作

全流程整合：从零到成品视频，只需一个平台
无缝衔接：用户首先生成图像和动态视频，然后在同一界面直接叠加专业级旁白、背景音乐和环境音效
高效生产：从概念到可直接部署的营销视频，最快仅需几分钟

顶级模型矩阵

平台整合了全球最强的多模态模型矩阵：

视频模型：Google Veo（超长一致性视频）、OpenAI Sora（电影级画质）、Kling（超真实物理动画）
新兴力量：Nanobanana、Flux Kontext、Seedream等
音频模型：ElevenLabs自研自然AI语音和最新音乐生成模型

商业优化特性

多平台适配：支持直接输出竖屏/横屏比例，兼容抖音、小红书、TikTok、YouTube
商用安全：包含商用安全的语音和音乐库
多语言支持：一键替换旁白语言，轻松创建多语言版本
专业编辑：提供完整时间线编辑器，支持音视频精确帧级同步

实际效果展示

根据官方演示案例，仅需30秒文本即可在平台内完成：

生成品牌故事板图像
转换为流畅视频
添加CEO级自然旁白
叠加情感背景音乐和环境音效
导出4K商业成品

整个过程无需在Premiere、Midjourney、Runway和Suno之间切换文件。

行业影响

AIbase编辑部评论指出，ElevenLabs此举直接提升了"文本到视频"的天花板，更解决了最困难的音视频同步问题。当视觉生成和声音生成两大巨头联合，独立创作者和中小企业将面临真正的"降维打击"时代。

发布日期：2025年11月18日
来源：AIbase

火龙果频道

您可能还喜欢...