AI-NEWS · 2025年 2月 19日

谷歌代码泄露曝Gemini视频

Google Gemini视频生成功能技术解析（基于Android Authority线索）

一、核心功能升级路径

AI能力演进：Gemini已完成深度语境理解→文件处理优化→跨应用联动三阶段升级
新增视频生成：代码显示正在开发"videogen"模块（视频生成功能），与核心模块"robin"深度集成

二、技术线索分析

代码版本：Google App 16.6.23版发现关键字段

功能标识符：

"generate_video"  # 视频生成指令
"videogen_progress"  # 生成进度追踪

状态提示系统（新发现字符串）：
- ▶️ Generating video (0%) – 生成中
- ✅ Video generation complete – 生成完成
- ❌ Failed to generate video – 生成失败

三、与Google Vids的差异化对比

功能维度	Google Vids	Gemini视频生成（预测）
AI类型	流程引导型AI	生成式AI
核心功能	分步视频制作辅助	端到端自动生成
创作自由度	用户主导（70%人工输入）	AI主导（预计80%自动生成）
现有功能模块	脚本/布局/配音/绿幕	推测包含动态场景生成

四、技术突破预测

多模态整合：可能融合Imagen视频模型（Google Research最新成果）
算力需求：需配套升级TPU v5集群（当前TPU v4单卡显存16GB或成瓶颈）

五、当前进度

🚧 开发阶段：代码级验证完成（Alpha阶段）
📅 上线预测：2024 Q3-Q4（需通过AI伦理审查）
⚠️ 风险提示：生成内容版权问题尚未明确解决方案

▲ 数据源：Android Authority技术拆解 / AIbase数据库2024版

火龙果频道

您可能还喜欢...