AI-NEWS · 2025年 2月 19日

谷歌代码泄露曝Gemini视频

Google Gemini视频生成功能技术解析(基于Android Authority线索)

一、核心功能升级路径

  1. AI能力演进:Gemini已完成深度语境理解→文件处理优化→跨应用联动三阶段升级
  2. 新增视频生成:代码显示正在开发"videogen"模块(视频生成功能),与核心模块"robin"深度集成

二、技术线索分析

  • 代码版本:Google App 16.6.23版发现关键字段
  • 功能标识符
    "generate_video"  # 视频生成指令
    "videogen_progress"  # 生成进度追踪
    
  • 状态提示系统(新发现字符串):
    • ▶️ Generating video (0%) – 生成中
    • ✅ Video generation complete – 生成完成
    • ❌ Failed to generate video – 生成失败

三、与Google Vids的差异化对比

功能维度 Google Vids Gemini视频生成(预测)
AI类型 流程引导型AI 生成式AI
核心功能 分步视频制作辅助 端到端自动生成
创作自由度 用户主导(70%人工输入) AI主导(预计80%自动生成)
现有功能模块 脚本/布局/配音/绿幕 推测包含动态场景生成

四、技术突破预测

  1. 多模态整合:可能融合Imagen视频模型(Google Research最新成果)
  2. 算力需求:需配套升级TPU v5集群(当前TPU v4单卡显存16GB或成瓶颈)

五、当前进度

  • 🚧 开发阶段:代码级验证完成(Alpha阶段)
  • 📅 上线预测:2024 Q3-Q4(需通过AI伦理审查)
  • ⚠️ 风险提示:生成内容版权问题尚未明确解决方案

▲ 数据源:Android Authority技术拆解 / AIbase数据库2024版

火龙果频道