AI-NEWS · 2025年 7月 25日

开源AI绘图工具

Openjourney:基于Google Gemini SDK的一站式AI图像与视频生成工具

项目概述

由ammaar开发的创新项目Openjourney近期引发广泛关注。该工具不仅巧妙模仿MidJourney的界面设计,更在技术核心深度整合Google Gemini SDK,并融合强大的Imagen4与Veo23模型,为用户提供一站式AI图像与视频生成解决方案。

核心功能

图像生成

  • 技术模型:采用Imagen4模型
  • 输出规格:每次生成4张1024×1024像素高清图像
  • 界面设计
    • 借鉴MidJourney经典四宫格布局
    • 新增实时加载动画提升体验
  • 交互功能
    • 支持直接下载
    • 缩放查看
    • 一键转视频

视频生成

  • 文本生成视频
    • 使用Veo3模型
    • 生成3-5秒720p带音频短视频
  • 图像转视频
    • 采用Veo2模型
    • 支持静态图转动画视频
  • 展示方式
    • 2×2网格布局
    • 鼠标悬停自动播放

用户体验优化

  • 简洁直观的输入框设计
  • 支持回车键或"Generate"按钮触发生成
  • 全屏查看与作品下载功能
  • 方向键浏览历史记录(相册式体验)
  • 加载时显示骨架屏占位符
  • 通过Framer Motion实现流畅动效

技术架构

技术栈 用途 版本/组件
前端框架 基础架构 Next.js 15
开发工具 编译优化 Turbopack
样式系统 界面构建 Tailwind CSS v4
动效引擎 交互效果 Framer Motion
UI组件库 界面标准化 ShadCN/Radix UI
类型系统 代码可靠性 TypeScript
AI核心 图像/视频生成 Google Gemini SDK

技术亮点

  • 通过Gemini SDK调用Imagen4/Veo23模型
  • 实现专业级AI创作工具的开源化
  • 为开发者提供优质二次开发基础

行业影响

Openjourney的发布为开源社区带来了极具潜力的MidJourney替代方案,展现了Google AI技术在创意应用领域的广阔前景。

火龙果频道