AI-NEWS · 2025年 7月 25日

开源AI绘图工具

Openjourney：基于Google Gemini SDK的一站式AI图像与视频生成工具

项目概述

由ammaar开发的创新项目Openjourney近期引发广泛关注。该工具不仅巧妙模仿MidJourney的界面设计，更在技术核心深度整合Google Gemini SDK，并融合强大的Imagen4与Veo23模型，为用户提供一站式AI图像与视频生成解决方案。

核心功能

图像生成

技术模型：采用Imagen4模型
输出规格：每次生成4张1024×1024像素高清图像
界面设计：
- 借鉴MidJourney经典四宫格布局
- 新增实时加载动画提升体验
交互功能：
- 支持直接下载
- 缩放查看
- 一键转视频

视频生成

文本生成视频：
- 使用Veo3模型
- 生成3-5秒720p带音频短视频
图像转视频：
- 采用Veo2模型
- 支持静态图转动画视频
展示方式：
- 2×2网格布局
- 鼠标悬停自动播放

用户体验优化

简洁直观的输入框设计
支持回车键或"Generate"按钮触发生成
全屏查看与作品下载功能
方向键浏览历史记录（相册式体验）
加载时显示骨架屏占位符
通过Framer Motion实现流畅动效

技术架构

技术栈	用途	版本/组件
前端框架	基础架构	Next.js 15
开发工具	编译优化	Turbopack
样式系统	界面构建	Tailwind CSS v4
动效引擎	交互效果	Framer Motion
UI组件库	界面标准化	ShadCN/Radix UI
类型系统	代码可靠性	TypeScript
AI核心	图像/视频生成	Google Gemini SDK

技术亮点

通过Gemini SDK调用Imagen4/Veo23模型
实现专业级AI创作工具的开源化
为开发者提供优质二次开发基础

行业影响

Openjourney的发布为开源社区带来了极具潜力的MidJourney替代方案，展现了Google AI技术在创意应用领域的广阔前景。

火龙果频道

您可能还喜欢...