AI-NEWS · 2025年 4月 24日

OpenAI发布图像API

OpenAI GPT Image API 功能分析报告

一、核心功能概述

  1. 图像生成(Generations)

    • 支持Python/JS/Shell三种调用方式
    • 基础参数:model(gpt-image-1)、prompt(文本描述)
    • 示例场景:儿童绘本风格的兽医检查水獭插图
  2. 图像编辑(Edits)

    • 支持多图合成(如礼品篮组合)
    • 遮罩修复(inpainting)功能
    • 透明背景处理能力
  3. 图像变体(Variations)

    • 基于DALL·E 2技术实现

二、技术参数详解

参数类别 可选值
分辨率 1024×1024 / 1024×1536 / 1536×1024
质量等级 low / medium / high / auto
输出格式 PNG / JPEG / WebP
背景模式 透明/不透明

三、开发者接口示例

1. 基础生成代码

from openai import OpenAI
client = OpenAI()
result = client.images.generate(
    model="gpt-image-1",
    prompt="A children's book illustration..."
)

2. 高级编辑功能

const rsp = await client.images.edit({
    model: "gpt-image-1",
    image: await toFile(fs.createReadStream("sunlitlounge.png")),
    mask: await toFile(fs.createReadStream("mask.png")),
    prompt: "A sunlit indoor lounge..."
});

四、商业应用场景

  1. 营销设计

    • Canva/HubSpot等平台的AI logo生成
    • 电商产品图合成(Instacart案例)
  2. UI设计工具

    • Figma/Wix的AI辅助设计
    • Adobe Firefly集成方案
  3. 内容创作

    • 像素艺术生成(2D游戏素材)
    • 插画创作(儿童绘本案例)

五、成本分析

  • 计费单位:按token计算

    • 短描述:5 tokens ($0.02)
    • 中等描述:10 tokens ($0.07)
    • 复杂描述:40 tokens ($0.19)
  • 文件限制

    • 单文件最大25MB
    • 透明背景仅支持PNG/WebP格式

六、版本对比

特性 DALL·E 2 DALL·E 3 GPT-Image-1
生成
编辑
变体
审核 基础 增强 auto/low

七、使用建议

  1. 优先选择1024×1024分辨率平衡质量与成本
  2. 商业应用推荐使用"high"质量模式
  3. 透明背景需求需显式声明background: "transparent"
  4. 复杂编辑建议使用遮罩+inpainting组合方案

火龙果频道