PhotoMaker：利用多个输入图片创建人物ID表示来生成一致性人物图像

PhotoMaker 是由腾讯 ARC 实验室和南开大学 MCG-NKU 合作开发的一种高效个性化文本到图像生成方法。其核心是通过堆叠 ID 嵌入来生成逼真的人像照片，能够快速、高质量地根据文本提示生成符合描述的高保真度人像图片。具体流程包括：

个性化生成
- 高效生成：无需额外的 LoRA 训练，只需一次前向传递即可完成。
- 身份保真：能够精确保持输入人物的身份特征，即使在多样化的生成条件下。
风格化生成
- 多种风格：在保持人物身份特征的同时，可生成不同风格（如绘画、漫画等）的图像。
- 风格转换：将人物从现实照片转换为各种艺术风格的图像。
改变年龄或性别
- 年龄变化：通过修改文本提示，可以生成不同年龄段的同一人物图像。
- 性别转换：实现人物性别转换，同时保持原有的身份特征。
身份混合
- 多身份融合：将多个不同身份的特征融合，生成新的综合身份。
- 比例控制：通过控制输入图像的比例，调整生成图像中各个身份特征的权重。

提供超过1000+的会员内容，每天更新，用户可以获得更多教程和功能详解。

通过以上功能，PhotoMaker 展示了其在个性化图像生成、风格化处理以及身份特征保真方面的强大能力。

近期新闻