国内公司超自然(Deemos Technology)刚发了个大新闻:Rodin Gen-2.5 来了。简单说,这玩意儿让 3D 生成从“随便看看”变成了“真能干活”,细节做得相当细,达到了毛孔那种级别。
快得离谱,面数也够多
这模型最大的卖点就是快和细。别的还在磨磨唧唧算的时候,它 4 秒钟就能吐出一个百万面的模型。
最夸张的是,它甚至能搞出千万面级的东西。要知道,以前那种要跑好几分钟、甚至更久的生成过程,现在被按在地上摩擦了。
至于细节?以前 AI 生成的模型,拓扑结构乱七八糟,脸上还全是窟窿,这问题算是彻底解决了。毛孔、皮肤纹理,这些以前很难搞定的微观结构,现在都能出来。
怎么调?自己选
借鉴了大语言模型那种“想清楚再说话”的思路,这模型搞了个“自适应思考力度”。你不用猜它要跑多久,直接选个档位:
- 极低模式:4 秒出结果,适合随便搭搭原型或者大规模测试,别指望太精细。
- 低模式:9 秒,适合做个极简风格或者那种硬邦邦的小道具。
- 中模式:20 秒,结构比较平衡,细节适中,日常用用挺合适。
- 高级模式:40 秒,质量上来了,表面光滑,结构也丰富,算是高质量资产。
- 极高模式:80 秒,这是重火力,专门用来抠那种专业级的微观细节。
这种分层设计挺实用的。你是想快速试错,还是想直接出个高保真成品?自己挑,省得在那干等。
纹理是原生的,不用贴图糊弄
以前行业里有个懒办法,就是拿张 2D 图转成 3D,结果生成的纹理经常糊成一团,背面还是一片黑。Rodin Gen-2.5 没走这条捷径,它是直接生成原生 3D 纹理。
只要给张参考图,它就能生成带 PBR 材质的完整模型。
- 360°无死角:纹理是在 3D 空间里算出来的,不是贴上去的,所以背面、底部完全不用担心模糊或者拉伸。
- 跟着形状走:纹理是严格贴合几何体的。像衣服上的褶皱、轮胎上的花纹,这些细微的地方它都能处理得比较自然。
- 两种模式可选:
- 忠实模式:死磕参考图,像素级还原。
- 创意模式:有点“脑补”成分,会自动优化结构。比如你给个变形的轮胎,它可能直接给你整成个完美的圆,或者自动补全形状。
- 精度随便切:最高精度下,你还能在“微观细节”和“干净光滑的几何体”之间切换。想要那种极度写实的渲染用前者,要做动画或者风格化作品就用后者。
- 一次出多个:它能同时跑,一次给你出最多 10 个结果。灵感枯竭的时候,随便挑挑看,效率确实高。
这技术有点来头
超自然这个团队不是刚起步的新手,人家从 2016 年就开始搞 3D 生成了。
现在的行业风气都是走"2D 转 3D"的捷径,图快省事。但这团队偏不,选了条更难走的路——原生 3D 路径。虽然难,但脸不崩了,拓扑也不乱了,算是治好了大家的“疑难杂症”。
而且,人家论文拿了 SIGGRAPH 2025 的最佳论文奖。这可是个硬指标,往年拿这个奖的大多是 Google 和 Meta 这种大厂,商业公司能拿到的很少。这说明啥?说明这技术在全球范围内绝对是顶尖的,没跑了。
以后怎么用?
根据 AIbase 的分析,Rodin Gen-2.5 的发布是个信号,意味着 AI 生成 3D 模型这事儿,马上就要从“玩具”变成“生产工具”了。
- 游戏公司:做资产不用那么熬了,门槛和成本都降下来。
- 电商:商品 3D 展示图,一键生成,省下的钱够发奖金了。
- AR/VR:虚拟内容要更逼真,高保真度是必须的。
- 3D 打印:直接打印,精度够高,不用二次建模。
说白了,以后做 3D 内容,普通人也能用这工具搞出专业级的东西,整个数字内容产业链估计得抖三抖。
不过说实话,虽然参数很漂亮,但 4 秒生成百万面模型这事儿,到底在真实场景里稳不稳定,还得看大家实际用起来的效果。
