咨询热线:0898-0663522100

最新爆火3D生成模型清北硬核00后成团再出击丨开源

添加时间:2024-06-25 23:52:20

  Gradio官方也忍不住下场发推文分享,让大伙儿瞧瞧这个算不算是目前最好的图像转3D模型:

  CEO毕业于北大计算机系,NOI WC金牌、最佳女选手得主;CTO来自清华姚班;不少成员还是CG Artist,擅长利用CG进行艺术创作,COO就是北大艺术史论与工商管理双学位;团队成立一年内就顺利完成了三轮融资……

  量子位还打听到,基于该模型打造的产品还即将上线一波新功能:一张图生成3D全景图,一键将视频人物替换为生成角色。

  细心的家人们可能已经发现了,开头提到的这个爆火的开源模型名为Unique3D,主打高保真度、高一致性、高效率单图转3D。

  比起以往基于Score Distillation Sampling(SDS)等方法,Unique3D解决了模型生成需要长时间优化,几何质量差,存在不一致性的问题。

  而且Unique3D也优化了基于多视图扩散模型方法受限于局部不一致性和生成分辨率,难以产生精细的纹理和复杂的几何细节的问题。

  Unique3D一上线,团队就开源了使用大型开源3D数据集Objaverse训练出的模型版本,还放出了Demo给大伙儿玩。

  Demo界面很简洁,只需要上传一张图片,然后点击Generate 3D就可以了,也可以简单调整参数Seed,勾选去除背景:

  紧接着,生成速度非常快,相比此前模型需要几分钟的生成时间,Unique3D几十秒就能将一张图“啪”的一下转3D:

  你别说,感觉3D生成后的可爱度直线上升,关键Unique3D生成的纹理和质感都和原图高度一致。

  在抱抱脸的3D竞技场中,Unique3D目前排名第二,和第一名的InstantMesh差距也很小,票差24:

  不过,Unique3D的生成也会有一些瑕疵,比如有时背面分辨率不高,会有一些小斑点等。

  对此开发团队表示会继续优化算法,并且有个小Tip:上传的图最好是标准的正面图、无遮挡的那种。

  此外,团队还表示最近将加入更多视角的参考,提升对不同视角的兼容度,由于一直在优化算法,模型稳定性可能会受干扰。

  整个流程分三个主要阶段:多视图生成、高分辨率上采样、3D Mesh重建。

  具体来说,输入一张图,首先微调版Stable Diffusion模型会根据这张图生成四个256×256分辨率的正交多视图图像,也就是从单一视角推断出物体的其它视角。

  然后,通过一个高分辨率上采样过程,使用ControlNet-Tile将图像分辨率提升至512×512,再用Real-ESRGAN进一步提升至2048×2048,同时利用专门的法线扩散模型生成对应的高分辨率法线图。

  接着,团队提出了ISOMER算法,直接基于Mesh进行3D重建,计算负载与空间分辨率的平方成正比。

  由此,从性能上讲,输入一张图在RTX4090 GPU上仅需30秒即可完成3D转换,生成的3D Mesh模型在几何精度和纹理细节上都显著优于基准。

  有些人对其可能并不陌生,毕竟自2021年成立以来,AVAR AI就在3D这条赛道上多次崭露头角,成立一年后成功融资三轮。

  创始人兼CEO胡雅婷,毕业于北大计算机系,曾在谷歌、阿里、字节做过算法工程师。

  技术合伙人兼CTO吴凯路,来自清华姚班,在叉院做3D生成和NeRF相关研究,曾提出了FSD(text-to-3d流分数蒸馏)和MemSR(高效训练超分辨率模型)等工作。

  在此之前,胡雅婷和吴凯路分别拿过NOI全国信息学奥林匹克竞赛WC金牌、金牌,吴凯路是国家集训队,胡雅婷是最佳女选手。

  COO任靳珊,本科毕业于北大,获艺术史论与工商管理双学位,硕士毕业于芝加哥大学,曾在海内外美术馆、腾讯艺术等有过策展商务文创经历。

  CEO胡雅婷还透露,团队目前严格意义上的全职员工很少,有一半是深度合作的AI研究员,还有一半是3D艺术家。

  其本人在参加信息学算法竞赛前也非常喜欢艺术创作,算法在她看来也是一个非常有创造性的过程:

  之所以想创业做图形学,也是因为很喜欢皮克斯,皮克斯就是一个典型的技术+艺术团队。

  我们比较关注3D应用场景以及它的下一步,希望可以通过比如做动画以及新的交互方式实现4D,这样就可以让创作者创作出真正有表达力的IP或是数字媒体内容。所以这个过程中可能竞争力并不是技术本身,我们接下来也会重点关注作品的艺术性和IP的潜力,以及做好创作者社群。

  在她看来,形成这种“创作者经济”会是AVAR AI区别于API工具等模式的壁垒,像是Midjourney就形成了一套创作者生态和网络效应。

  而AVAR AI此前在AI生成3D内容方面的工作,也为团队新的3D生成项目打下了基础。

  在Unique3D之前,AVAR AI的一条业务主线是专注于元宇宙数字品牌,与动画影视公司、知名IP、互联网大厂等都有过合作,例如曾和阿里合作推出3D星球生成器、与奥飞娱乐合作打造IP形象。

  面向年轻用户,AVAR AI推出的应用也更加多元,AR、VR、XR方面也有涉猎。

  对于新研发的Unique3D模型,团队除开源了用开源数据集训练的模型外,还用更高质量的商用私有数据对模型进行了工程优化并上线到产品网页端——Aiuni AI。

  上面提到的更多更具表达力的3D应用场景,也在部署中,打开Aiuni AI主页就能看到即将上线D world,一句线度全景,而且不只是一张全景图,用户可以导出Mesh,也就是

  此外,还有一个叫做DreamCamera功能也将会逐步推出,基于团队的另一项研究Camera Dreamer打造,可以一键将视频人物替换为生成角色,同时Aiuni AI还兼容VisionPro等MR的渲染环境:

  在被量子位问到作为一名年轻的科技创业者,有何见解可以分享给其他有志于进入科技和创业领域的年轻人,Aiuni AI CEO胡雅婷给出了这样的回答:

  我觉得年轻人就一定要做新模态。比如AIGC创业,文本、图像、视频,大厂都已经入局了,造了很多通用大模型。而年轻人就得去找一些新的模态,要有新的数据和算法,并且有增量的或是下一代的应用场景。你觉得Unique3D、Aiuni AI的表现如何?感兴趣的家人们可以玩起来了~雷竞技官网下载


本文由:雷竞技打印公司提供