En3D是什么?
En3D是由阿里巴巴智能计算研究所与北京大学联合研发的一项创新项目,它运用人工智能技术实现从2D图像到3D人物模型的自动转化。该项目的一大突破在于无需借助现成的3D数据或真实的2D素材作为基础,而是通过深度分析并学习海量合成图像数据,从而精准地理解并重构3D人物的立体形态与视觉特征。 En3D已公开发布相关研究论文与源代码,对这一技术感兴趣的用户可以自行探索实践。
- 项目主页:https://menyifang.github.io/projects/En3D/index.html
- 学术论文:http://arxiv.org/abs/2401.01173
- 开源代码:https://github.com/menyifang/En3D
En3D的工作原理
En3D的运作机制主要包含三大核心流程:三维生成建模(3DGM)、几何造型(GS)以及显式纹理(ET)。
- 3DGM模块采用多样化、均衡化且结构化的合成人类图像数据集,配合精确的相机参数φ,致力于学习具有三平面架构的可泛化3D人物表示。
- GS组件集成了一个优化算法,通过多视角法线约束对模型进行细节细化与形态雕刻。
- ET技术运用UV分割与可微光栅化方法,生成明确的UV纹理贴图,最终实现多视角渲染与高精度3D模型输出。
En3D可以做什么?
- 文本驱动生成:支持根据文本描述创建具有特定外貌的3D人物模型。
- 图像转化生成:能够将现有图像转化为3D模型形态。
- 局部参数编辑:允许对已生成的3D模型进行局部调整,例如更换服装或修改面部特征。
En3D适用人群
En3D特别适合以下用户群体:
- 游戏开发从业者:可用于构建游戏场景中的虚拟角色。
- 影视动画创作者:适用于电影或电视剧中的动画角色设计。
- 视觉特效设计师:在制作高端视觉特效时提供技术支持。
- 学术研究者与学生:对3D建模与人工智能技术有探索需求的个人。
En3D作为一款创新工具,成功融合了人工智能与3D建模技术,为逼真人物模型的创作开辟了新的技术路径。
评论 ( 0 )