TRELLIS-500K
收藏TRELLIS 数据集概述
数据集简介
TRELLIS 是一个大规模 3D 资产生成模型,能够根据文本或图像提示生成高质量的 3D 资产,支持多种输出格式,如 Radiance Fields、3D Gaussians 和 meshes。其核心是统一的 Structured LATent (SLAT) 表示,允许解码为不同的输出格式,并采用 Rectified Flow Transformers 作为强大的骨干网络。TRELLIS 在包含 50 万个多样化对象的 3D 资产数据集上进行了大规模预训练,模型参数高达 20 亿。
数据集特点
- 高质量:生成具有复杂形状和纹理细节的多样化 3D 资产。
- 多功能性:支持文本或图像提示,生成多种 3D 表示形式,如 Radiance Fields、3D Gaussians 和 meshes。
- 灵活编辑:支持对生成的 3D 资产进行编辑,如生成同一对象的不同变体或局部编辑。
数据集更新
- 2024年12月26日:发布 TRELLIS-500K 数据集及数据准备工具包。
- 2024年12月18日:实现 TRELLIS-image 模型的多图像条件生成,并添加 Gaussian 导出功能。
数据集内容
- TRELLIS-500K:包含 50 万个 3D 资产,数据来源于 Objaverse(XL)、ABO、3D-FUTURE、HSSD 和 Toys4k,并根据美学评分进行筛选。
预训练模型
| 模型 | 描述 | 参数量 | 下载链接 |
|---|---|---|---|
| TRELLIS-image-large | 大型图像到 3D 模型 | 12 亿 | 下载 |
| TRELLIS-text-base | 基础文本到 3D 模型 | 342M | 即将发布 |
| TRELLIS-text-large | 大型文本到 3D 模型 | 11 亿 | 即将发布 |
| TRELLIS-text-xlarge | 超大型文本到 3D 模型 | 20 亿 | 即将发布 |
使用示例
提供最小化示例代码,展示如何使用预训练模型进行 3D 资产生成,并支持生成多种格式的 3D 资产,如 3D Gaussians、Radiance Fields 和 meshes。
许可证
TRELLIS 模型和大部分代码采用 MIT 许可证,部分子模块可能采用不同的许可证。
引用
如果使用该数据集,请引用以下论文: bibtex @article{xiang2024structured, title = {Structured 3D Latents for Scalable and Versatile 3D Generation}, author = {Xiang, Jianfeng and Lv, Zelong and Xu, Sicheng and Deng, Yu and Wang, Ruicheng and Zhang, Bowen and Chen, Dong and Tong, Xin and Yang, Jiaolong}, journal = {arXiv preprint arXiv:2412.01506}, year = {2024} }




