five

TRELLIS-500K

收藏
github2024-12-26 更新2024-12-27 收录
下载链接:
https://github.com/microsoft/TRELLIS
下载链接
链接失效反馈
官方服务:
资源简介:
TRELLIS-500K是一个包含50万个多样化对象的大型3D资产数据集,用于训练TRELLIS模型。

TRELLIS-500K is a large-scale 3D asset dataset containing 500,000 diverse objects, designed for training the TRELLIS model.
创建时间:
2024-12-02
原始信息汇总

TRELLIS 数据集概述

数据集简介

TRELLIS 是一个大规模 3D 资产生成模型,能够根据文本或图像提示生成高质量的 3D 资产,支持多种输出格式,如 Radiance Fields、3D Gaussians 和 meshes。其核心是统一的 Structured LATent (SLAT) 表示,允许解码为不同的输出格式,并采用 Rectified Flow Transformers 作为强大的骨干网络。TRELLIS 在包含 50 万个多样化对象的 3D 资产数据集上进行了大规模预训练,模型参数高达 20 亿。

数据集特点

  • 高质量:生成具有复杂形状和纹理细节的多样化 3D 资产。
  • 多功能性:支持文本或图像提示,生成多种 3D 表示形式,如 Radiance Fields、3D Gaussians 和 meshes。
  • 灵活编辑:支持对生成的 3D 资产进行编辑,如生成同一对象的不同变体或局部编辑。

数据集更新

  • 2024年12月26日:发布 TRELLIS-500K 数据集及数据准备工具包。
  • 2024年12月18日:实现 TRELLIS-image 模型的多图像条件生成,并添加 Gaussian 导出功能。

数据集内容

  • TRELLIS-500K:包含 50 万个 3D 资产,数据来源于 Objaverse(XL)、ABO、3D-FUTURE、HSSD 和 Toys4k,并根据美学评分进行筛选。

预训练模型

模型 描述 参数量 下载链接
TRELLIS-image-large 大型图像到 3D 模型 12 亿 下载
TRELLIS-text-base 基础文本到 3D 模型 342M 即将发布
TRELLIS-text-large 大型文本到 3D 模型 11 亿 即将发布
TRELLIS-text-xlarge 超大型文本到 3D 模型 20 亿 即将发布

使用示例

提供最小化示例代码,展示如何使用预训练模型进行 3D 资产生成,并支持生成多种格式的 3D 资产,如 3D Gaussians、Radiance Fields 和 meshes。

许可证

TRELLIS 模型和大部分代码采用 MIT 许可证,部分子模块可能采用不同的许可证。

引用

如果使用该数据集,请引用以下论文: bibtex @article{xiang2024structured, title = {Structured 3D Latents for Scalable and Versatile 3D Generation}, author = {Xiang, Jianfeng and Lv, Zelong and Xu, Sicheng and Deng, Yu and Wang, Ruicheng and Zhang, Bowen and Chen, Dong and Tong, Xin and Yang, Jiaolong}, journal = {arXiv preprint arXiv:2412.01506}, year = {2024} }

搜集汇总
数据集介绍
main_image_url
构建方式
TRELLIS-500K数据集的构建基于多个公开的3D资产数据集,包括Objaverse(XL)、ABO、3D-FUTURE、HSSD和Toys4k。通过严格的筛选标准,基于美学评分从这些数据集中精选出500K个3D资产,确保了数据集的高质量和多样性。这一构建过程不仅整合了多个来源的数据,还通过过滤机制提升了数据的整体质量,为后续的3D生成任务提供了坚实的基础。
使用方法
使用TRELLIS-500K数据集时,用户可以通过预训练的模型进行3D资产生成。首先,用户需要安装必要的依赖项,并加载预训练模型。随后,通过输入文本或图像提示,模型将生成高质量的3D资产。生成的资产可以以多种格式输出,包括Radiance Fields、3D Gaussians和meshes。用户还可以对生成的资产进行进一步处理,如提取GLB文件或保存为PLY文件。此外,数据集还提供了Web演示工具,用户可以通过Gradio框架进行交互式操作,直观地体验3D生成过程。
背景与挑战
背景概述
TRELLIS-500K数据集由微软研究团队于2024年发布,旨在推动3D生成领域的技术进步。该数据集的核心研究问题在于如何通过统一的潜在表示(Structured LATent, SLAT)实现高质量、多样化的3D资产生成。TRELLIS-500K包含了50万个经过美学评分筛选的3D资产,涵盖了从Objaverse(XL)、ABO、3D-FUTURE、HSSD和Toys4k等多个来源的数据。该数据集的发布为3D生成模型提供了丰富的训练资源,显著提升了生成模型的多样性和质量,尤其是在复杂形状和纹理细节的表现上。TRELLIS-500K的推出不仅推动了3D生成技术的发展,还为相关领域的应用提供了新的可能性。
当前挑战
TRELLIS-500K数据集在构建和应用过程中面临多重挑战。首先,3D生成领域本身具有高度复杂性,如何从文本或图像提示中生成高质量且多样化的3D资产是一个核心难题。尽管TRELLIS-500K通过统一的潜在表示(SLAT)和Rectified Flow Transformers提升了生成效果,但在处理复杂几何结构和纹理细节时仍存在一定局限性。其次,数据集的构建过程中,如何从多个来源的3D资产中进行有效筛选和整合,确保数据的多样性和美学质量,也是一个技术难点。此外,大规模3D数据的存储、处理和渲染对硬件和软件提出了较高要求,尤其是在实时生成和编辑场景中,计算资源的消耗和效率问题仍需进一步优化。
常用场景
经典使用场景
TRELLIS-500K数据集在3D生成领域具有广泛的应用,尤其是在基于文本或图像提示生成高质量3D资产方面。该数据集通过其统一的Structured LATent(SLAT)表示,能够灵活地解码为多种输出格式,如辐射场、3D高斯和网格。这一特性使得TRELLIS-500K在3D生成任务中表现出色,成为研究者和开发者在探索3D生成模型时的首选工具。
解决学术问题
TRELLIS-500K数据集解决了3D生成领域中的多个关键学术问题,尤其是在大规模3D资产生成和多样化输出格式支持方面。通过其SLAT表示和Rectified Flow Transformers,该数据集显著提升了3D生成的质量和灵活性,克服了传统方法在生成复杂形状和纹理细节时的局限性。此外,其本地编辑能力为3D资产的个性化定制提供了新的研究方向。
实际应用
在实际应用中,TRELLIS-500K数据集被广泛用于游戏开发、虚拟现实和增强现实等领域。其能够根据文本或图像提示快速生成高质量的3D资产,极大地提高了内容创作的效率。此外,其灵活的编辑功能使得开发者能够轻松地对生成的3D资产进行修改和优化,满足不同应用场景的需求。
数据集最近研究
最新研究方向
在三维生成领域,TRELLIS-500K数据集的推出标志着大规模三维资产生成技术的重大突破。该数据集通过整合多个高质量的三维资源库,如Objaverse(XL)、ABO和3D-FUTURE等,构建了一个包含50万个多样化三维资产的庞大集合。其核心创新在于引入了结构化潜在表示(SLAT),使得模型能够灵活地生成多种三维表示形式,如辐射场、三维高斯分布和网格。这一技术不仅显著提升了生成质量,还实现了局部编辑和多样化输出,为三维内容创作提供了前所未有的灵活性。当前研究热点集中在如何进一步优化SLAT表示,以支持更复杂的三维场景生成和实时交互应用,推动三维生成技术在虚拟现实、游戏开发和工业设计等领域的广泛应用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作