five

TexVerse

收藏
arXiv2025-08-15 更新2025-08-16 收录
下载链接:
https://sketchfab.com/
下载链接
链接失效反馈
官方服务:
资源简介:
TexVerse是一个大规模的3D数据集,包含超过858K个独特的具有高分辨率纹理的3D模型,来源于Sketchfab。数据集包括超过158K个具有基于物理渲染(PBR)材质的模型。每个模型都包含其所有的高分辨率变体,总数达到1.6M个3D实例。TexVerse还包括专门的子集:TexVerse-Skeleton,包含69K个绑定了骨骼的模型,以及TexVerse-Animation,包含54K个动画模型,这两个子集都保留了用户上传的原始骨骼和动画数据。数据集还提供了详细的模型注释,描述了模型的总体特征、结构组件和精细特征。TexVerse是一个高质量的数据资源,具有广泛的应用潜力,可用于纹理合成、PBR材质开发、动画以及各种3D视觉和图形领域。

TexVerse is a large-scale 3D dataset containing over 858,000 unique high-resolution textured 3D models sourced from Sketchfab. The dataset encompasses more than 158,000 models with Physically Based Rendering (PBR) materials. Each model includes all its high-resolution variants, totaling 1.6 million 3D instances. TexVerse also includes specialized subsets: TexVerse-Skeleton, which contains 69,000 skinned models, and TexVerse-Animation, which contains 54,000 animated models. Both subsets retain the original skeletal and animation data uploaded by users. The dataset also provides detailed model annotations that describe the overall characteristics, structural components, and fine-grained features of the models. TexVerse is a high-quality data resource with broad application potential, applicable to texture synthesis, PBR material development, animation, and various 3D vision and graphics fields.
提供机构:
上海创新研究院、吉林大学、复旦大学、同济大学
创建时间:
2025-08-15
搜集汇总
数据集介绍
main_image_url
构建方式
在三维数字资产日益渗透现代生活和工业领域的背景下,TexVerse数据集通过系统化采集与筛选流程构建而成。研究团队对Sketchfab平台2012至2025年间约160万可自由下载的3D模型进行元数据分析,筛选纹理分辨率≥1024像素且符合可分发知识共享许可协议的模型,最终形成858,669个独特高分辨率三维模型。针对骨骼绑定和动画类模型,额外保留用户原始上传格式以避免信息丢失,由此衍生出包含69,138个骨骼绑定模型和54,430个动画模型的专用子集。所有数据均采用.glb格式标准化处理,并配套856,312条基于GPT-5生成的标准化描述注释。
特点
TexVerse的突出特征体现在三维资产的纹理质量与数据多样性。作为当前最大规模的高分辨率纹理3D数据集,其158,518个模型配备基于物理渲染(PBR)材质,涵盖金属度与高光两种标准工作流。数据分辨率呈现阶梯式分布(1024至8192像素),且包含1,659,097个不同分辨率变体实例。特别构建的TexVerse-Skeleton和TexVerse-Animation子集完整保留了原始骨骼结构与动画数据,弥补了常规格式转换中的信息损耗。数据集覆盖文化遗迹、建筑、角色生物等20余个类别,模型平均顶点数达206万,为三维视觉研究提供了前所未有的细粒度素材。
使用方法
该数据集支持多模态三维生成任务的端到端研究。研究者可通过解析.glb文件获取完整网格结构与纹理贴图,利用配套元数据实现基于材质类型、分辨率或类别的数据筛选。针对纹理生成任务,建议优先采用PBR材质子集进行金属度/粗糙度通道的联合训练。动画研究方向可通过TexVerse-Animation子集提取骨骼蒙皮权重与关键帧数据。配套的GPT-5标注为文本引导三维生成提供了结构化提示模板,其标准三句式描述(整体特征-组件结构-细节属性)可有效支持跨模态对齐研究。所有模型均符合CC BY或CC0许可协议,支持学术与商业场景的合规使用。
背景与挑战
背景概述
TexVerse是由上海创新研究院、吉林大学、复旦大学和同济大学的研究团队于2025年推出的一个大规模高分辨率纹理3D对象数据集。该数据集填补了当前3D生成领域中高分辨率纹理端到端生成研究的空白,包含来自Sketchfab平台的858,669个独特高分辨率3D模型,其中158,518个模型具有基于物理的渲染(PBR)材料。TexVerse不仅提供了标准化的.glb格式数据,还特别包含了TexVerse-Skeleton和TexVerse-Animation两个子集,分别保存了69,138个绑定骨骼模型和54,430个动画模型的原始文件格式,以避免在格式转换过程中丢失关键信息。此外,数据集还配备了由GPT-5生成的856,312条详细模型注释,涵盖了整体描述、结构组成和细节特征。TexVerse的发布为高分辨率纹理生成、PBR材料合成、动画及广泛的3D视觉与图形应用提供了高质量的数据支持。
当前挑战
TexVerse数据集在构建过程中面临多重挑战。从领域问题来看,当前3D生成技术在高分辨率几何生成方面已取得显著进展,但高分辨率纹理和PBR材料的端到端生成仍缺乏足够的数据支持,现有方法多依赖低分辨率生成后通过超分辨率等后处理技术提升质量,这限制了生成效果的真实感和细节表现。从构建过程来看,挑战包括:1)数据筛选的复杂性,需从Sketchfab平台约160万个模型中过滤出纹理分辨率不低于1024像素且符合可分发Creative Commons许可的模型;2)数据质量的保障,尽管依赖Sketchfab的元数据标注,但可能存在偶尔的标注错误,且需进一步清理以确保几何质量和纹理清晰度的一致性;3)信息完整性的维护,特别是在处理绑定骨骼和动画模型时,需保留原始文件格式以避免关键信息的丢失。这些挑战的解决对于提升数据集的可靠性和适用性至关重要。
常用场景
经典使用场景
TexVerse数据集在计算机视觉与图形学领域的高分辨率纹理生成研究中具有经典应用价值。该数据集通过提供858,669个独特的高分辨率3D模型,包括158,518个具有物理渲染(PBR)材质的模型,为研究者提供了丰富的实验素材。其核心应用场景包括基于深度学习的纹理合成算法开发、PBR材质属性分析与建模,以及多分辨率纹理映射技术验证。数据集覆盖了从1024到8192像素的多级纹理分辨率,为研究高保真度纹理的生成与优化提供了基准平台。
衍生相关工作
基于TexVerse衍生的研究包括Hunyuan3D 2.5的高保真3D生成框架、Ultra3D的部件注意力机制,以及CLAY可控生成模型。这些工作均引用TexVerse作为核心训练数据,在SIGGRAPH等顶会发表的多篇论文已验证了其学术价值。MIT媒体实验室开发的TexNet纹理超分网络,通过该数据集的4096-8192分辨率配对数据,实现了纹理细节增强的突破性进展。
数据集最近研究
最新研究方向
随着三维数字资产在游戏、影视及具身智能等领域的深度融合,高分辨率纹理的三维模型生成技术成为当前研究热点。TexVerse数据集的推出填补了现有大规模三维数据集中高分辨率纹理资源的空白,其包含85.8万个独特的高分辨率三维模型,其中15.8万个具备物理渲染(PBR)材质,为纹理合成、PBR材质开发及动画生成等前沿方向提供了高质量数据支撑。该数据集通过标准化.glb格式及保留原始骨骼与动画信息,显著提升了三维生成模型的训练效果,尤其在端到端高分辨率纹理生成这一长期受限于数据质量的领域展现出突破潜力。TexVerse的类别多样性(涵盖文化遗产、建筑、角色设计等17个领域)与细粒度标注(856K条GPT-5生成的结构化描述)进一步推动了多模态三维生成、语义感知纹理合成等交叉研究方向的发展。
相关研究论文
  • 1
    TexVerse: A Universe of 3D Objects with High-Resolution Textures上海创新研究院、吉林大学、复旦大学、同济大学 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作