Thingi10K/Thingi10K
收藏Hugging Face2025-08-21 更新2025-11-01 收录
下载链接:
https://hf-mirror.com/datasets/Thingi10K/Thingi10K
下载链接
链接失效反馈官方服务:
资源简介:
Thingi10K是一个包含10,000个3D打印模型的规模化数据集,旨在研究现实世界3D打印模型的变化性、复杂性和质量。数据集由Qingnan Zhou和Alec Jacobson创建,包含了从2009年9月16日至2015年11月15日在Thingiverse.com网站上展示的所有物品的网格分析结果。数据集包含多种几何属性的模型,如非实体模型、自相交模型、共面自相交模型、多组件模型、非流形模型、退化面模型、非PWN模型、拓扑开放模型和非定向模型等。
Thingi10K is a large scale dataset containing 10,000 3D printing models, created to study the variety, complexity, and quality of real-world 3D printing models. The dataset was created by Qingnan Zhou and Alec Jacobson, based on the analysis of meshes from all items featured on Thingiverse.com between Sept. 16, 2009 and Nov. 15, 2015. It includes models with various geometric properties such as non-solid, self-intersecting, coplanar self-intersecting, multiple components, non-manifold, degenerate faces, non-PWN, topologically open, and non-oriented.
提供机构:
Thingi10K
搜集汇总
数据集介绍

构建方式
在三维打印技术蓬勃发展的背景下,真实世界模型的几何多样性与复杂性研究成为亟待突破的课题。Thingi10K数据集由Qingnan Zhou与Alec Jacobson精心构建,系统性地采集了2009年9月16日至2015年11月15日期间Thingiverse.com平台上所有物体的网格数据。经过严格筛选与整理,最终汇聚了涵盖1,083位设计师、2,011个事物、72个类别的10,000个三维模型,并辅以4,892个标签与10种开源许可信息,形成了一个兼具广度与深度的三维打印模型资源库。
使用方法
为便于研究者高效利用,Thingi10K提供了两种接入途径。其一为专用的thingi10k Python包,通过pip安装后,用户可调用init()函数初始化数据集,并利用dataset()迭代器遍历所有条目,获取文件标识符、作者、许可信息等上下文数据,再通过load_file()加载顶点与面片几何。其二,鉴于HuggingFace datasets库4.0版本后对多文件数据集的支持限制,推荐通过thingi10k包直接返回datasets.Dataset对象,实现与HuggingFace生态的无缝衔接。
背景与挑战
背景概述
Thingi10K数据集由Adobe研究院的Qingnan Zhou与多伦多大学的Alec Jacobson于2016年共同创建,旨在系统性地研究真实世界三维打印模型的多样性、复杂性与质量。该数据集从Thingiverse平台提取了2009年9月至2015年11月间发布的10,000个三维模型,覆盖72个类别、4,892个标签及1,083位设计师的作品,时间跨度超过七年。其核心研究问题聚焦于分析三维网格模型在几何属性上的统计分布,如非实体、自相交、非流形等缺陷的普遍性,为计算机图形学、几何处理与三维打印领域提供了宝贵的基准资源。Thingi10K的发布推动了三维模型修复、质量评估与生成算法的研究,成为该领域引用广泛的经典数据集。
当前挑战
Thingi10K所解决的领域问题在于三维打印模型普遍存在的几何缺陷,如50%的非实体模型、45%的自相交面及22%的非流形结构,这些缺陷严重影响了三维打印的成功率与模型的可操作性。构建过程中,数据集面临了从海量用户生成内容中筛选有效模型的挑战,需处理多样的许可协议(涵盖十种开源协议)与文件格式(99.6%为STL),并确保标签与分类的准确性。此外,数据集的维护与扩展需应对Thingiverse平台动态更新的特性,以及随时间推移模型质量分布的变化,这对持续更新与兼容性提出了要求。
常用场景
经典使用场景
Thingi10K数据集汇聚了来自Thingiverse平台的10,000个真实3D打印模型,覆盖了从简单几何体到复杂机械结构的广泛形态。其经典使用场景主要集中在三维网格质量分析与几何修复算法的评估上。研究者利用该数据集中标注的各类几何缺陷——如非流形结构、自交面、退化三角面等——来系统性地测试网格修复、简化与重构方法的鲁棒性。此外,该数据集还为三维形状分类、语义分割以及生成式建模任务提供了丰富的真实世界样本,成为推动数字几何处理领域基准测试的重要资源。
解决学术问题
该数据集的核心学术贡献在于系统性地揭示了真实3D打印模型与理想化合成数据之间的显著差异,解决了长期以来缺乏大规模真实世界网格质量标注数据的问题。通过量化分析发现,超过50%的模型为非实体结构,45%存在自交现象,这些统计特征为研究网格修复算法、拓扑一致性检测以及面向制造的几何验证提供了关键依据。Thingi10K的发布使得学术界能够从统计角度理解实际3D模型的复杂性分布,进而推动了鲁棒性更强的几何处理理论与算法的诞生。
实际应用
在实际应用层面,Thingi10K数据集为3D打印预处理软件、计算机辅助设计工具以及自动化网格质量检测系统提供了不可或缺的测试基准。企业开发者可借助该数据集验证其网格修复算法在处理真实世界模型时的表现,确保打印成功率。同时,该数据集也被广泛应用于三维内容生成与增强现实领域,用于训练能够处理非完美输入数据的深度学习模型,从而提升从扫描重建到数字孪生等全链条的工业自动化水平。
数据集最近研究
最新研究方向
Thingi10K数据集作为大规模真实3D打印模型的标杆资源,正推动着几何处理与数字制造领域的前沿探索。当前研究方向聚焦于利用该数据集的丰富几何缺陷标注(如非流形、自交、非实体等)来训练深度学习模型,实现自动化的网格修复与拓扑优化。同时,结合其多元标签与许可证信息,研究者正开展面向3D打印的生成式建模研究,例如通过条件扩散模型生成可直接打印的几何形状。该数据集还促进了数字版权管理领域的创新,其多许可证结构为基于区块链的3D模型溯源与授权机制提供了实验基础。Thingi10K的深远意义在于,它架起了计算机图形学与增材制造工业之间的桥梁,使得从真实世界打印失败案例中学习成为可能,从而推动低成本、高鲁棒性的桌面级3D打印技术普及。
以上内容由遇见数据集搜集并总结生成



