Thingi10K
收藏Hugging Face2024-12-13 更新2024-12-14 收录
下载链接:
https://huggingface.co/datasets/Thingi10K/Thingi10K
下载链接
链接失效反馈官方服务:
资源简介:
Thingi10K是一个大规模的3D数据集,旨在研究现实世界3D打印模型的多样性、复杂性和质量。该数据集包含了从2009年9月16日至2015年11月15日期间在Thingiverse.com上发布的所有3D模型。Thingi10K包含10,000个模型,4,892个标签,2,011个项目,1,083个设计师,72个类别,10个开源许可证,时间跨度超过7年,99.6%的文件是.stl格式,50%的模型是非实体的,45%的模型有自交,31%的模型有共面自交,26%的模型有多组件,22%的模型是非流形的,16%的模型有退化面,14%的模型是非PWN,11%的模型在拓扑上是开放的,10%的模型是非定向的。数据集提供了基于上下文和几何标准的简单查询接口,并且统计了各种几何属性的模型。
Thingi10K is a large-scale 3D dataset developed for investigating the diversity, complexity, and quality of real-world 3D printing models. It encompasses all 3D models released on Thingiverse.com from September 16, 2009 to November 15, 2015. The dataset consists of 10,000 individual models, 4,892 tags, 2,011 projects, 1,083 distinct designers, 72 categories, and 10 open-source licenses, covering a timespan of over 7 years. Among these models: 99.6% of the files are stored in .stl format; 50% are non-solid; 45% exhibit self-intersections; 31% feature coplanar self-intersections; 26% comprise multiple components; 22% are non-manifold; 16% contain degenerate faces; 14% are non-PWN; 11% are topologically open; and 10% are non-orientable. Additionally, the dataset offers a straightforward query interface based on both contextual and geometric criteria, and provides statistical summaries of various geometric attributes for the included models.
创建时间:
2024-12-11
原始信息汇总
Thingi10K 数据集概述
数据集简介
Thingi10K 是一个大规模的 3D 数据集,旨在研究现实世界 3D 打印模型的多样性、复杂性和质量。该数据集分析了 Thingiverse.com 网站上从 2009 年 9 月 16 日至 2015 年 11 月 15 日期间的所有模型。
数据集内容
- 模型数量:10,000 个
- 标签数量:4,892 个
- 事物数量:2,011 个
- 设计师数量:1,083 个
- 类别数量:72 个
- 开源许可证数量:10 个
- 时间跨度:7 年以上
- 文件格式:99.6% 为 .stl 文件
- 非实体模型比例:50%
- 自交模型比例:45%
- 共面自交模型比例:31%
- 多组件模型比例:26%
- 非流形模型比例:22%
- 退化面模型比例:16%
- 非 PWN 模型比例:14%
- 拓扑开放模型比例:11%
- 非定向模型比例:10%
数据集查询与下载
提供了一个简单的查询接口,用户可以根据上下文和几何标准搜索、浏览和下载数据集。
数据集统计
各种几何属性的统计数据可以在 此表格 中找到。
数据集创建者
许可证信息
数据集中的个体对象可能属于以下多种许可证:
- "Creative Commons - Attribution - Share Alike" - 3680 文件
- "Creative Commons - Attribution" - 2945 文件
- "Creative Commons - Attribution - Non-Commercial" - 1581 文件
- "Attribution - Non-Commercial - Share Alike" - 975 文件
- "Attribution - Non-Commercial - No Derivatives" - 330 文件
- "GNU - GPL" - 202 文件
- "Creative Commons - Public Domain Dedication" - 99 文件
- "Public Domain" - 88 文件
- "Creative Commons - Attribution - No Derivatives" - 84 文件
- "BSD License" - 10 文件
- "unknown license" - 4 文件
- "GNU - LGPL" - 2 文件
搜集汇总
数据集介绍

构建方式
Thingi10K数据集的构建基于对Thingiverse.com网站上2009年9月16日至2015年11月15日期间所有3D打印模型的全面分析。研究团队对每个模型的网格进行了详尽的检查,涵盖了从模型复杂度到质量的多个维度,确保了数据集的广泛性和多样性。通过这一过程,Thingi10K成功收集了10,000个模型,涵盖了72个类别和10种开源许可证,为3D打印领域的研究提供了丰富的资源。
特点
Thingi10K数据集以其大规模和多样性著称,包含了10,000个3D模型,涵盖了从简单到复杂的多种设计。数据集中的模型具有高度的真实性,反映了实际3D打印中的常见问题,如45%的模型存在自交现象,26%的模型包含多个组件。此外,数据集还包含了丰富的元数据,如4,892个标签和1,083位设计师的信息,为研究者提供了深入分析和挖掘的可能性。
使用方法
Thingi10K数据集通过一个简单的查询接口提供下载和探索功能,用户可以根据上下文和几何标准进行搜索和下载。此外,数据集的几何属性统计信息可通过提供的电子表格进行查阅,便于研究者进行深入分析。由于数据集中的模型涵盖了多种许可证类型,用户在使用时应确保遵守相应的版权规定,以避免法律风险。
背景与挑战
背景概述
Thingi10K数据集是由Qingnan Zhou和Alec Jacobson创建的,旨在研究真实世界3D打印模型的多样性、复杂性和质量。该数据集收集了2009年9月16日至2015年11月15日期间Thingiverse.com上的所有3D模型,涵盖了10,000个模型、4,892个标签、2,011个项目、1,083位设计师、72个类别以及10种开源许可证。Thingi10K不仅提供了丰富的3D模型资源,还通过详细的统计数据揭示了这些模型在几何属性上的多样性,为3D打印领域的研究提供了宝贵的数据支持。
当前挑战
Thingi10K数据集在构建过程中面临了诸多挑战。首先,数据集包含了大量非固体模型(50%),这些模型在3D打印过程中可能存在技术难题。其次,45%的模型存在自交问题,31%的模型具有共面自交问题,这些几何缺陷增加了模型处理的复杂性。此外,26%的模型具有多个组件,22%的模型是非流形的,这些特性对模型的几何分析和处理提出了更高的要求。最后,16%的模型存在退化面,14%的模型不符合PWN标准,这些几何问题进一步增加了数据集的复杂性和处理难度。
常用场景
经典使用场景
Thingi10K数据集在三维建模与打印领域中被广泛应用于模型质量评估与优化研究。其丰富的几何属性统计和多样化的模型类型为研究者提供了深入分析三维模型复杂性和质量的宝贵资源。通过该数据集,研究者可以开发和验证新的算法,以检测和修复模型中的自交、非流形结构等常见问题,从而提升三维打印的可靠性和效率。
解决学术问题
Thingi10K数据集解决了三维打印领域中模型质量评估与优化的关键学术问题。其包含的模型具有多种几何缺陷,如自交、非流形结构等,为研究者提供了丰富的实验数据,以开发和验证新的几何处理算法。此外,该数据集的时间跨度和多样化的模型来源,使得研究者能够探索模型随时间演变的趋势,为三维打印技术的长期发展提供了重要的研究基础。
衍生相关工作
Thingi10K数据集的发布激发了大量相关研究工作,特别是在三维几何处理和打印优化领域。许多研究者基于该数据集开发了新的模型修复算法,如自交检测与消除、非流形结构修复等。此外,该数据集还被用于训练深度学习模型,以自动识别和修复三维模型中的常见缺陷。这些衍生工作不仅推动了三维打印技术的发展,也为其他领域的几何处理研究提供了重要的参考和基准。
以上内容由遇见数据集搜集并总结生成



