hyve-datasets

Hugging Face2026-02-04 更新2026-02-05 收录

下载链接：

https://huggingface.co/datasets/stefan-jeske/hyve-datasets

下载链接

链接失效反馈

官方服务：

资源简介：

HYVE数据集目录包含多个用于HYVE项目的数据集，所有数据集均以“处理过”的形式提供。数据集包括：Armadillo（源自斯坦福3D扫描库）、Dragon（源自斯坦福3D扫描库）、Objaverse（源自CC0模型）和Thingi10k（源自fTetWild，基于Thingi10K数据集，Apache-2.0许可）。每个子目录中的LICENSE文件包含具体的使用权限和限制。由于许可限制，论文中使用的某些数据集（如Dynamic FAUST、Shapenet V2 Planes和ScanNet）未包含在此，但生成这些数据集的代码可在主仓库中找到。处理后的数据文件为PyTorch序列化的二进制.pt文件，包含表面和体积样本数据，数据结构由ProcessedDataItem和GeometricDataItem类定义，包括位置、法线、SDF样本点和点连接性等信息。

The HYVE dataset directory contains multiple datasets for the HYVE project, all provided in processed form. The datasets include: Armadillo (originated from the Stanford 3D Scanning Repository), Dragon (originated from the Stanford 3D Scanning Repository), Objaverse (originated from CC0 models), and Thingi10k (derived from fTetWild, based on the Thingi10K dataset, licensed under Apache-2.0). The LICENSE file in each subdirectory contains specific usage permissions and restrictions. Due to licensing constraints, some datasets used in the paper (such as Dynamic FAUST, Shapenet V2 Planes, and ScanNet) are not included herein, but the code for generating these datasets is available in the main repository. The processed data files are PyTorch-serialized binary .pt files containing surface and volume sample data, with the data structure defined by the ProcessedDataItem and GeometricDataItem classes, including information such as positions, normals, SDF sample points, and point connectivity.

创建时间：

2026-02-03

搜集汇总

数据集介绍

构建方式

在三维几何处理与形状表示领域，HYVE数据集通过整合多个权威来源的三维模型构建而成。其核心构建方法涉及从斯坦福3D扫描库获取高精度扫描模型如Armadillo与Dragon，同时融合了Objaverse的CC0许可模型及Thingi10k的Apache-2.0许可数据。这些原始模型经过统一预处理流程，转化为基于PyTorch Geometric框架的结构化点云与符号距离场表示，确保了数据格式的标准化与计算效率。

使用方法

使用HYVE数据集时，研究者可通过加载预处理的.pt文件直接获取结构化几何数据。每个文件遵循ProcessedDataItem类型定义，其中surface字段提供表面采样点与法向量，y字段包含符号距离场样本及其空间位置。数据集兼容PyTorch Geometric工作流，支持批量加载与实时图结构构建，适用于隐式表面重建、形状生成等任务。需注意各子目录的许可文件以遵守具体使用限制，动态FAUST等受限数据可通过项目代码库中的脚本生成。

背景与挑战

背景概述

在三维几何处理与计算机图形学领域，高质量的数据集对于推动形状表示与距离场等研究方向具有关键作用。HYVE数据集项目由Interactive Computer Graphics研究团队主导，其核心目标在于整合多源三维扫描与模型数据，为神经隐式表示与物理仿真提供标准化基准。该数据集融合了斯坦福扫描库的经典模型如Armadillo与Dragon，以及大规模开放资源如Objaverse与Thingi10k，旨在解决复杂几何结构的统一编码与重建问题，对三维深度学习与仿真技术产生了显著的促进作用。

当前挑战

该数据集面临的挑战主要体现在两个方面：在领域问题层面，三维形状的神经隐式表示需克服高维几何细节的精确重建、非刚性形变下的稳定性保持以及大规模点云数据的有效编码等难题；在构建过程中，数据整合涉及多源许可协议的协调，如Dynamic FAUST等受限数据无法直接公开，同时需处理原始扫描的噪声修复、拓扑一致性保证以及采样偏差校正等技术障碍，这些因素共同增加了数据集的构建复杂度与应用门槛。

常用场景

经典使用场景

在三维几何处理与形状表示领域，HYVE数据集为隐式神经表示和符号距离场的学习提供了关键支持。该数据集整合了多种三维模型，如Armadillo、Dragon和Thingi10k，通过点云和表面采样数据，为模型训练提供了丰富的几何输入。研究人员利用这些数据，能够高效地训练神经网络，以捕捉复杂三维形状的细节结构，进而推动三维重建和形状生成技术的发展。

解决学术问题

HYVE数据集有效应对了三维形状表示中数据稀缺与多样性的挑战，为隐式神经表示方法提供了标准化的训练基准。它解决了传统方法在捕捉复杂几何细节时的局限性，促进了符号距离场学习、形状补全和三维生成模型的研究。通过提供多源、高质量的三维数据，该数据集加速了计算机图形学与计算机视觉领域在几何处理方面的理论突破，为后续算法评估与比较奠定了坚实基础。

实际应用

在实际应用中，HYVE数据集支撑了三维建模、虚拟现实和增强现实系统的开发。例如，在工业设计领域，工程师可以利用该数据集训练模型，快速生成或修复复杂机械部件的三维表示；在娱乐产业，它有助于创建逼真的数字资产和动画角色。此外，该数据集还应用于机器人导航和环境感知，通过三维形状理解提升自主系统的交互能力，推动智能制造与智能交互技术的落地。

数据集最近研究