shape
收藏Hugging Face2026-02-08 更新2026-02-09 收录
下载链接:
https://huggingface.co/datasets/bayang/shape
下载链接
链接失效反馈官方服务:
资源简介:
Shape Geometry Dataset 是一个基于图的合成数据集,包含3D几何图形(管道状结构)的中心线表示。数据集以JSON格式存储,每个样本包含类别标签、节点坐标(N×3的浮点数组)、边连接关系(E×2的整数数组)以及节点特征(曲率和分段角度)。数据集包含21个类别(17种不同角度的弧线、直线、直角、T型连接和Y型连接),每个类别包含10,000个样本,总计210,000个样本。数据设计考虑了图神经网络的应用需求,包括单位间距标准化、随机刚性变换、节点级几何特征等特性,特别适用于图神经网络框架(如PyTorch Geometric、DGL)的几何学习任务。
创建时间:
2026-02-07
原始信息汇总
Shape Geometry Dataset 数据集概述
数据集基本信息
- 数据集名称:Shape Geometry Dataset
- 许可证:MIT
- 任务类别:图机器学习
- 标签:合成、几何、图神经网络、3D、中心线、管道结构
- 数据规模:10K < n < 100K
- 数据格式:JSON
数据集内容与结构
该数据集包含3D几何图案(管道状结构)的合成、基于图的中心线表示。
数据记录结构
每个数据记录存储在dataset.json文件中,为一个数组。每条记录包含以下字段:
category:字符串类型,表示形状类别标签。nodes:浮点数二维数组,形状为N×3,表示3D点,相邻点间距约为1个单位。edges:整数二维数组,形状为E×2,表示连接节点的索引对。features:包含以下两个特征的对象:curvature:浮点数数组,长度为N,表示每个节点的门格尔曲率。segment_angle:浮点数数组,长度为N,表示每个节点处边之间的角度。
形状类别
数据集包含21个形状类别,具体如下:
| 类别 | 描述 | 样本数量 |
|---|---|---|
straight |
随机长度的直线段(5-20个单位) | 10000 |
arc_10 |
10° 平缓圆弧,半径R=10 | 10000 |
arc_20 |
20° 圆弧 | 10000 |
arc_30 |
30° 圆弧 | 10000 |
arc_40 |
40° 圆弧 | 10000 |
arc_50 |
50° 圆弧 | 10000 |
arc_60 |
60° 圆弧 | 10000 |
arc_70 |
70° 圆弧 | 10000 |
arc_80 |
80° 圆弧 | 10000 |
arc_90 |
90° 四分之一圆弧弯头 | 10000 |
arc_100 |
100° 圆弧 | 10000 |
arc_110 |
110° 圆弧 | 10000 |
arc_120 |
120° 宽圆弧 | 10000 |
arc_130 |
130° 圆弧 | 10000 |
arc_140 |
140° 圆弧 | 10000 |
arc_150 |
150° 近半圆弧 | 10000 |
arc_160 |
160° 圆弧 | 10000 |
arc_170 |
170° 近全半圆弧 | 10000 |
corner |
两条成90°锐角的直臂 | 10000 |
junction_T |
带垂直分支的直通管(T形) | 10000 |
junction_Y |
主干分成两个展开臂(Y形) | 10000 |
总计样本数量:210,000
数据集设计特点
- 图结构:节点和边构成图,可直接加载到PyTorch Geometric、DGL等GNN框架中。
- 单位间距:标准化了形状间的图密度。
- 随机刚性位姿:每个样本都经过随机的3D旋转和平移,防止模型记忆方向。
- 节点级特征:曲率和分段角度为网络提供了除原始坐标外的局部几何线索。
- 连接点共享枢纽节点:T形和Y形形状有一个连接3条边的节点,匹配真实管道拓扑。
数据生成
可通过运行命令 python generate_geometry_dataset.py 重新生成数据集。
搜集汇总
数据集介绍

构建方式
在三维几何建模与图神经网络交叉领域,Shape Geometry Dataset通过程序化生成方法构建。该数据集以合成方式创建了管道状结构的中心线图表示,涵盖21种几何类别,包括不同角度的弧线、直线、拐角及T形与Y形连接点。每个样本均包含节点坐标、边连接关系以及曲率、分段角度等局部几何特征,并经过随机刚体变换以消除方向记忆性,确保数据多样性。生成过程采用单位间距标准化,使得不同形状的图密度具有可比性,为几何感知的图学习任务提供了结构一致的基础。
特点
该数据集以图结构为核心,节点与边直接构成可输入图神经网络的拓扑表示。其独特之处在于融合了几何与拓扑双重信息:节点承载三维坐标与局部特征如曲率与分段角度,边则编码连接关系。类别设计覆盖从简单直线到复杂连接的连续形态谱系,尤其通过弧角细分实现了几何变化的精细建模。连接点采用中心共享节点设计,模拟真实管道拓扑,增强了数据在结构识别与关系推理任务中的实用性。
使用方法
数据集以JSON格式组织,可直接加载至PyTorch Geometric或DGL等图神经网络框架。每个记录包含类别标签、节点数组、边列表及特征字典,支持端到端的图分类、节点回归或链接预测任务。研究者可利用曲率与角度特征作为节点属性,结合坐标信息训练模型感知局部几何模式。数据集的标准化间距与随机姿态增强了模型的泛化能力,适用于三维形状分析、管道网络建模及几何图表示学习等研究方向。
背景与挑战
背景概述
在三维几何与图神经网络交叉研究领域,对管状结构等几何基元的表示与理解一直是关键课题。Shape Geometry Dataset作为一项合成图数据集,由相关研究团队于近年构建,旨在提供基于中心线图表示的标准化三维几何形状集合。该数据集聚焦于模拟真实世界中的管道结构,涵盖直线、不同角度圆弧以及复杂连接点等多种类别,通过节点、边及几何特征的结构化定义,为图神经网络模型在三维形状分类、分割及生成等任务上提供了基准数据。其设计理念强调几何拓扑与图表示的紧密结合,推动了计算几何与深度学习方法的融合,对计算机图形学、计算机辅助设计及生物医学图像分析等领域产生了积极影响。
当前挑战
该数据集致力于解决三维几何形状的图表示学习问题,其核心挑战在于如何准确捕捉复杂管状结构的拓扑与几何特性。具体而言,在领域层面,模型需从离散节点与边中推断连续几何形态,区分细微的曲率变化,并处理连接点处的局部结构异质性,这对图神经网络的表征能力提出了较高要求。在构建过程中,挑战主要体现为生成具有物理合理性的合成形状,需确保节点间距标准化以维持图密度一致,同时为每个样本施加随机刚体变换以避免模型记忆空间朝向,并设计有效的局部几何特征如曲率与分段角度,以增强模型对形状本质属性的感知。
常用场景
经典使用场景
在几何图神经网络研究领域,Shape Geometry Dataset作为合成图数据集的典范,其经典使用场景聚焦于三维管状结构中心线表示的图分类与回归任务。该数据集通过节点、边及局部几何特征(如曲率和分段角度)的图结构,为图神经网络模型提供了标准化的训练与评估基准,尤其适用于验证模型在识别不同弯曲角度、连接类型等几何模式时的泛化能力。
衍生相关工作
围绕该数据集衍生的经典工作主要集中于图神经网络的架构创新与几何表示学习。研究者利用其可控的合成特性,开发了针对曲率和角度等局部特征敏感的图卷积算子,并探索了等变图网络在三维几何变换下的性能。这些工作进一步拓展至真实世界的点云与网格数据处理,形成了从合成到实际应用的迁移学习范式。
数据集最近研究
最新研究方向
在三维几何与图神经网络交叉领域,Shape Geometry Dataset作为合成管道结构中心线图表示的数据集,正推动几何图学习的前沿探索。当前研究聚焦于利用其节点级曲率和分段角度特征,开发能够鲁棒理解复杂拓扑的图神经网络架构,以应对生物血管网络或工业管线系统等现实场景中的几何推理挑战。该数据集通过标准化图密度与随机刚体变换,促进了模型对几何不变性的学习,相关成果在计算机辅助设计与医学影像分析中展现出重要应用潜力。
以上内容由遇见数据集搜集并总结生成



