five

OCCT-MechBench

收藏
github2026-05-03 更新2026-05-06 收录
下载链接:
https://github.com/haiyichen001/OCCT-MechBench
下载链接
链接失效反馈
官方服务:
资源简介:
ISO标准机械零件数据集。包含2,372个STEP B-Rep实体,5种格式,专为AI训练构建。所有尺寸严格符合ISO标准长度系列。

ISO standard mechanical parts dataset. It contains 2,372 STEP B-Rep entities, is available in 5 formats, and is specifically constructed for AI training. All dimensions strictly conform to the ISO standard length series.
创建时间:
2026-04-25
原始信息汇总

OCCT-MechBench 数据集概述

基本信息

  • 数据集名称: OCCT-MechBench
  • 描述: ISO 标准机械零件数据集,专为 AI 训练设计
  • 数据规模: 2,372 个 STEP B-Rep 实体
  • 数据格式: 5 种格式
  • 许可证: MIT

零件目录

数据集包含 19 类机械零件,均严格符合 ISO 标准长度系列:

零件名称 标准 数量
六角螺母 (HexagonNut) ISO 4032/4033/4035 67
六角头螺栓 (HexHeadBolt) ISO 4014/4017 664
内六角圆柱头螺钉 (SocketHeadCapScrew) ISO 4762 223
沉头螺钉 (CountersunkScrew) ISO 14581/10642/2009/14582/7046 563
盘头螺钉 (PanHeadScrew) ISO 14583/1580 158
紧定螺钉 (SetScrew) ISO 4026 196
平垫圈 (PlainWasher) ISO 7089/7091/7093/7094 75
倒角垫圈 (ChamferedWasher) ISO 7090 52
深沟球轴承 (DeepGrooveBallBearing) SKT 31
带盖深沟球轴承 (CappedDeepGrooveBallBearing) SKT 25
角接触球轴承 (AngularContactBallBearing) SKT 9
圆柱滚子轴承 (CylindricalRollerBearing) SKT 9
圆锥滚子轴承 (TaperedRollerBearing) SKT 26
直齿轮 (SpurGear) ISO 54 130
锥齿轮 (BevelGear) ISO 54 42
螺旋齿轮 (CrossedHelicalGear) ISO 54 28
齿条 (RackGear) ISO 54 21
内齿轮 (RingGear) ISO 54 35
蜗轮 (WormGear) ISO 54 18

总计: 2,372 个零件

螺栓/螺钉长度严格限制在 ISO 标准范围内(直径-长度上限验证)。

数据格式

格式 描述 数量 参数
STEP (.step) B-Rep 实体,精确 NURBS 2,372 CadQuery 生成
STL (.stl) 三角形网格 2,372 CadQuery 曲面细分
点云 (.ply) 均匀表面采样 2,372 65,536 个点
体素 (.npy) 64^3 二值体素网格 2,372 OCC 实体分类
多视图 (.png) 24 角度渲染 56,928 300x300,黑色背景

生成方法

  • 环境: Python 3.11, CadQuery, pythonocc-core, trimesh, numpy, scipy
  • 生成流程:
    1. generate/generate_step.py: 使用 CadQuery + cq_warehouse + cq_gears 生成 STEP 文件
    2. generate/step_to_stl_cpu.py: STEP 转换为 STL
    3. generate/stl_to_ply_cpu.py: STL 转换为 PLY(二值格式,65,536 个点)
    4. generate/step_to_npy_cpu.py: STEP 转换为 NPY(OCC 实体分类器)
    5. generate/step_to_png_cpu.py: 生成 24 个视角的 PNG 图像

所有脚本使用 cpu_count() - 1 多进程处理。

体素生成特点

  • 直接从 STEP B-Rep 实体生成,无需 STL 中间步骤
  • 使用 STEPControl_Reader 加载 STEP
  • 使用 BRepClass3d_SolidClassifier 对每个网格点进行分类
  • 零近似、零射线投射、零精度问题

Web 查看器

  • 地址: http://localhost:8005
  • 技术栈: Flask + Three.js,两个标签页
  • 比较视图: 多格式并排显示(STEP/STL/点云/体素),动态布局,同步旋转
  • 标签视图: 面类型标注,按几何类型颜色编码(平面=蓝色,圆柱面=绿色,圆锥面=橙色),带图例和标签

各格式渲染方法:

格式 方法
STEP BRepMesh 曲面细分,Phong 平滑,蓝色
STL trimesh,平面着色 + 线框,橙色
点云 65,536 个点,绿色
体素 64^3 实体,Lambert + 线框,紫色

启动方式: bash conda activate occ python viewer/web_server.py

打开 http://localhost:8005

数据质量保证

  • 统一坐标系,由 CadQuery 生成
  • 尺寸严格符合 ISO 标准
  • 体素数据:零近似(OCC 实体分类)

引用

bibtex @dataset{OCCT-MechBench2026, author = {haiyichen001}, title = {OCCT-MechBench: ISO Standard Mechanical Parts Dataset for AI Training}, year = {2026}, url = {https://github.com/haiyichen001/OCCT-MechBench} }

搜集汇总
数据集介绍
main_image_url
构建方式
OCCT-MechBench数据集基于Python 3.11环境,利用CadQuery库结合cq_warehouse和cq_gears模块生成ISO标准机械零件的STEP B-Rep实体模型。随后,通过多阶段转换脚本将STEP文件分别处理为STL三角网格、PLY点云、NPY体素和PNG多视角图像。体素数据直接从STEP实体采用OCC固体分类器生成,避免了中间格式的精度损失。所有2,372个样本均遵循ISO标准长度系列,并经过严格的直径-长度上界验证,确保了尺寸的合规性与一致性。
特点
该数据集涵盖19类ISO标准机械零件,总计2,372个实体,包括螺母、螺栓、螺钉、垫圈、轴承和齿轮等常见类型。数据以五种格式呈现:STEP精确NURBS曲面、STL网格、包含65,536个点的均匀采样点云、64^3二进制体素网格以及24角度多视图渲染图。所有样本统一坐标系,尺寸严格遵循ISO标准。体素数据采用零近似误差的固体分类方法生成,多视图渲染统一为300x300像素的黑底图像,便于深度学习模型直接使用。
使用方法
用户可通过GitHub仓库中的生成脚本按需重现数据集,包括从STEP生成STL、点云、体素和视图的独立转换流程。数据集以标准格式直接可用,STEP文件适合精确几何建模,STL和点云适用于三维形状分析,体素适合体素化神经网络,多视图图像适用于二维视图分类任务。附带的Flask与Three.js网页查看器支持多格式同步比较和面类型标签可视化,用户可通过本地服务器启动交互式浏览,便于数据验证与模型调试。
背景与挑战
背景概述
随着人工智能在计算机辅助设计领域的渗透,标准机械零部件的三维模型数据成为驱动智能设计与制造的关键资源。OCCT-MechBench数据集于2026年由haiyichen001创建,聚焦于ISO标准机械零件,包含2372个STEP B-Rep实体,涵盖螺母、螺栓、垫圈、轴承及齿轮等19个标准部件类别。该数据集以CadQuery参数化生成,严格遵循ISO标准长度系列,提供STEP、STL、点云、体素及多视角渲染五种格式,为几何深度学习、三维形状分析及多模态表示学习提供了高精度、标准化的基准。其独特的逐面几何类型标注(平面、圆柱面、圆锥面)进一步拓展了细粒度几何理解的研究边界。
当前挑战
OCCT-MechBench所解决的领域问题在于:现有机械零件数据集多缺乏ISO标准合规性,且格式单一,难以支撑跨模态AI模型的训练与评估。构建过程中的核心挑战包括:1)确保所有零件尺寸严格符合ISO标准长度系列,需对螺栓与螺钉进行直径-长度上界验证;2)体素生成直接基于B-Rep实体分类,避免转换为STL中介带来的近似误差,但需处理复杂面类型分类的鲁棒性;3)多格式数据的一体化生成流水线需协调CadQuery、OCC及多线程并行处理,保证坐标系统一与数据质量;4)点云均匀采样需在65,536点密度下平衡计算效率与几何保真度,而多视角渲染需标准化24角度黑底图像以避免光照干扰。
常用场景
经典使用场景
在计算机辅助设计与智能制造领域,OCCT-MechBench数据集为三维几何形状理解与推理提供了标准化基准。该数据集囊括2372个严格遵循ISO标准长度系列的机械零件实体,涵盖螺栓、螺母、垫圈、轴承、齿轮等19类典型零件,并以STEP、STL、点云、体素及多视角渲染五种格式呈现。研究者可借此开展跨模态三维形状分类、零件识别与检索任务,尤其适用于评估模型在工业级精度几何结构上的泛化能力。其统一坐标系与零近似体素生成机制,确保了数据质量的可复现性与对比公平性。
衍生相关工作
围绕OCCT-MechBench已衍生出若干影响深远的学术工作。在几何深度学习方面,研究者基于其STEP精确曲面表征开发了面向机械零件面的图神经网络,实现了平面、圆柱面与锥面的语义分割。在多模态融合方向,该数据集被用于设计跨格式特征对齐的对比学习框架,显著提升了稀疏点云与密集体素间的检索精度。更值得关注的是,其零近似体素生成算法启发了基于边界表示直接体素化的高效管线,被后续工作推广至复杂装配体的内存高效建模领域。此外,该数据集催生了面向ISO标准序列的生成式设计模型,在保持工程约束的前提下实现了创新零件形态的自动探索。
数据集最近研究
最新研究方向
当前,随着智能制造与工业4.0的深度融合,基于三维几何数据的深度学习正成为计算机辅助设计与制造领域的前沿热点。OCCT-MechBench数据集应运而生,其核心价值在于提供了完全符合ISO标准的2372个机械零件实体,涵盖螺栓、螺母、垫圈、轴承及齿轮等十余类标准件,并以STEP、STL、点云、体素及多视图五种主流数据格式呈现,为AI驱动的三维形状理解、生成式设计与数字孪生提供了高质量的训练基准。该数据集通过CadQuery程序化生成,确保几何精度与可重复性,其体素数据基于Open Cascade精确分类而非近似采样,显著提升了分类与分割任务的可靠性。同时,内置的多格式对比可视化工具与面类型标注功能,为多模态学习与几何特征提取研究提供了便捷平台。OCCT-MechBench的发布填补了机械行业标准化、可溯源三维数据集的空白,有望推动AI在自动装配、缺陷检测与逆向工程等场景中的落地应用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作