five

ritterdennis/topex-printer

收藏
Hugging Face2024-03-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ritterdennis/topex-printer
下载链接
链接失效反馈
官方服务:
资源简介:
我们引入了一个具有挑战性的数据集,用于从真实照片中识别机器部件,该数据集包含102个标签机器部件的图像。该数据集考虑了现实世界场景的复杂性,并突出了区分密切相关类别的复杂性,为提高域适应方法提供了机会。数据集包括3,264张CAD渲染图像(每个部件32张)和6,146张真实图像(每个部件6到137张),用于无监督域适应(UDA)和测试。渲染图像使用基于Blender的流程生成,包括环境贴图、灯光和虚拟相机,以确保不同的网格方向。我们还使用材料元数据,并将21种纹理材料之一应用于对象。所有图像均以512x512像素渲染。真实照片集包括在不同条件下使用不同相机拍摄的原始图像,包括不同的光照、背景和环境因素。更新内容包括修复某些对象的材料问题、添加训练和测试的估计深度数据、添加未处理的测试图像数据、添加从渲染管道导出的深度数据、添加包括ControlNet生成的木材背景的训练图像、添加包括ControlNet生成的手的训练图像、以及添加经过T2i-Adapter风格转移处理的训练图像。

我们引入了一个具有挑战性的数据集,用于从真实照片中识别机器部件,该数据集包含102个标签机器部件的图像。该数据集考虑了现实世界场景的复杂性,并突出了区分密切相关类别的复杂性,为提高域适应方法提供了机会。数据集包括3,264张CAD渲染图像(每个部件32张)和6,146张真实图像(每个部件6到137张),用于无监督域适应(UDA)和测试。渲染图像使用基于Blender的流程生成,包括环境贴图、灯光和虚拟相机,以确保不同的网格方向。我们还使用材料元数据,并将21种纹理材料之一应用于对象。所有图像均以512x512像素渲染。真实照片集包括在不同条件下使用不同相机拍摄的原始图像,包括不同的光照、背景和环境因素。更新内容包括修复某些对象的材料问题、添加训练和测试的估计深度数据、添加未处理的测试图像数据、添加从渲染管道导出的深度数据、添加包括ControlNet生成的木材背景的训练图像、添加包括ControlNet生成的手的训练图像、以及添加经过T2i-Adapter风格转移处理的训练图像。
提供机构:
ritterdennis
原始信息汇总

数据集描述

我们引入了一个用于识别实际照片中机器零件的挑战性数据集,包含来自标签机的102种零件的图像。该数据集考虑到现实场景的复杂性,强调了区分密切相关类别的复杂性,为改进领域适应方法提供了机会。数据集包括3,264张CAD渲染图像(每种零件32张)和6,146张实际图像(每种零件6到137张),用于无监督域适应(UDA)和测试。渲染图像使用基于Blender的管道生成,包括环境地图、灯光和虚拟相机,以确保不同的网格方向。我们还使用材料元数据,并将21种纹理材料之一应用于对象。所有图像渲染为512x512像素。实际照片集包括在不同条件下使用不同相机捕获的原始图像,包括不同的光照、背景和环境因素。

更新内容

  • 修复了一些对象的材料问题(实际为黑色钢材,但合成图像为自然钢材)。
  • 添加了来自ZoeDepth的训练和测试估计深度数据。
  • 添加了未处理(未裁剪)的测试图像数据和边界框标签。
  • 添加了从渲染管道(Blender)通过合成图导出的深度数据(原始EXR和归一化PNG)。
  • 添加了包括ControlNet生成的木质背景的训练图像。
  • 添加了包括ControlNet生成的手的训练图像。
  • 添加了通过T2i-Adapter风格转换处理的训练图像。

下载

下载压缩数据集

许可信息

CC BY-NC 4.0 Deed

引用信息

请在使用数据集时引用我们的工作。

@misc{ritter2023cad, title={CAD Models to Real-World Images: A Practical Approach to Unsupervised Domain Adaptation in Industrial Object Classification}, author={Dennis Ritter and Mike Hemberger and Marc Hönig and Volker Stopp and Erik Rodner and Kristian Hildebrand}, year={2023}, eprint={2310.04757}, archivePrefix={arXiv}, primaryClass={cs.CV} }

搜集汇总
数据集介绍
main_image_url
构建方式
在工业视觉识别领域,高质量数据集的构建对于推动无监督域适应方法的发展至关重要。该数据集通过精心设计的混合数据采集策略构建而成,首先利用Blender渲染管线生成了3,264张CAD模型图像,每张图像均采用环境贴图、多光源布置及虚拟相机阵列,确保了物体网格朝向的多样性,并应用了21种纹理材质以增强视觉真实性。与此同时,真实图像部分包含了6,146张在实际多变条件下拍摄的原始照片,涵盖了不同光照、背景及相机设备,从而构建了一个包含102类机械零件的跨域视觉数据集。
特点
该数据集的核心特点在于其高度挑战性的跨域识别场景,特别强调了真实工业环境中相近类别的细微区分难度。数据集中不仅包含CAD渲染图像与真实照片的双域数据,还通过后续更新引入了深度估计信息、未裁剪测试图像及其边界框标注,以及通过ControlNet生成的多样化背景和手部合成图像,进一步丰富了数据的层次与复杂性。这些多维度的数据增强使得该数据集成为评估域适应方法在工业零件分类任务中鲁棒性的理想基准。
使用方法
该数据集主要应用于无监督域适应(UDA)研究,尤其适用于从合成图像到真实图像的跨域分类任务。研究者可利用CAD渲染图像作为源域,真实照片作为目标域,训练模型以提升在未见真实环境下的识别性能。数据集中提供的深度信息、边界框标注及风格迁移图像,支持多模态学习与数据增强策略的探索。用户可通过HuggingFace平台下载完整数据包,并依据CC BY-NC 4.0许可协议在非商业研究中使用,同时需在相关工作中引用提供的学术文献。
背景与挑战
背景概述
在工业视觉识别领域,从合成数据到真实图像的域适应一直是关键研究议题。2025年,由Dennis Ritter、Mike Hemberger等学者及柏林工程应用科学大学等机构联合创建的TopEx-Printer数据集应运而生,专注于解决工业零件分类中的无监督域适应问题。该数据集包含102类标签机零件,通过精心设计的Blender渲染流程生成了3,264张合成图像,并采集了6,146张真实环境照片,旨在弥合计算机辅助设计模型与复杂现实场景之间的语义鸿沟。其核心研究问题在于探索仅依赖类别标注的CAD模型时,如何提升对真实工业图像分类的泛化能力,为工业视觉系统的实际部署提供了重要基准。
当前挑战
TopEx-Printer数据集所针对的工业零件分类任务面临多重挑战:真实工业环境中零件外观受光照变化、背景杂乱及拍摄视角差异影响显著,导致类间特征高度相似,区分度低;同时,合成数据与真实图像间的域差异使得模型泛化困难。在构建过程中,研究者需克服真实图像采集条件不一致、合成渲染中材质与纹理逼真度平衡,以及数据标注对齐等难题。此外,数据集中部分类别的样本数量不均衡,进一步增加了模型训练的复杂性。
常用场景
经典使用场景
在工业视觉领域,ritterdennis/topex-printer数据集为无监督域自适应研究提供了关键实验平台。该数据集包含102种机械零件的CAD渲染图像和真实照片,通过模拟现实场景中的光照、背景和材质变化,有效支持了从合成数据到真实图像的跨域分类任务。研究者可利用其丰富的多模态数据,如深度信息和纹理材料,探索模型在复杂工业环境中的泛化能力,从而推动计算机视觉技术在智能制造中的应用。
解决学术问题
该数据集主要解决了工业对象分类中合成数据与真实图像间的域偏移问题。传统方法在自然物体基准上表现良好,但面对机械零件等精细类别时,常因域差异导致性能下降。通过提供标注的CAD模型和多样化的真实图像,该数据集使研究者能够系统分析无监督域自适应流程,优化模型设计,提升跨域识别精度,为工业场景下的视觉系统开发奠定理论基础。
衍生相关工作
基于该数据集,相关研究已衍生出多项经典工作,如无监督域自适应管道的系统优化和跨域分类算法的创新。在ECML PKDD 2025会议上发表的论文中,作者利用该数据集提出了针对工业设置的域适应指南,并在VisDA基准上实现了先进性能。这些工作不仅推动了合成数据到真实图像的迁移学习进展,还为工业视觉领域的实践应用提供了可复现的方法框架。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作