five

IRIS

收藏
Hugging Face2026-02-24 更新2026-02-25 收录
下载链接:
https://huggingface.co/datasets/moiaraya/IRIS
下载链接
链接失效反馈
官方服务:
资源简介:
IRIS 数据集是一个专为工业机器人环境中的物体检测研究设计的真实世界数据集,旨在研究从模拟到现实的迁移学习。该数据集包含508张标注图像,涵盖32种机械部件,采集自四种不同的工业场景。此外,数据集还提供了用于合成数据生成的所有必要资源,包括3D模型、背景和材料,以及两个完整的合成训练集(各4000张图像)。数据集还包含预训练的YOLO11m模型,作为模拟到现实迁移实验的基准。数据集的结构包括真实测试集、合成训练集、资产文件夹和检查点文件夹。真实测试集包含RGB图像和深度数据,以及COCO和YOLO格式的标注。合成训练集展示了不同的数据生成策略。数据集适用于工业机器人中的物体检测和模拟到现实迁移学习任务。
创建时间:
2026-02-18
搜集汇总
数据集介绍
main_image_url
构建方式
在工业机器人视觉领域,模拟到真实环境的迁移学习面临数据获取与标注的挑战。IRIS数据集通过系统化采集与合成生成相结合的方式构建,其实测部分采用Zivid 2 Plus MR60工业RGB-D相机,在四种典型工业场景中捕获了508张涵盖32类机械部件的图像,并提供了完整的COCO与YOLO格式标注。为支持合成数据生成,该数据集配套发布了涵盖手工建模、3D高斯溅射、纹理生成等多种技术构建的部件三维模型库,以及背景素材与干扰物资源,形成从真实采集到合成扩展的完整数据生态。
使用方法
研究者可利用该数据集开展工业场景下的物体检测与模拟到真实迁移学习实验。实测部分作为测试集,可用于评估模型在真实工业环境中的泛化能力;配套的合成训练集与预训练YOLO11m模型权重则为迁移学习研究提供基准起点。数据集支持COCO与YOLO两种主流标注格式,并已按训练验证集划分,用户可直接加载进行模型训练与性能评估。通过结合提供的三维资产与生成管线,研究者还可进一步探索合成数据生成策略对迁移效果的影响。
背景与挑战
背景概述
在工业机器人领域,仿真到真实(sim-to-real)的迁移学习是提升视觉系统泛化能力的关键研究方向。IRIS数据集由匿名研究团队于近期创建,旨在为工业环境下的目标检测任务提供一个全面的真实-仿真基准。该数据集包含508张真实图像,涵盖32类机械零部件,并配套提供了合成数据生成所需的全部三维模型与资源。其核心研究问题聚焦于如何利用合成数据有效训练模型,以应对真实工业场景中复杂的光照变化、背景干扰及视角差异,从而推动机器人自主抓取与分拣等应用的发展。
当前挑战
IRIS数据集致力于解决工业目标检测中仿真到真实迁移的领域挑战,具体包括模型在多变光照、杂乱背景及机器人视角下的鲁棒性不足问题。在构建过程中,研究团队面临多重困难:真实数据的采集需在四种差异显著的工业场景中完成,涉及可控光照、窗口日光、多样背景及机器人场景,确保标注精度与场景覆盖度颇具难度;同时,合成数据的生成需整合多种三维建模技术,如手动建模、三维高斯溅射及生成式人工智能,以实现资产的高保真度与多样性,这对资源协调与流程设计提出了较高要求。
常用场景
经典使用场景
在工业机器人视觉感知领域,IRIS数据集为模拟到真实迁移学习提供了标准化的评估基准。该数据集通过提供真实工业场景中采集的508张图像及对应的合成训练集,使研究人员能够系统性地探索合成数据在真实环境下的泛化能力。经典使用场景涉及利用其包含的四种不同光照与背景的工业场景,训练和验证目标检测模型在复杂环境下的鲁棒性,尤其适用于评估YOLO等先进检测架构在机械零件识别任务中的性能。
解决学术问题
IRIS数据集有效应对了工业视觉中合成数据与真实数据分布差异这一核心学术挑战。它通过提供多来源三维模型与配套生成管线,解决了模拟到真实迁移中域适应问题的实证研究需求。该数据集的意义在于构建了可复现的实验框架,使得学术界能够量化不同数据生成策略对模型泛化的影响,从而推动域随机化、领域自适应等关键方法在工业机器人感知任务中的理论进展与性能突破。
实际应用
在实际工业自动化系统中,IRIS数据集支撑了机器人分拣、装配质量检测等关键应用场景的算法开发。其涵盖的32类机械零部件与多样化的工业背景,可直接用于训练能够在真实生产线中可靠工作的视觉检测模型。通过利用数据集提供的预训练模型与合成数据生成资产,工程师能够显著减少对大规模真实标注数据的依赖,加速视觉系统在柔性制造、智能仓储等实际场景中的部署与优化进程。
数据集最近研究
最新研究方向
在工业机器人视觉领域,仿真到真实(sim-to-real)的迁移学习是提升系统在复杂、非结构化环境中鲁棒性的关键挑战。IRIS数据集以其涵盖多种光照条件与背景的工业场景真实图像,以及配套的合成数据生成资产,为这一研究方向提供了标准化的基准。当前研究前沿聚焦于利用生成式人工智能与物理渲染技术,探索合成数据在材质随机化与物理属性建模方面的优化策略,以弥合仿真与真实世界之间的域差距。该数据集推动了工业检测与机器人抓取等任务中数据高效型模型的开发,并促进了自动化合成数据生成流程的标准化,对降低真实数据标注成本、加速机器人视觉系统的部署具有显著意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作