IROS-2025-Challenge-Manip
收藏Hugging Face2025-08-18 更新2025-08-19 收录
下载链接:
https://huggingface.co/datasets/InternRobotics/IROS-2025-Challenge-Manip
下载链接
链接失效反馈官方服务:
资源简介:
IROS-2025-Challenge-Manip数据集是针对机器人操作的一项挑战赛基准,包含预训练、训练和验证三个部分的数据集。预训练集大约有20000个单独的抓取和放置轨迹,训练集为每个任务提供了大约100个轨迹,验证集包括测试场景和USD格式的对象资源。每个轨迹都包含三视角视频记录、机器人状态以及与任务执行相对应的动作。该数据集旨在支持机器人操作的预训练、任务特定微调和评估。
The IROS-2025-Challenge-Manip dataset is a benchmark for robot manipulation challenges, comprising three dataset splits: pre-training, training, and validation sets. The pre-training split contains approximately 20,000 individual grasp-and-place trajectories. The training split provides around 100 trajectories per task. The validation split includes test scenarios and object assets in USD format. Each trajectory encompasses three-view video recordings, robot state data, and actions corresponding to task execution. This dataset is designed to support pre-training, task-specific fine-tuning, and evaluation for robot manipulation.
创建时间:
2025-08-08
原始信息汇总
IROS-2025-Challenge-Manip 数据集概述
数据集简介
该数据集包含IROS Challenge - Manipulation Track基准测试,分为预训练、训练和验证三个部分。
数据集结构
数据划分
- 预训练集:约20,000条单次抓取放置轨迹,打包为tar文件(每个文件包含约1,000条轨迹)
- 训练集:任务特定演示数据,每个任务提供约100条轨迹
- 验证集:包含测试场景和对象资产(USD格式)
轨迹内容
每条轨迹包含:
- 多视角视频记录(三个视角:头戴式摄像头和两个腕部摄像头)
- 机器人状态(关节位置、夹爪状态等)
- 动作数据(对应任务执行)
数据集用途
专为IROS Challenge环境中的机器人操作任务设计,支持:
- 预训练
- 任务特定微调
- 评估
文件结构
预训练文件夹结构
pretrain/ ├── 1.tar.gz │ └── 1/ │ ├── data/ │ ├── meta/ │ └── videos/ ├── 2.tar.gz ... ├── 20.tar.gz └── 20/ ├── data/ ├── meta/ └── videos/
训练文件夹结构
包含10个特定任务文件夹:
- collect_three_glues
- collect_two_alarm_clocks
- collect_two_shoes
- gather_three_teaboxes
- make_sandwich
- oil_painting_recognition
- organize_colorful_cups
- purchase_gift_box
- put_drink_on_basket
- sort_waste
每个任务文件夹包含:
- data/
- meta/
- videos/
验证文件夹结构
分为两个子集:
- IROS_C_V3_Aloha_seen(已知场景)
- IROS_C_V3_Aloha_unseen(未知场景)
每个子集包含相同的10个任务文件夹结构,每个任务包含多个场景实例(000-009),包含:
- meta_info.pkl
- scene.usd
- SubUSDs/(包含materials和textures)
许可证
- 许可证类型:CC BY-NC-SA 4.0
- 许可链接:https://creativecommons.org/licenses/by-nc-sa/4.0/
搜集汇总
数据集介绍

构建方式
在机器人操作研究领域,数据集构建的严谨性直接影响算法性能评估的有效性。IROS-2025-Challenge-Manip数据集通过系统化采集流程构建,包含预训练、训练和验证三个子集。预训练集囊括约两万条单次抓放轨迹,每条轨迹均以压缩包形式存储;训练集针对十项具体任务分别提供约百条演示轨迹;验证集则采用USD格式封装测试场景与物体资产,确保三维物理仿真的真实性。数据采集过程整合多视角视频流、机器人状态参数及动作序列,形成多维度的操作行为记录体系。
特点
该数据集的核心特征体现在其多层次结构和丰富模态的融合。预训练集以分块压缩形式存储千条轨迹单元,有效平衡存储效率与访问便捷性;训练集按任务类型分层组织,涵盖从物品收集到复杂装配等多样化操作场景;验证集创新性地引入所见与未见场景双分支设计,严格检验模型泛化能力。每条轨迹包含头戴式与双腕部相机三重视角视频、关节位姿与夹爪状态等机器人本体数据,以及动作执行序列,构建了视觉-状态-动作的立体对应关系。
使用方法
研究者可通过Hugging Face Hub的snapshot_download接口获取完整数据集,并执行配套的Python后处理脚本完成验证集初始化。预训练数据需通过循环解压命令逐包释放,其目录结构按编号分层存储数据、元信息和视频文件。训练集按任务名称组织子目录,可直接加载对应任务的演示数据。验证集提供USD格式的场景文件,支持物理仿真环境直接调用。数据集支持端到端的预训练、任务微调及跨场景评估 pipeline,使用者需遵循CC BY-NC-SA 4.0许可协议并规范引用相关研究成果。
背景与挑战
背景概述
机器人操作领域长期面临着复杂环境适应性不足的瓶颈问题,IROS-2025-Challenge-Manip数据集由国际机器人与系统会议(IROS)组委会于2025年牵头构建,旨在推动机器人操作技能的泛化能力研究。该数据集通过系统化整合预训练、任务专项训练与验证三大模块,提供了包含多视角视觉数据、机器人状态序列与动作轨迹的完整示范数据,为模仿学习与强化学习算法提供了标准化评测基准,显著促进了机器人操作智能从单一任务执行向多任务迁移的范式转变。
当前挑战
该数据集核心挑战在于解决动态环境中多步骤操作任务的泛化性能评估问题,具体体现为跨场景物体抓取姿态的适应性推理、遮挡条件下的视觉-动作映射一致性保持,以及长时序动作链的误差累积控制。构建过程中需克服多传感器时序对齐精度不足、大规模示范数据标注成本高昂,以及物理仿真环境与真实世界动态差异建模等工程难题,这些挑战共同推动了机器人操作数据标准化与评估体系的发展。
常用场景
经典使用场景
在机器人操作学习领域,IROS-2025-Challenge-Manip数据集通过预训练阶段的约两万条抓放轨迹和任务专属演示数据,为模仿学习与强化学习算法提供了标准化训练环境。其多视角视频流与机器人状态数据的同步记录,使研究者能够构建从视觉感知到动作执行的端到端策略模型,特别适用于跨任务泛化能力的系统性验证。
实际应用
工业自动化与家庭服务机器人是该数据集的主要应用领域。其涵盖的物体分拣、餐食制备、物品整理等任务场景,可直接支撑物流分拣系统、智能厨房机器人等实际系统的开发。USD格式的测试场景资产更便于与NVIDIA Isaac Sim等仿真平台集成,加速从算法验证到实际部署的闭环。
衍生相关工作
基于该数据集衍生的研究已催生多模态融合策略、分层强化学习框架等重要成果。其标准化的评估协议促进了ALOHA操作平台生态的发展,并推动了以《Robot Learning with Large Datasets》为代表的学术论述。相关工作正持续拓展至触觉感知融合、人类示范对齐等新兴交叉领域。
以上内容由遇见数据集搜集并总结生成



