AgiBotWorldChallenge-2025
收藏Hugging Face2025-06-06 更新2025-06-07 收录
下载链接:
https://huggingface.co/datasets/agibot-world/AgiBotWorldChallenge-2025
下载链接
链接失效反馈官方服务:
资源简介:
AgiBot世界挑战2025数据集包括两个赛道:Manipulation和World Model。Manipulation赛道针对10个不同的任务收集了数据,每个任务包含数百个轨迹,目前开放了5个任务的数据集。World Model赛道包含训练集、验证集和测试集,用于评估模型的生成能力、泛化能力和鲁棒性。
创建时间:
2025-05-26
原始信息汇总
AgiBot World Challenge 2025 - 数据集概述
基本信息
- 许可证: CC-BY-NC-SA-4.0
- 数据集类型: 机器人操作与世界模型任务
Track 1:Manipulation(操作任务)
当前开源任务(5/10)
| 任务名称 | 真实机器人数据集ID |
|---|---|
| Heat the food in the microwave | 881 |
| Open drawer and store items | 949, 1019 |
| Pack in the supermarket | 1352, 1418 |
| Stamp the seal | 1458 |
| Pack washing detergent from conveyor | 1645 |
待发布任务(预计6月5日前)
- Clear the countertop waste
- Pickup items from the freezer
- Restock supermarket snacks
- Make a sandwich
- Clear table in the restaurant
数据特点
- 采用对抗性数据收集(ADC)方法,增强轨迹信息密度和多样性
- 减少训练数据需求和模型训练成本
- 提升模型泛化能力和鲁棒性
Track 2:World Model(世界模型)
数据集结构
- 训练集: 30,000+优质轨迹,覆盖10个代表性任务
- 验证集: 30个精选样本
- 测试集: 30个非公开样本,包含已见和未见场景
数据内容
- EEF位姿
- 关节角度
- 相机内外参
- 视觉数据(如head_color.mp4)
- 本体感知数据(proprio_stats.h5)
文件结构示例
DATASET_ROOT/ ├── train/ │ ├── {task_id}-{episode_id}-{step_id}/ │ │ ├── head_color.mp4 │ │ ├── head_extrinsic_params_aligned.json │ │ ├── head_intrinsic_params.json │ │ └── proprio_stats.h5 ├── val/ │ └── ...(类似结构) └── test/ └── ...(类似结构,head_color.mp4不公开)
备注
- 模拟数据集将在测试服务器开放前发布
- 测试集包含专家演示和不完美轨迹混合样本
搜集汇总
数据集介绍

构建方式
在机器人操作领域,AgiBotWorldChallenge-2025数据集通过对抗性数据采集(ADC)技术构建,引入动态干扰以增强轨迹信息密度与多样性。该数据集涵盖10项具体任务,每项任务包含数百条轨迹,并持续进行版本迭代与数据扩充,例如在v1.1.0版本中为每项操作任务新增50条轨迹。仿真数据与真实机器人数据并行提供,真实数据通过多组实验编号与任务映射关联,确保了数据源的丰富性与可靠性。
特点
该数据集显著特点在于其多模态结构与场景覆盖的广泛性,包含厨房、工作台、餐桌及浴室等多种交互环境,涉及碰撞、抓取、放置等复杂操作。数据规模庞大,仅世界模型赛道即包含超过3万条高质量训练轨迹,30条验证样本及30条未公开测试样本。测试集融合专家演示与非完美轨迹,兼顾已见与未见场景,有效支撑模型泛化能力与鲁棒性评估。数据提供末端执行器位姿、关节角度、相机参数等完整物理与视觉信息。
使用方法
使用者可通过指定路径访问仿真资产与真实机器人数据,依据任务ID与数据集编号的映射关系调用相应数据。数据集按训练、验证、测试划分,目录结构清晰,每一条轨迹以独立文件夹存储,内含视频帧、外参标定文件、内参文件及本体感知数据。参与者可整合多模态信息进行模型训练,并通过本地仿真环境验证算法性能。测试集部分视觉数据未公开,需通过模型预测结果参与挑战评估。
背景与挑战
背景概述
AgiBotWorldChallenge-2025数据集由AgiBot World团队于2025年6月创建,聚焦于具身智能与机器人操作的核心研究问题。该数据集通过对抗性数据采集技术,系统性地构建了涵盖厨房操作、物品整理、超市包装等10类复杂任务的仿真与真实机器人轨迹数据,旨在推动通用机器人在多场景下的感知与执行能力发展,对机器人学习范式的革新具有重要影响力。
当前挑战
该数据集致力于解决机器人操作与世界模型构建中的泛化性与鲁棒性挑战,包括动态干扰下的动作规划、多模态感知融合以及跨场景迁移等复杂问题。构建过程中需克服高密度轨迹数据的标准化采集、仿真与真实环境的数据对齐、以及对抗性扰动下的质量一致性控制等关键技术难题。
常用场景
经典使用场景
在机器人操作学习领域,AgiBotWorldChallenge-2025数据集通过对抗性数据采集技术构建的高密度轨迹数据,为多任务操作策略的端到端训练提供了基准环境。该数据集涵盖微波加热、抽屉开关、超市包装等十类典型家庭与工业场景,每条轨迹包含机械臂位姿、关节角度及多视角视觉信息,支持模仿学习与强化学习算法的联合训练。
衍生相关工作
基于该数据集衍生的经典工作包括多模态世界模型GenieSim的构建与对抗性强化学习框架ADC-RL的开发。这些成果通过融合物理仿真与真实数据,推动了视觉-运动协同建模、跨模态表示学习等方向的发展,并为后续研究提供了可复现的基线模型与评估协议。
数据集最近研究
最新研究方向
在具身智能与机器人操作领域,AgiBotWorldChallenge-2025数据集正推动对抗性数据采集(ADC)方法的前沿探索。该技术通过引入动态扰动增强轨迹信息密度与多样性,显著降低了模型训练成本并提升了泛化能力。数据集涵盖厨房、超市、餐厅等十类复杂场景的实体交互任务,为世界模型生成与多模态感知研究提供了大规模高质量轨迹数据。其最新版本新增了50条操作轨迹并同步至ModelScope社区,进一步支持了仿真与真实机器人系统的协同验证,对促进通用机器人智能体的鲁棒性与适应性研究具有重要价值。
以上内容由遇见数据集搜集并总结生成



