MOVE
收藏MOVE 真实世界操作数据集概述
数据集基本信息
- 数据集名称: MOVE Real-World Manipulation Dataset
- 发布机构: 清华大学 (Tsinghua University) 与 智源人工智能研究院 (Beijing Academy of Artificial Intelligence - BAAI)
- 许可证: MIT
- 核心范式: 基于运动的可变性增强 (Motion-Based Variability Enhancement, MOVE)
- 核心价值: 在专家演示过程中向环境(物体和相机)注入动态特征增强,在单条轨迹内捕获更丰富的空间配置,显著提升策略性能,特别是在对未见位置的空间泛化能力和数据效率方面。
数据集结构
- 核心任务: 真实世界抓取放置 (Real-World Pick-and-Place)
- 采集设备: 使用 Piper 机械臂,通过 Pika 设备 遥操作,在动态环境配置下采集。
数据字段
每条轨迹包含一系列时间步,记录了机器人策略学习所需的基本观测和状态信息。
| 字段键 | 数据类型 | 描述 |
|---|---|---|
timestep_id |
int |
轨迹内的时间步顺序索引。 |
camera/color/Camera |
PIL.Image / ndarray |
RGB 图像观测。由于 MOVE 范式,图像捕获了动态变化的物体、目标和相机视角。 |
arm/jointStatePosition/joint_single |
array[float] |
机器人关节状态/动作。Piper 机械臂的关节位置,代表机器人当前时间步的状态或执行的动作。 |
/arm/jointStatePosition/master |
array[float] |
主设备状态。Pika 遥操作主设备的关节或位置状态,记录了人类操作者的意图。 |
注意:此数据集严格仅包含上述三个关键数据流。不包含显式的 3D 坐标、世界坐标系下的相机位姿或其他计算得出的元数据。
数据划分
真实世界数据集根据环境交互步骤(时间步)总数进行划分,用于效率评估:
| 划分名称 | 任务 | 总时间步数 | 描述 |
|---|---|---|---|
real_world_35k |
真实世界抓取放置(例如,橙子到托盘) | 35,000 | 一个具有挑战性的低数据场景,用于测试空间泛化能力。 |
real_world_75k |
真实世界抓取放置 | 75,000 | 用于性能扩展以及与静态基线的效率比较。 |
关键优势
- 高空间泛化能力: 在此动态增强数据上训练的策略,在空间随机化、未见配置的测试中表现出更高的成功率。
- 卓越的数据效率: 与传统静态方法收集的数据集相比,MOVE 数据集使策略能够以显著更少的总时间步数实现具有竞争力的性能。
使用方式
此数据集是训练鲁棒的真实世界机器人操作策略的理想资源,特别是那些依赖于高泛化性视觉运动数据的策略。
加载数据
python from datasets import load_dataset
加载 75k 时间步的真实世界子集
dataset = load_dataset("your-huggingface-org/MOVE", "real_world_75k")
访问图像和状态数据
first_example = dataset["train"][0] image = first_example["camera/color/Camera"] robot_state = first_example["arm/jointStatePosition/joint_single"]
引用
如果此工作对您有帮助,请考虑引用我们的论文:
@misc{wang2025movesimplemotionbaseddata, title={MOVE: A Simple Motion-Based Data Collection Paradigm for Spatial Generalization in Robotic Manipulation}, author={Huanqian Wang and Chi Bene Chen and Yang Yue and Danhua Tao and Tong Guo and Shaoxuan Xie and Denghang Huang and Shiji Song and Guocai Yao and Gao Huang}, year={2025}, eprint={2512.04813}, archivePrefix={arXiv}, primaryClass={cs.RO}, url={https://arxiv.org/abs/2512.04813}, }




