five

oxe-datasets

收藏
Hugging Face2026-04-04 更新2026-04-05 收录
下载链接:
https://huggingface.co/datasets/kechenkechen/oxe-datasets
下载链接
链接失效反馈
官方服务:
资源简介:
OXE数据集镜像是一个个人研究镜像,旨在提高Open X-Embodiment (OXE)数据集的可访问性,特别是在HPC集群上。该镜像包含多个与机器人学习和操作相关的数据集,如Bridge V2、Fractal (RT-1)、DROID、BC-Z、FMB、Language Table、Taco Play、Furniture Bench和Roboturk。这些数据集来自不同的来源,并遵循各自的原始许可协议(如MIT、Apache 2.0、CC-BY 4.0等)。数据集适用于机器人学习、操作任务等研究场景。使用这些数据集时,请引用相关的原始工作。
创建时间:
2026-04-04
原始信息汇总

OXE数据集镜像概述

数据集基本信息

  • 数据集名称: OXE Dataset Mirror
  • 托管平台: Hugging Face
  • 镜像目的: 为通过hf-mirror.com从高性能计算集群访问提供便利。
  • 数据集性质: Open X-Embodiment (OXE) 数据集的个人研究镜像。
  • 主要标签: open-x-embodiment, robot-learning, manipulation
  • 任务类别: robotics
  • 许可证: apache-2.0

包含的数据集列表

数据集名称 原始许可证 原始来源
Bridge V2 MIT https://rail.eecs.berkeley.edu/datasets/bridge_release
Fractal (RT-1) Apache 2.0 https://github.com/google-deepmind/open_x_embodiment
DROID CC-BY 4.0 https://droid-dataset.github.io
BC-Z Apache 2.0 https://github.com/google-deepmind/open_x_embodiment
FMB Apache 2.0 https://github.com/google-deepmind/open_x_embodiment
Language Table Apache 2.0 https://github.com/google-deepmind/open_x_embodiment
Taco Play Apache 2.0 https://github.com/google-deepmind/open_x_embodiment
Furniture Bench MIT https://github.com/google-deepmind/open_x_embodiment
Roboturk MIT https://github.com/google-deepmind/open_x_embodiment

引用信息

如果使用这些数据集,请引用原始工作: bibtex @article{open_x_embodiment_rt_x_2023, title={Open {X-E}mbodiment: Robotic Learning Datasets and {RT-X} Models}, author={Open X-Embodiment Collaboration}, year={2023} } @article{khazatsky2024droid, title={DROID: A Large-Scale In-The-Wild Robot Manipulation Dataset}, author={Khazatsky, Alexander and Pertsch, Karl and others}, year={2024} }

搜集汇总
数据集介绍
main_image_url
构建方式
在机器人学习领域,数据集的构建方式直接影响模型的泛化能力。Open X-Embodiment数据集通过整合多个独立研究项目的数据资源而形成,这些子数据集如Bridge V2、Fractal和DROID等,均源自不同实验室的真实机器人操作记录。每个子集均遵循严格的采集协议,利用多样化的机器人平台在真实或仿真环境中执行任务,确保了数据在动作、场景和对象层面的异质性。这种聚合策略不仅扩大了数据规模,还通过统一的元数据框架促进了跨数据集的一致性。
特点
该数据集的核心特点在于其前所未有的规模与多样性,涵盖了从桌面操作到复杂移动操控的广泛机器人任务。数据集中包含多模态信息,如视觉观察、关节状态及自然语言指令,为研究提供了丰富的上下文。其子数据集均经过精心标注,且保留了原始许可协议,确保了学术使用的合规性。这种大规模、多源、多任务的数据集合,为训练具有强泛化能力的机器人策略模型奠定了坚实基础。
使用方法
研究人员可通过HuggingFace平台直接访问此镜像数据集,便于在高性能计算集群中进行高效加载。典型的使用流程包括利用标准数据加载器读取特定子集,并依据任务需求提取相应的观察、动作与语言指令序列。该数据集适用于机器人模仿学习、多任务策略预训练及跨领域迁移学习等研究方向。在使用时,务必遵循各子数据集的原始许可要求,并在发表成果时正确引用对应的原始文献。
背景与挑战
背景概述
Open X-Embodiment (OXE) 数据集集合于2023年由Open X-Embodiment协作团队发布,其核心研究问题聚焦于机器人学习领域的泛化能力与大规模数据驱动方法。该集合整合了多个子数据集,如Bridge V2、Fractal (RT-1)和DROID等,旨在通过跨机构、跨任务的数据融合,推动机器人操纵技能的通用模型发展。这一倡议标志着机器人学从单一任务优化向开放世界适应性转变的关键里程碑,为后续RT-X等模型的训练提供了丰富且多样化的现实世界交互数据,显著提升了机器人自主操作的可扩展性与鲁棒性。
当前挑战
OXE数据集旨在解决机器人操纵任务中的泛化与适应性问题,其挑战在于如何从异构、多源数据中学习统一的行为策略,以应对真实环境的复杂性与不确定性。构建过程中,数据收集面临硬件差异、任务定义不一致以及隐私与安全约束等难题;同时,数据整合需克服格式标准化、标注质量控制和时空对齐等技术障碍,这些因素共同制约了大规模机器人学习系统的实用化进程。
常用场景
经典使用场景
在机器人学习领域,大规模、多样化的数据集是推动智能体泛化能力的关键。OXE数据集作为Open X-Embodiment项目的核心组成部分,其经典使用场景集中于训练跨领域、跨任务的通用机器人策略模型。研究者利用其中包含的Bridge V2、DROID、Fractal等多个子数据集,涵盖从桌面操作到复杂环境导航的多样化任务,通过大规模离线强化学习或行为克隆方法,构建能够适应新场景和未知对象的机器人策略。这些数据集的高质量、多模态记录为模型提供了丰富的状态-动作对,促进了从感知到控制的端到端学习。
解决学术问题
OXE数据集有效应对了机器人学习中长期存在的泛化性不足和数据稀缺难题。传统机器人策略往往依赖于特定任务的小规模仿真或实验室数据,难以迁移到真实世界的复杂环境中。该数据集通过整合来自不同机器人平台、任务类型和地理分布的百万级演示轨迹,为学术界提供了研究跨实体泛化、多任务学习以及少样本适应的基准。其意义在于推动了机器人学习从狭隘的专业化模型向通用化智能体的范式转变,为构建能够理解并执行多样化指令的机器人系统奠定了数据基础。
衍生相关工作
OXE数据集的发布催生了一系列具有影响力的衍生研究工作。其中最著名的当属RT-X模型系列,这些模型利用该数据集的大规模多机器人数据,展示了在未见过的机器人平台和任务上显著的零样本泛化能力。此外,许多研究工作围绕数据集的子集展开,例如基于DROID数据集研究野外环境下的操作鲁棒性,或利用Language Table探索视觉-语言指令与机器人控制的结合。这些工作共同推动了通用机器人智能体的算法创新,并建立了新的性能评估基准。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作