five

xlerobot_xbox_dataset_part3

收藏
Hugging Face2026-01-12 更新2026-01-13 收录
下载链接:
https://huggingface.co/datasets/ArthurWangSawau/xlerobot_xbox_dataset_part3
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由LeRobot创建,主要用于机器人研究领域。数据集包含2个episodes、384帧、1个任务的数据,存储为parquet格式。数据内容包括:机器人双臂12个关节的位置信息(包括右臂和左臂的肩部、肘部、腕部和夹持器的位置)、时间戳数据、以及来自主摄像头和左右腕部摄像头的视频数据(分辨率为480x640,帧率为30fps)。视频数据采用av1编解码器,yuv420p像素格式,不包含深度信息,也没有音频。
创建时间:
2026-01-04
原始信息汇总

数据集概述

基本信息

  • 数据集名称: ArthurWangSawau/xlerobot_xbox_dataset_part3
  • 创建工具: LeRobot
  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot

数据集规模

  • 总情节数: 2
  • 总帧数: 384
  • 总任务数: 1
  • 数据文件总大小: 100 MB
  • 视频文件总大小: 0.001 MB
  • 帧率: 30 FPS
  • 数据块大小: 1000
  • 数据划分: 训练集包含所有情节(索引0到2)

数据结构与特征

数据以Parquet文件格式存储,路径模式为 data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet。 视频以MP4文件格式存储,路径模式为 videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征详情

  1. 动作

    • 数据类型: float32
    • 形状: [12]
    • 描述: 包含左右机械臂各6个关节的位置指令。
      • right_arm_shoulder_pan.pos
      • right_arm_shoulder_lift.pos
      • right_arm_elbow_flex.pos
      • right_arm_wrist_flex.pos
      • right_arm_wrist_roll.pos
      • right_arm_gripper.pos
      • left_arm_shoulder_pan.pos
      • left_arm_shoulder_lift.pos
      • left_arm_elbow_flex.pos
      • left_arm_wrist_flex.pos
      • left_arm_wrist_roll.pos
      • left_arm_gripper.pos
  2. 观测状态

    • 数据类型: float32
    • 形状: [12]
    • 描述: 包含左右机械臂各6个关节的当前位置状态,特征名称与“动作”特征完全相同。
  3. 观测图像

    • 主摄像头图像
      • 数据类型: video
      • 形状: [480, 640, 3] (高度,宽度,通道)
      • 视频信息: 高度480像素,宽度640像素,编码器为av1,像素格式为yuv420p,非深度图,帧率30 FPS,3个颜色通道,无音频。
    • 左手腕摄像头图像
      • 数据类型: video
      • 形状: [480, 640, 3] (高度,宽度,通道)
      • 视频信息: 与主摄像头图像参数一致。
    • 右手腕摄像头图像
      • 数据类型: video
      • 形状: [480, 640, 3] (高度,宽度,通道)
      • 视频信息: 与主摄像头图像参数一致。
  4. 索引与时间戳

    • 时间戳
      • 数据类型: float32
      • 形状: [1]
    • 帧索引
      • 数据类型: int64
      • 形状: [1]
    • 情节索引
      • 数据类型: int64
      • 形状: [1]
    • 数据索引
      • 数据类型: int64
      • 形状: [1]
    • 任务索引
      • 数据类型: int64
      • 形状: [1]

其他信息

  • 代码库版本: v3.0
  • 机器人类型: 未指定
  • 主页: 未提供
  • 论文: 未提供
  • 引用信息: 未提供
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作学习领域,高质量的数据集对于模型训练至关重要。xlerobot_xbox_dataset_part3数据集依托LeRobot开源框架构建,通过记录双机械臂系统的实时操作过程,采集了包含12维关节位置的动作向量、多视角视觉观测以及时间戳等结构化信息。数据以Parquet格式分块存储,每块包含1000帧数据,总计384帧,涵盖2个完整操作序列,确保了数据的连续性与完整性。
特点
该数据集在机器人操作数据中展现出鲜明的技术特征。其核心在于同时整合了双机械臂的12自由度关节空间状态与动作指令,并配备了主视角、左腕视角和右腕视角的三路同步视频流,分辨率均为640x480,帧率30fps,采用AV1编码压缩。数据结构遵循严格的时空对齐,每个数据点均关联帧索引、回合索引与任务索引,为时序决策模型提供了多模态、高一致性的学习素材。
使用方法
针对机器人模仿学习与强化学习的研究需求,该数据集提供了清晰的使用路径。用户可通过加载Parquet数据文件直接访问动作、观测状态、图像视频及元数据字段。数据集已预设训练集划分,涵盖全部两个操作回合,适用于端到端策略学习、行为克隆或视觉-动作联合建模等任务。借助LeRobot生态工具,研究者可便捷地进行数据加载、可视化与预处理,加速机器人智能算法的开发与验证。
背景与挑战
背景概述
在机器人学习领域,高质量、大规模的真实世界交互数据集对于推动模仿学习与强化学习算法的进步至关重要。xlerobot_xbox_dataset_part3作为LeRobot项目的一部分,由HuggingFace社区于近期构建,旨在为双臂机器人操作任务提供丰富的多模态交互数据。该数据集聚焦于解决机器人双臂协调控制这一核心研究问题,通过记录机器人关节状态、视觉观测及动作指令,为算法开发提供了宝贵的现实世界基准。其采用Apache 2.0开源协议,体现了开放科学的精神,有望促进机器人社区在复杂操作任务上的协作与创新。
当前挑战
该数据集致力于应对机器人模仿学习中高维连续动作空间与多模态感知融合的挑战,其核心在于如何从异构传感器数据中学习鲁棒且泛化能力强的策略。在构建过程中,面临数据采集的复杂性,例如确保双臂机器人动作的同步性与安全性,以及处理高帧率视频流带来的存储与计算负担。此外,数据标注与对齐的精确性,特别是多视角图像与关节状态的时间同步,构成了另一重技术障碍,这些因素共同制约了数据集规模与质量的进一步提升。
常用场景
经典使用场景
在机器人学领域,xlerobot_xbox_dataset_part3数据集作为LeRobot项目的一部分,其经典使用场景集中于双臂机器人操作任务的模仿学习与策略训练。该数据集通过记录机器人关节位置状态、多视角视觉观察以及时间戳信息,为研究者提供了丰富的交互轨迹数据,常用于开发端到端的机器人控制模型,使机器人能够学习并复现复杂的双臂协调动作,如抓取、放置或装配等精细操作任务。
解决学术问题
该数据集有效解决了机器人模仿学习中数据稀缺与多样性不足的学术难题。通过提供结构化、多模态的机器人操作数据,它支持了从视觉感知到动作生成的映射研究,促进了基于学习的机器人控制方法的进展。其意义在于为双臂机器人操作任务建立了可重复的基准,推动了模仿学习、强化学习及多模态融合算法在真实世界机器人应用中的验证与优化,降低了实验成本并加速了算法迭代。
衍生相关工作
围绕该数据集,已衍生出一系列经典研究工作,主要集中在机器人模仿学习与视觉运动策略领域。例如,基于LeRobot框架的后续研究利用此类数据开发了高效的策略蒸馏方法、多视角视觉编码器以及跨模态表示学习模型。这些工作不仅扩展了数据集的应用边界,还催生了新的算法范式,如基于扩散模型的机器人动作生成和分层强化学习架构,进一步丰富了机器人学的研究生态。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作