dbb_non_cyclic
收藏Hugging Face2026-02-14 更新2026-02-15 收录
下载链接:
https://huggingface.co/datasets/J-joon/dbb_non_cyclic
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是使用LeRobot创建的,采用apache-2.0许可证。数据集属于机器人技术类别,并标记为LeRobot。数据集结构详细描述在一个JSON文件中,包括代码库版本、机器人类型、总剧集数、总帧数、总任务数、块大小、数据和视频文件大小、帧率、分割以及数据和视频文件的路径。特征部分描述了观察状态、动作、来自不同摄像头的观察图像、时间戳、帧索引、剧集索引、索引和任务索引,包括它们的数据类型、形状和名称。该数据集适用于机器人技术相关的任务和应用。
创建时间:
2026-02-13
原始信息汇总
数据集概述
基本信息
- 数据集名称: J-joon/dbb_non_cyclic
- 创建工具: LeRobot (https://github.com/huggingface/lerobot)
- 许可协议: Apache-2.0
- 任务类别: 机器人学
- 标签: LeRobot
数据集规模
- 总情节数: 500
- 总帧数: 116553
- 总任务数: 441
- 数据文件大小: 100 MB
- 视频文件大小: 200 MB
- 帧率: 50 FPS
- 数据块大小: 1000
- 数据分割: 训练集 (0:500)
数据结构与特征
数据存储为Parquet文件,路径模式为:data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频存储为MP4文件,路径模式为:videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
特征字段说明
-
observation.state
- 数据类型: float32
- 形状: [14]
- 关节名称: right_waist, right_shoulder, right_elbow, right_forearm_roll, right_wrist_angle, right_wrist_rotate, right_gripper, left_waist, left_shoulder, left_elbow, left_forearm_roll, left_wrist_angle, left_wrist_rotate, left_gripper
-
action
- 数据类型: float32
- 形状: [14]
- 关节名称: 与observation.state相同
-
observation.images.cam_high
- 数据类型: video
- 形状: [3, 480, 640] (通道, 高度, 宽度)
- 视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 非深度图
- 帧率: 50
- 通道: 3
- 无音频
-
observation.images.cam_left_wrist
- 数据类型: video
- 形状: [3, 480, 640]
- 视频信息: 与cam_high相同
-
observation.images.cam_right_wrist
- 数据类型: video
- 形状: [3, 480, 640]
- 视频信息: 与cam_high相同
-
timestamp
- 数据类型: float32
- 形状: [1]
-
frame_index
- 数据类型: int64
- 形状: [1]
-
episode_index
- 数据类型: int64
- 形状: [1]
-
index
- 数据类型: int64
- 形状: [1]
-
task_index
- 数据类型: int64
- 形状: [1]
机器人平台
- 机器人类型: aloha
代码库版本
- 版本: v3.0
备注
- 主页、论文和引用信息暂未提供。
搜集汇总
数据集介绍

构建方式
在机器人学习领域,高质量的数据集对于训练和评估模型至关重要。dbb_non_cyclic数据集依托LeRobot框架构建,通过采集双臂机器人(ALOHA系统)在实际环境中的交互数据而形成。该数据集包含500个完整的情节,总计超过11.6万帧,以50帧每秒的速率记录,数据以分块Parquet文件格式存储,并辅以同步的多视角视频流,确保了时序与空间信息的一致性。
特点
该数据集的特点体现在其丰富的多模态信息与精细的结构化设计。它不仅提供了机器人14维关节状态与动作的精确数值记录,还整合了来自高位摄像头及左右腕部摄像头的三路视频流,每路视频分辨率均为640x480,编码格式统一。数据特征命名清晰,涵盖时间戳、帧索引及任务索引等元数据,支持对复杂机器人行为进行深入分析与建模。
使用方法
使用该数据集时,研究者可通过LeRobot工具链便捷加载数据,利用其预定义的数据路径与分块结构高效访问。数据集适用于机器人模仿学习、强化学习及行为克隆等任务,用户可依据帧索引或情节索引提取对应的观测状态、动作及视觉信息,进行端到端的模型训练或策略评估。其标准化的格式确保了与主流机器学习框架的兼容性,为算法开发提供了可靠基础。
背景与挑战
背景概述
在机器人学习领域,模仿学习与强化学习的研究亟需高质量、大规模的真实世界交互数据集。dbb_non_cyclic数据集由HuggingFace的LeRobot项目创建,专门面向双手机器人操作任务。该数据集采集自ALOHA机器人平台,包含500个任务片段、超过11万帧数据,整合了多视角视觉观测与14维关节状态及动作信息,旨在为机器人策略学习提供丰富的离线训练资源。其构建依托开源社区协作,反映了当前机器人学习向数据驱动范式转型的趋势,为泛化操作技能的研究奠定了关键数据基础。
当前挑战
该数据集致力于解决机器人操作中的非周期性任务学习挑战,例如复杂序列决策与多模态感知融合。其核心难点在于如何从高维视觉与状态数据中提取有效特征,并实现跨任务的策略泛化。在构建过程中,面临数据采集同步性、传感器标定一致性以及大规模视频数据压缩存储等技术障碍。此外,确保动作空间的连续性与安全性,以及标注任务的多样性与真实性,亦是数据集构建中需克服的关键问题。
常用场景
经典使用场景
在机器人学习领域,dbb_non_cyclic数据集为双臂机器人操作任务提供了丰富的多模态数据资源。该数据集通过记录ALOHA机器人执行441项任务的轨迹,包含关节状态、动作指令以及多视角视觉信息,为模仿学习和强化学习算法提供了标准化的训练与评估基准。研究者能够利用这些数据开发机器人自主执行复杂操作策略,如物体抓取与装配,从而推动机器人灵巧操作能力的进步。
解决学术问题
该数据集有效应对了机器人学中数据稀缺与泛化能力不足的挑战。通过提供大规模、高质量的真实世界交互数据,它支持端到端策略学习的研究,减少了仿真到现实迁移的差距。其多模态特性促进了感知与控制的融合,为解决动态环境下的长时程任务规划、多传感器信息整合等核心学术问题提供了实证基础,对提升机器人自主性与适应性具有深远意义。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作,主要集中在视觉运动策略学习与多任务泛化方向。例如,基于模仿学习的框架利用其多视角视频与状态动作对,训练出能够直接从像素输入生成控制指令的神经网络。同时,该数据也支撑了元学习与迁移学习方法的探索,使机器人能够快速适应新任务,推动了数据高效型机器人学习算法的发展与创新。
以上内容由遇见数据集搜集并总结生成



