five

2026-05-04_direction-lerobot-with-rinse

收藏
Hugging Face2026-05-09 更新2026-05-10 收录
下载链接:
https://huggingface.co/datasets/lyl472324464/2026-05-04_direction-lerobot-with-rinse
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由LeRobot创建,采用Apache-2.0许可证,属于机器人学领域。数据集包含81个总片段,36024帧,1个总任务,数据文件大小为200MB,视频文件大小为200MB,帧率为50fps。数据以parquet格式存储,视频以mp4格式存储。数据集结构详细描述了多个特征,包括观察状态(14个浮点型数据,代表左右机械臂的各个关节状态)、动作(同样14个浮点型数据)、速度、力矩,以及来自四个不同摄像头的图像数据(每个图像为3通道,480x640分辨率)。此外,还包含任务索引、子任务、是否用于训练、时间戳、帧索引、片段索引等字段。该数据集适用于机器人控制、动作学习、视觉感知等相关研究。
创建时间:
2026-05-06
原始信息汇总

数据集概述

  • 数据集名称: 2026-05-04_direction-lerobot-with-rinse
  • 数据集地址: https://huggingface.co/datasets/lyl472324464/2026-05-04_direction-lerobot-with-rinse
  • 许可证: Apache-2.0
  • 任务类别: 机器人学 (Robotics)
  • 创建工具: 基于 LeRobot 框架创建

数据集结构

  • 机器人类型: ALPHA (aloha)
  • 总片段数 (Episodes): 81
  • 总帧数 (Frames): 36,024
  • 总任务数 (Tasks): 1
  • 数据块大小: 1000
  • 数据文件大小: 200 MB
  • 视频文件大小: 200 MB
  • 帧率 (FPS): 50
  • 数据集划分: 训练集 (train) 包含 0 到 80 号片段,共 81 个片段

数据特征 (Features)

状态与动作

  • 观测状态 (observation.state): 14 维 float32 向量,包含左/右臂各 7 个关节(腰部、肩部、肘部、前臂旋转、手腕角度、手腕旋转、夹爪)
  • 动作 (action): 14 维 float32 向量,结构与观测状态一致
  • 观测速度 (observation.velocity): 14 维 float32 向量,结构与观测状态一致
  • 观测力矩 (observation.effort): 14 维 float32 向量,结构与观测状态一致

图像观测

共有 4 个摄像头视角,均为视频格式,分辨率 480x640,3 通道:

摄像头名称 描述 编码格式 帧率
cam_high 高视角摄像头 AV1 50 fps
cam_low 低视角摄像头 AV1 50 fps
cam_left_wrist 左手腕摄像头 AV1 50 fps
cam_right_wrist 右手腕摄像头 AV1 50 fps

其他特征

  • 任务索引 (task_index): int64 类型
  • 子任务 (subtask): string 类型
  • 是否用于训练 (is_for_training): bool 类型
  • 时间戳 (timestamp): float32 类型
  • 帧索引 (frame_index): int64 类型
  • 片段索引 (episode_index): int64 类型
  • 全局索引 (index): int64 类型
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于LeRobot框架构建,专为机器人模仿学习任务设计。数据采集自一台具备14自由度(左右各7个关节)的Aloha型双臂机器人,通过遥操作或预设程序记录其执行单一操作任务的全过程。总计包含81个完整轨迹(episode),每个轨迹由一系列连续的状态-动作对构成,帧采样频率为50赫兹。原始数据被划分为1000帧大小的文件块,并以Parquet格式存储。对应的多视角视频数据(包含四个摄像头视角:高视角、低视角、左腕和右腕)则以AV1编码的MP4文件保存,分辨率均为640x480像素。所有数据均以Apache-2.0许可证开放,确保了使用的开放性。
特点
数据集的核心特点在于其高密度与多模态融合。每个数据样本同时涵盖了14维关节空间的状态(位置、速度、力矩)以及对应的14维动作指令,形成了完整的机器人运动学闭环描述。四路同步视频流提供了丰富的视觉信息,使得算法能够融合本体感知与视觉输入。整个数据集规模适中:包含36024帧,总数据量与视频量各约200MB,且无显式的训练/验证集划分(所有81个轨迹均用于训练),非常适合用于中等规模的行为克隆或端到端模仿学习研究。
使用方法
该数据集专为基于LeRobot生态系统的研究设计。使用时,可通过LeRobot库的数据集加载函数(如`load_dataset`)直接读取。研究者可利用`observation.state`作为策略网络的输入状态,将`action`作为监督信号进行模仿学习。同时,`observation.images`中的视频数据可被解码为RGB图像序列,用于构建视觉-运动联合策略。数据以固定的时间步长对齐,支持序列化建模。由于未预设任务标签(仅含单一隐式任务),适用于连续控制场景下的策略学习,如精密操作或双臂协作任务。
背景与挑战
背景概述
该数据集由LeRobot框架构建,创建于2026年5月4日,专注于机器人操作技能的模仿学习研究。基于A LOHA双臂机器人平台,数据集涵盖了81个完整演示片段,共包含36024帧高频(50 FPS)观察数据与动作序列,记录了一个特定操作任务的精细化运动轨迹。数据集由Hugging Face LeRobot团队主导开发,旨在为机器人领域提供一个标准化、可复现的高质量演示数据集,推动基于视觉与状态观测的模仿学习算法发展。其开源Apache-2.0许可与标准化的数据结构,降低了研究门槛,有望成为双臂精细操作任务研究的基准资源,对机器人学习社区的数据共享与算法比较具有重要推动作用。
当前挑战
该数据集所解决的领域核心挑战在于双臂机器人精细操作的模仿学习,传统方法难以从少量演示中泛化到新场景,而数据集通过记录14维关节状态与4路高清视频(含腕部视角)的同步信息,为学习高精度闭环控制策略提供了多模态支持。构建过程中面临的主要挑战包括:确保演示质量的高度一致性,避免人为操作噪声干扰;协调多相机、高频关节状态与视频数据的精确同步,以维持时间对齐;此外,在有限的任务设定(仅单任务)下平衡数据规模与多样性,为算法训练的鲁棒性提出考验。
常用场景
经典使用场景
在机器人学习与模仿学习领域,该数据集凭借其精细的动作记录与多视角视觉输入,为训练双机械臂协作执行复杂操作任务提供了理想的基准资源。研究学者常利用其包含的关节状态、速度、力矩及四个摄像头同步视频流,构建从视觉观测到动作输出的端到端策略模型。数据以50赫兹的高频率采样,覆盖了单任务共81个完整演示轨迹,配合标准化特征命名规范,尤其适用于模仿学习中的行为克隆与扩散策略方法,能够有效捕捉精细操控过程中的连续动作依赖关系。
实际应用
在实际应用层面,该数据集所采集的双机械臂精密操作演示数据,可显著简化工业场景中如零件装配、电路板组件插接等精细化流程的自动化部署流程。通过离线训练从图像与关节状态到动作的策略网络,机器人系统能够快速习得柔性物体的操作规律或微小零件的对准装配技能,进而降低传统编程式控制中对环境建模的依赖。此外,结合领域随机化技术,数据亦可迁移至家庭服务场景中,如瓶罐开盖或衣物折叠等适应性操控任务。
衍生相关工作
基于该数据集的规范结构,已衍生出多项推动人机交互与技能学习发展的代表性工作,例如基于扩散模型的机器人动作生成框架,利用数据中的多模态状态与动作轨迹进行条件式去噪训练,显著提升了多步操控指令的生成平滑度。同时,该数据集也被用于验证基于对比学习的特征表示方法,通过共享视角下的时空一致性约束,实现了对机械臂操作空间中隐式约束的自动发现。这些衍生成果进一步拓展了数据集在跨具身形态策略迁移与实时自适应控制中的理论支撑与应用边界。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作