KS325/close-lower-drawer-r1_emp_train
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/KS325/close-lower-drawer-r1_emp_train
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由LeRobot创建,属于机器人领域。数据集包含14个episodes,11903帧,1个任务。数据格式为parquet和mp4。数据集结构包括数据文件、视频文件、帧率、分割、特征等信息。特征包括动作(6个关节位置)、观察状态(6个关节位置)、两个摄像头图像(480x640x3)、时间戳、帧索引、episode索引、索引和任务索引。视频文件的帧率为30fps,编码为av1,像素格式为yuv420p,无音频。
This dataset was created by LeRobot and belongs to the robotics domain. It contains 14 episodes, 11903 frames, and 1 task. The data formats are parquet and mp4. The dataset structure includes data files, video files, frame rate, splits, features, etc. Features include actions (6 joint positions), observation states (6 joint positions), images from two cameras (480x640x3), timestamps, frame indices, episode indices, indices, and task indices. The video files have a frame rate of 30fps, are encoded in av1, have a pixel format of yuv420p, and no audio.
提供机构:
KS325
搜集汇总
数据集介绍

构建方式
在机器人操作任务的数据采集领域,该数据集依托于LeRobot开源框架构建而成,通过遥操作方式引导一款so_follower型机械臂执行关闭下层抽屉的单一任务。数据采集过程以30帧每秒的采样频率同步记录6维关节空间的动作指令与本体状态信息,同时由两台摄像机分别采集640×480分辨率的视觉影像,并编码为AV1格式的视频流。全部14个操作轨迹经分块存储为Parquet格式的结构化数据与MP4格式的视频文件,每个轨迹均包含完整的时序信息与任务索引,最终汇聚为约20万帧的规模化训练样本库。
特点
该数据集展现出高度的任务聚焦性与多模态融合特性,其核心优势在于将机械臂的关节空间动态表征与双视角视觉观测进行精细化对齐。14个操作轨迹在100兆字节的Parquet数据中编码了肩部、肘部、腕部及夹爪的6自由度连续运动轨迹,而200兆字节的视频文件则提供了从不同角度观察作业环境的视觉上下文。所有数据均按1000帧大小的数据块进行组织,并明确划分训练集与验证集,这种结构化存储方式既便于批处理加载,也为模仿学习中的状态-动作映射研究提供了天然的数据支撑。
使用方法
基于LeRobot生态的兼容性设计,研究者可通过Hugging Face Spaces的交互式可视化界面直观预览每个轨迹的关节运动与视频回放。在实际使用时,推荐采用LeRobot的数据加载API按分块索引读取Parquet文件,将action字段作为策略输出的监督信号,observation.state作为动力学模型的状态输入,而observation.images字段则用于端到端视觉运动策略的训练。值得注意的是,数据集中thread_time字段标定的时间戳为跨模态数据同步提供了校准基准,便于开展时序对齐相关的算法研究。
背景与挑战
背景概述
在机器人学习领域,模仿学习通过从人类示教中提取行为模式,为机器人技能习得提供了高效路径。该数据集由研究者在LeRobot框架下创建,旨在收集机器人完成“关闭下层抽屉”这一精细操作任务的视觉与运动数据,以推动双臂协调与物体交互的研究。数据集包含14个演示片段、总计11903帧时间序列数据,并配备双视角高清摄像头(640×480像素)及六自由度关节状态记录,为分析机器人操控策略提供了结构化样本。其公开采用Apache-2.0许可,降低了研究壁垒,有望促进仿人机器人灵巧操作与任务泛化能力的提升。
当前挑战
该数据集所解决的领域问题聚焦于机器人精细化物体的操控,例如将抽屉准确关闭这一日常任务中,机器人需克服动作精度不足、多关节协调困难以及视觉反馈延迟等挑战。在构建过程中,研究者面临统一多源异构数据格式的难题,需将高帧率视频流与异步关节状态同步编码为标准化序列;同时,仅14个演示片段的小样本规模限制了策略的鲁棒性,而机械臂末端执行器抓取力控制的不确定性亦对数据一致性构成显著考验。
常用场景
经典使用场景
在机器人学习与操作技能习得领域,close-lower-drawer-r1_emp_train数据集作为典型的模仿学习数据集,广泛应用于机器人灵巧操作技能的迁移与泛化研究。该数据集记录了机器人从初始状态闭合下方抽屉的完整轨迹,包含14个示范片段、近1.2万帧高保真时序数据,并同步采集了六维关节空间状态与双视角视觉观测。研究者常将其作为基准,用于训练基于行为克隆或逆强化学习的策略网络,以验证模型在精细操作任务中的轨迹复现能力与动作平滑性。
解决学术问题
该数据集重点解决了机器人操作技能学习中稀疏奖励与高维状态空间带来的策略学习瓶颈问题。通过提供密集的时序状态-动作对与多模态视觉输入,它使学者能够深入探索从示范数据中高效提取操作基元的方法,并对比不同模仿学习架构(如CNN-Transformer或扩散策略)在低样本场景下的表现。其发布推动了对于具身智能任务中数据效率、域适应能力以及小样本泛化机制的学术研究。
衍生相关工作
基于close-lower-drawer-r1_emp_train,衍生出一系列经典工作,包括面向机器人抽屉操作的迁移学习框架、融合注意力机制的操作基元分割模型,以及利用对比学习增强视觉表征的策略泛化方法。部分研究还以该数据为模板,构建了多任务联合训练数据集,验证了共享潜在表示在长时序抽屉操作中的有效性。此外,该数据集也常被用作DaVinci等更复杂操作技能的初始化预训练样本。
以上内容由遇见数据集搜集并总结生成



