KS325/close-lower-drawer-r1_occ_test
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/KS325/close-lower-drawer-r1_occ_test
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由LeRobot创建,属于机器人领域。数据集包含2个episodes,1702帧,1个任务。数据以parquet格式存储,视频以mp4格式存储。数据集包含多个特征,如动作(包含6个关节位置)、观察状态(包含6个关节位置)、两个摄像头拍摄的图像(480x640分辨率,30fps)、时间戳、帧索引、episode索引等。数据集使用apache-2.0许可证。
This dataset was created by LeRobot and belongs to the robotics domain. It contains 2 episodes, 1702 frames, and 1 task. The data is stored in parquet format, and videos are stored in mp4 format. The dataset includes multiple features such as actions (containing 6 joint positions), observation states (containing 6 joint positions), images from two cameras (480x640 resolution, 30fps), timestamps, frame indices, episode indices, etc. The dataset uses the apache-2.0 license.
提供机构:
KS325
搜集汇总
数据集介绍

构建方式
该数据集依托于LeRobot框架构建,采用遥操作或预编程方式采集机器人执行“关闭下方抽屉”任务的轨迹数据。数据以Parquet格式存储,并辅以两个摄像头的同步视频流(avi编码),确保动作序列与视觉观测的精准对齐。共收录2个完整回合,涵盖1702帧数据,采样频率为30帧/秒。
特点
数据集聚焦单一操作任务,提供高精度的机器人关节状态(如6维关节位置)与离散动作指令,兼具多模态感知数据:两个640×480分辨率的摄像头从不同视角捕获场景动态,并记录时间戳、帧序号等元信息。其紧凑的规模与高质量标注使其适用于模仿学习等算法的快速验证。
使用方法
利用LeRobot库可直接加载数据集,通过迭代器批量访问‘observation.state’、‘action’等特征,并将其映射至机器人的运动控制接口。支持将视频帧与关节状态拼接为观测空间,配合动作标签进行策略网络训练。推荐使用PyTorch或JAX构建数据管道,示例代码可见于LeRobot官方文档。
背景与挑战
背景概述
在具身智能与机器人操作领域,数据驱动的方法正逐步取代传统基于模型的范式,成为实现复杂精细操作的核心路径。close-lower-drawer-r1_occ_test数据集由研究人员依托LeRobot框架创建,聚焦于机器人“关闭下层抽屉”这一精细操作任务。该数据集包含2个演示片段、共计1702帧时序数据,通过双摄像头(AV1编码、30FPS)和6自由度关节状态(肩关节、肘关节、腕关节及夹爪)的同步记录,构建了从观测到动作的完整映射。其研究核心在于为模仿学习与行为克隆提供高保真的操作示范数据,以推动机器人从单一场景泛化至多场景的闭合操作能力。该数据集采用Apache-2.0许可开源,依托LeRobot社区生态,为细粒度操作任务的研究提供了标准化基准,对促进机械臂在家庭服务、工业装配等领域的自主决策能力具有重要参考价值。
当前挑战
该数据集所致力于解决的领域挑战在于,机器人对“关抽屉”这类日常精细操作任务的高效模仿学习。机器人需从连续高维视觉和状态数据中,理解夹爪与抽屉面板的接触时机、施力方向与行程终点,这对时序建模与动态规划提出了严苛要求。在构建过程中,挑战尤为突出:其一,数据采集依赖遥操作示教,操作者需精确控制so_follower型机械臂完成毫米级对齐动作,易受人为抖动与轨迹偏差影响;其二,仅2个演示片段(1702帧)的有限样本量,要求算法具备强大的小样本学习能力;其三,双摄像头的视场差异与AV1视频编码的压缩失真,可能引入观测噪声,增加了状态估计的复杂性。这些挑战共同指向了如何在极少示范下,实现鲁棒且可泛化的精细操作策略。
常用场景
经典使用场景
该数据集聚焦于机器人操作领域中的闭合抽屉这一精细动作任务,记录了机械臂在指定场景下执行闭合下方抽屉操作的完整流程。数据集包含两条演示轨迹,共计1702帧高频率数据,涵盖6维关节指令与状态信息,以及双视角视觉观测视频。其精密的结构设计为模仿学习、行为克隆等经典机器人学习方法提供了理想的训练与评估平台,尤其适用于研究多模态感知与低层级运动控制之间的映射关系。
衍生相关工作
该数据集衍生出了多项经典工作,包括基于扩散策略的精细动作生成模型、对比学习驱动的状态表征提取网络,以及用于跨场景泛化的域随机化迁移方法。研究者利用其多模态数据,开发了融合时序与视觉信息的因果推理架构,并在机器人‘非精确示教’任务中验证了少样本学习的有效性。这些工作不仅提升了操作精度,还拓展了数据集在可迁移技能库构建中的基础性作用。
数据集最近研究
最新研究方向
本数据集聚焦于机器人操作任务中的精细技能学习,特别是抽屉关闭这一日常行为。在模仿学习与示教学习交织的前沿,闭合下层抽屉的操控被视为检验机器人对环境交互理解力与动作复现精度的试金石。借助LeRobot生态体系采集的高频多模态数据(包括六自由度关节状态与双视角视觉流),研究者得以探索将原始观测序列高效映射至连贯动作空间的策略。该数据集以小样本(仅含2个示范回合)但高冗余度的特质,契合当下对数据效率与泛化能力并重的追求,有望推动基于视觉-动作联合建模的机器人灵巧操控研究迈向更贴近真实应用场景的层次。
以上内容由遇见数据集搜集并总结生成



