KS325/close-lower-drawer-r1_occ_test

Name: KS325/close-lower-drawer-r1_occ_test
Creator: KS325
Published: 2026-04-30 05:18:26
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/KS325/close-lower-drawer-r1_occ_test

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，属于机器人领域。数据集包含2个episodes，1702帧，1个任务。数据以parquet格式存储，视频以mp4格式存储。数据集包含多个特征，如动作（包含6个关节位置）、观察状态（包含6个关节位置）、两个摄像头拍摄的图像（480x640分辨率，30fps）、时间戳、帧索引、episode索引等。数据集使用apache-2.0许可证。

This dataset was created by LeRobot and belongs to the robotics domain. It contains 2 episodes, 1702 frames, and 1 task. The data is stored in parquet format, and videos are stored in mp4 format. The dataset includes multiple features such as actions (containing 6 joint positions), observation states (containing 6 joint positions), images from two cameras (480x640 resolution, 30fps), timestamps, frame indices, episode indices, etc. The dataset uses the apache-2.0 license.

提供机构：

KS325

搜集汇总

数据集介绍

构建方式

该数据集依托于LeRobot框架构建，采用遥操作或预编程方式采集机器人执行“关闭下方抽屉”任务的轨迹数据。数据以Parquet格式存储，并辅以两个摄像头的同步视频流（avi编码），确保动作序列与视觉观测的精准对齐。共收录2个完整回合，涵盖1702帧数据，采样频率为30帧/秒。

特点

数据集聚焦单一操作任务，提供高精度的机器人关节状态（如6维关节位置）与离散动作指令，兼具多模态感知数据：两个640×480分辨率的摄像头从不同视角捕获场景动态，并记录时间戳、帧序号等元信息。其紧凑的规模与高质量标注使其适用于模仿学习等算法的快速验证。

使用方法

利用LeRobot库可直接加载数据集，通过迭代器批量访问‘observation.state’、‘action’等特征，并将其映射至机器人的运动控制接口。支持将视频帧与关节状态拼接为观测空间，配合动作标签进行策略网络训练。推荐使用PyTorch或JAX构建数据管道，示例代码可见于LeRobot官方文档。

背景与挑战

背景概述

在具身智能与机器人操作领域，数据驱动的方法正逐步取代传统基于模型的范式，成为实现复杂精细操作的核心路径。close-lower-drawer-r1_occ_test数据集由研究人员依托LeRobot框架创建，聚焦于机器人“关闭下层抽屉”这一精细操作任务。该数据集包含2个演示片段、共计1702帧时序数据，通过双摄像头（AV1编码、30FPS）和6自由度关节状态（肩关节、肘关节、腕关节及夹爪）的同步记录，构建了从观测到动作的完整映射。其研究核心在于为模仿学习与行为克隆提供高保真的操作示范数据，以推动机器人从单一场景泛化至多场景的闭合操作能力。该数据集采用Apache-2.0许可开源，依托LeRobot社区生态，为细粒度操作任务的研究提供了标准化基准，对促进机械臂在家庭服务、工业装配等领域的自主决策能力具有重要参考价值。

当前挑战

该数据集所致力于解决的领域挑战在于，机器人对“关抽屉”这类日常精细操作任务的高效模仿学习。机器人需从连续高维视觉和状态数据中，理解夹爪与抽屉面板的接触时机、施力方向与行程终点，这对时序建模与动态规划提出了严苛要求。在构建过程中，挑战尤为突出：其一，数据采集依赖遥操作示教，操作者需精确控制so_follower型机械臂完成毫米级对齐动作，易受人为抖动与轨迹偏差影响；其二，仅2个演示片段（1702帧）的有限样本量，要求算法具备强大的小样本学习能力；其三，双摄像头的视场差异与AV1视频编码的压缩失真，可能引入观测噪声，增加了状态估计的复杂性。这些挑战共同指向了如何在极少示范下，实现鲁棒且可泛化的精细操作策略。

常用场景

经典使用场景

该数据集聚焦于机器人操作领域中的闭合抽屉这一精细动作任务，记录了机械臂在指定场景下执行闭合下方抽屉操作的完整流程。数据集包含两条演示轨迹，共计1702帧高频率数据，涵盖6维关节指令与状态信息，以及双视角视觉观测视频。其精密的结构设计为模仿学习、行为克隆等经典机器人学习方法提供了理想的训练与评估平台，尤其适用于研究多模态感知与低层级运动控制之间的映射关系。

衍生相关工作

该数据集衍生出了多项经典工作，包括基于扩散策略的精细动作生成模型、对比学习驱动的状态表征提取网络，以及用于跨场景泛化的域随机化迁移方法。研究者利用其多模态数据，开发了融合时序与视觉信息的因果推理架构，并在机器人‘非精确示教’任务中验证了少样本学习的有效性。这些工作不仅提升了操作精度，还拓展了数据集在可迁移技能库构建中的基础性作用。

数据集最近研究