KS325/close-lower-drawer-r1_occ_val
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/KS325/close-lower-drawer-r1_occ_val
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由LeRobot创建,属于机器人领域。数据集包含4个episodes,3399帧,1个任务。数据文件格式为parquet,视频文件格式为mp4。特征包括动作(6个关节位置)、观测状态(6个关节位置)、两个摄像头的图像(480x640x3)、时间戳、帧索引、episode索引等。数据集的fps为30,总数据文件大小为100MB,视频文件大小为200MB。
This dataset was created by LeRobot and belongs to the robotics domain. It contains 4 episodes, 3399 frames, and 1 task. The data files are in parquet format, and the video files are in mp4 format. Features include actions (6 joint positions), observation states (6 joint positions), images from two cameras (480x640x3), timestamps, frame indices, episode indices, etc. The dataset has an fps of 30, with a total data file size of 100MB and video file size of 200MB.
提供机构:
KS325
搜集汇总
数据集介绍

构建方式
该数据集依托于LeRobot开源框架构建,旨在捕捉机器人执行“关闭下层抽屉”这一精细操作任务的完整轨迹。数据采集过程中,通过so_follower型机器人实体,在真实物理环境中以30帧每秒的采样频率同步记录六自由度关节动作序列与视觉观测信息。共计收集了4个完整操作回合,包含3399帧时序数据,所有数据以parquet高效列式格式存储于分块文件中,并辅以AV1编码的480×640分辨率双视角视频记录,确保动作与视觉信息的时空对齐。
使用方法
使用者可借助LeRobot库快速加载本数据集,首先通过`lerobot.common.datasets`模块实例化数据集对象,直接获得已标准化的回合字典。在训练过程中,建议将3399帧数据按默认分割全部用于训练,并利用内置的视频解码器与动作归一化接口进行数据预处理。对于策略模型,可设计视觉编码器处理双视角图像序列,结合动作预测头输出六维连续控制量。双视角视频数据尤其适用于基于观测的模仿学习算法,如扩散策略或Transformer行为克隆架构。
背景与挑战
背景概述
在机器人学习领域,模仿学习正逐步成为推动具身智能体高效获取复杂操作技能的关键技术。close-lower-drawer-r1_occ_val数据集由研究团队基于LeRobot框架构建,专注于机器人通过视觉与运动状态的联合观测来执行“关闭下层抽屉”这一精细操作任务。该数据集于近期发布,依托HuggingFace平台开放共享,采用Apache-2.0许可协议,旨在为机器人精细操作技能的学习与验证提供标准化数据资源。数据集包含4个示范轨迹,总帧数达3399帧,以30帧/秒的频率采集了两路高清摄像头视角的图像及6自由度关节状态与动作指令,覆盖了从抽屉半开至完全闭合的完整操作过程。作为一种小样本、低维度的精细化操作数据集,它为评估视觉-运动联合表征学习、迁移泛化能力以及离线强化学习算法在真实机器人任务上的表现提供了宝贵的基准,有望推动机器人操作技能从实验室环境向真实应用场景的迁移与泛化。
当前挑战
该数据集所解决的领域挑战在于,当前的机器人模仿学习方法在处理精细操作任务时,常面临样本效率低下、对复杂环境变化的鲁棒性不足以及从有限演示中有效提取可泛化运动策略的瓶颈。具体而言,关闭抽屉这类任务要求机器人精确感知抽屉的位置、姿态与滑动状态,并生成连续、平滑且力控精准的动作序列,这对视觉感知与运动控制的同步协调提出了极高要求。在数据集构建过程中,主要挑战包括:如何在有限(仅4个示范)且单任务的数据规模下,确保动作序列的对齐精度与视频-状态特征的时间同步性;如何避免因传感器噪声或光照变化导致的观测质量不稳定;以及如何通过标准化格式(Parquet与AV1压缩视频)在保持数据完整性的同时降低存储与传输开销。这些挑战的突破对于推动机器人从示教中快速掌握精细操作技能具有关键意义。
常用场景
经典使用场景
在机器人操作领域,close-lower-drawer-r1_occ_val数据集为模仿学习与行为克隆算法的验证提供了精细化场景。该数据集聚焦于让机械臂执行关闭下方抽屉这一具体操作,包含4个完整回合、3399帧视频与状态数据,由so_follower机器人通过LeRobot框架采集。研究者可借此将视觉观测与关节动作序列对齐,训练机器人从示教中习得闭合抽屉的精准运动策略,尤其适合验证结合多视角图像与状态信息的控制模型在精细操作任务中的泛化能力。
解决学术问题
该数据集致力于解决机器人少样本模仿学习中的动作泛化难题。传统方法依赖大规模标注数据,而此数据集通过提供有限回合的高质量演示,推动研究领域探索如何从稀疏示范中提取可迁移的操作知识。其双摄像头配置与6维关节动作标注,便于分析视觉感知与运动控制的映射关系,为揭示闭环控制中状态估计误差对任务成功率的影响机理提供了实验基准,对发展更具鲁棒性的机器人学习理论具有重要支撑作用。
实际应用
在实际部署中,该数据集驱动的模型可应用于家庭服务与工业辅助场景,例如让机器人自主完成储物柜抽屉的闭合操作。通过模仿学习获得的策略能够适应不同抽屉的摩擦系数与铰链结构,结合视觉反馈实现自适应施力与路径规划。此外,其低延迟推理特性使得机器人可在动态环境中实时调整抓取姿态,避免物品碰撞,为智能家居、仓储物流等领域的柔性自动化方案提供了可行的技术路径。
数据集最近研究
最新研究方向
依托LeRobot框架构建的close-lower-drawer-r1_occ_val数据集,聚焦于机器人操作领域的精细化技能学习,尤其是针对抽屉闭合这一具有代表性的日常任务。当前,前沿研究方向正围绕基于视觉-动作联合表征的模仿学习展开,借助多视角视觉输入(如camera1与camera2的高清流媒体)与机器人本体六维关节状态信息,探索在有限演示数据(仅4个回合)条件下实现高效泛化的策略。这一工作与具身智能中“小样本模仿”和“行为克隆优化”的热点紧密相关,通过将机器人从简单的轨迹追踪推向对任务语义的深层理解,为部署低成本、可复用的家庭服务机器人提供了关键数据支撑,其意义在于缩小仿真训练与现实世界执行之间的鸿沟。
以上内容由遇见数据集搜集并总结生成



