KS325/open-lower-drawer-emp-r1_val

Name: KS325/open-lower-drawer-emp-r1_val
Creator: KS325
Published: 2026-04-30 04:54:27
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/KS325/open-lower-drawer-emp-r1_val

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，主要用于机器人领域。数据集包含4个episodes，3391帧，1个任务。数据以parquet格式存储，视频以mp4格式存储。数据集结构包含动作（6个关节位置）、观测状态（6个关节位置）、两个摄像头图像（480x640分辨率）、时间戳、帧索引、episode索引等特征。数据集使用apache-2.0许可证。

This dataset was created using LeRobot and is primarily for robotics applications. It contains 4 episodes, 3391 frames, and 1 task. The data is stored in parquet format, and videos are in mp4 format. The dataset structure includes features such as actions (6 joint positions), observation states (6 joint positions), images from two cameras (480x640 resolution), timestamps, frame indices, episode indices, etc. The dataset is licensed under apache-2.0.

提供机构：

KS325

搜集汇总

数据集介绍

构建方式

该数据集基于LeRobot框架构建，旨在为机器人操作任务提供标准化的训练与验证数据。数据来源于SO-Follower机器人平台，通过遥操作或预设策略执行“拉开下层抽屉”这一单一任务，采集了4个完整回合（episode）的数据，共计3391帧，以30帧每秒的速率记录。数据以Parquet格式存储动作与状态信息，同时以MP4视频格式保存双路摄像头（camera1与camera2）的视觉观测，分辨率为480×640像素。元数据通过info.json文件描述，包括机器人类型、数据分片结构及特征定义，确保了数据集的可复现性与扩展性。

特点

数据集的核心特色在于其多模态的传感融合与高频率的时间对齐。动作空间与观测状态空间均包含6维关节信息（如肩部、肘部、腕部及夹爪），且保持维度一致，便于端到端模仿学习。视觉信息由两个RGB摄像头提供，覆盖不同视角，编码采用高效AV1格式，平衡了画质与存储。数据集规模精炼，总大小约300MB（含100MB数据与200MB视频），适合快速原型验证。所有特征（如时间戳、帧索引、回合索引）均以标准化数值类型记录，支持灵活的批处理与轨迹回放。

使用方法

用户可通过LeRobot库的API便捷加载与解析该数据集。推荐使用`lerobot.Dataset`类读取Parquet文件和关联视频，获取动作序列、状态向量及图像观测。数据已预先划分为训练集（4个回合），可直接用于行为克隆或强化学习中的策略训练。此外，Hugging Face Spaces提供了交互式可视化工具，允许在线预览机器人的运动轨迹与摄像头画面。研究者也可自定义采样策略（如步长50帧或分段1000帧），以适应不同算法的需求。该数据集适用于桌面级灵巧操作任务的基准测试与模型泛化性研究。

背景与挑战

背景概述

该数据集名为open-lower-drawer-emp-r1_val，由研究人员借助LeRobot开源框架创建，专注于机器人操纵领域中的抽屉开启任务。数据集以SO-100型随动机械臂为载体，通过记录六维关节角度（肩部、肘部、腕部及夹爪）与双视角视觉观测（分辨率480×640，帧率30fps），构建了包含4个完整回合、总计3391帧的示范数据。其核心研究问题在于模拟真实环境下机器人学习从视觉输入到精细动作的映射关系，为模仿学习与行为克隆提供高质量的基准数据。数据集采用结构化的parquet归档格式，兼容LeRobot生态，旨在推动低成本机器人平台上的自主技能获取研究。尽管规模有限，但其构建方法反映了将标准机械臂与低成本传感器结合于日常操作任务的趋势，对促进可泛化的机器人操纵策略开发具有示范意义。

当前挑战

该数据集所应对的首要领域挑战在于解决非结构化环境中机器人对可变形或铰接物体（如抽屉）的精确交互问题，此类任务要求机器人从高维视觉观测中提取关键线索并输出连续动作序列，对策略的鲁棒性与泛化性提出严苛要求。构建过程中面临的核心困难包括：数据采集依赖遥操作或动觉示教，机械臂的物理反馈与人类演示的精度匹配存在固有延迟与误差；低成本传感器（如单一RGB摄像头）受光照、遮挡及视角变化影响，导致视觉特征维度冗余且噪声水平较高；此外，仅含4个回合的有限示范样本易使模型陷入过拟合，难以覆盖抽屉开合角度、速度及力度的自然变异，从而制约策略在未见场景中的迁移能力。

常用场景

经典使用场景

在机器人学习与操控领域，open-lower-drawer-emp-r1_val数据集凭借其精细化的动作序列与多模态观测数据，成为训练和评估策略模型从视觉输入到关节角度映射能力的经典资源。研究人员常利用该数据集进行模仿学习实验，尤其是针对抽屉开启这类非刚体交互任务。数据集提供了6维关节位置指令与来自双摄像头的同步视频流，使得利用行为克隆或逆强化学习方法复制技能成为可能。其结构化的episode划分与30 FPS的高采样率，保证了时间连续性和动作平滑性，为验证算法在真实机器人平台上的可迁移性奠定了数据基础。

衍生相关工作

围绕open-lower-drawer-emp-r1_val数据集的特性，已衍生出一系列值得关注的学术工作。一方面，研究者基于其多视角视频数据开展了视觉预训练模型（如VideoMAE）在机器人策略学习中的微调研究，验证了时空表征对低层级操控任务的增益。另一方面，该数据集的动作连续性与高采样率催生了利用扩散策略进行动作轨迹生成的开创性探索。此外，部分工作以此数据集为基线，比较了单步预测与显式规划方法在长时域任务上的性能差异，并推动了可解释性动作分解模块的发展，为构建更加可靠和透明的机器人决策系统提供了有力支撑。

数据集最近研究