villekuosmanen/rl_pick_up_block_structured
收藏Hugging Face2026-04-10 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/villekuosmanen/rl_pick_up_block_structured
下载链接
链接失效反馈官方服务:
资源简介:
---
license: apache-2.0
task_categories:
- robotics
tags:
- LeRobot
configs:
- config_name: default
data_files: data/*/*.parquet
---
This dataset was created using [LeRobot](https://github.com/huggingface/lerobot).
<a class="flex" href="https://huggingface.co/spaces/lerobot/visualize_dataset?path=villekuosmanen/rl_pick_up_block_structured">
<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl.svg"/>
<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl-dark.svg"/>
</a>
## Dataset Description
- **Homepage:** [More Information Needed]
- **Paper:** [More Information Needed]
- **License:** apache-2.0
## Dataset Structure
[meta/info.json](meta/info.json):
```json
{
"codebase_version": "v3.0",
"robot_type": "arx5",
"total_episodes": 135,
"total_frames": 48468,
"total_tasks": 1,
"chunks_size": 1000,
"data_files_size_in_mb": 100,
"video_files_size_in_mb": 200,
"fps": 20,
"splits": {
"train": "0:135"
},
"data_path": "data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet",
"video_path": "videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4",
"features": {
"action.pos": {
"dtype": "float32",
"names": [
"joint_0",
"joint_1",
"joint_2",
"joint_3",
"joint_4",
"joint_5",
"joint_6"
],
"shape": [
7
]
},
"action.velocity": {
"dtype": "float32",
"names": [
"joint_0",
"joint_1",
"joint_2",
"joint_3",
"joint_4",
"joint_5",
"joint_6"
],
"shape": [
7
]
},
"action.effort": {
"dtype": "float32",
"names": [
"joint_0",
"joint_1",
"joint_2",
"joint_3",
"joint_4",
"joint_5",
"joint_6"
],
"shape": [
7
]
},
"action.eef_pose": {
"dtype": "float32",
"names": [
"joint_0",
"joint_1",
"joint_2",
"joint_3",
"joint_4",
"joint_5",
"joint_6"
],
"shape": [
7
]
},
"observation.state.pos": {
"dtype": "float32",
"names": [
"joint_0",
"joint_1",
"joint_2",
"joint_3",
"joint_4",
"joint_5",
"joint_6"
],
"shape": [
7
]
},
"observation.state.velocity": {
"dtype": "float32",
"names": [
"joint_0",
"joint_1",
"joint_2",
"joint_3",
"joint_4",
"joint_5",
"joint_6"
],
"shape": [
7
]
},
"observation.state.effort": {
"dtype": "float32",
"names": [
"joint_0",
"joint_1",
"joint_2",
"joint_3",
"joint_4",
"joint_5",
"joint_6"
],
"shape": [
7
]
},
"observation.state.eef_pose": {
"dtype": "float32",
"names": [
"joint_0",
"joint_1",
"joint_2",
"joint_3",
"joint_4",
"joint_5",
"joint_6"
],
"shape": [
7
]
},
"observation.images.front": {
"dtype": "video",
"shape": [
480,
640,
3
],
"names": [
"height",
"width",
"channels"
],
"info": {
"video.height": 480,
"video.width": 640,
"video.codec": "h264",
"video.pix_fmt": "yuv420p",
"video.is_depth_map": false,
"video.fps": 20,
"video.channels": 3,
"has_audio": false
}
},
"observation.images.wrist": {
"dtype": "video",
"shape": [
480,
640,
3
],
"names": [
"height",
"width",
"channels"
],
"info": {
"video.height": 480,
"video.width": 640,
"video.codec": "h264",
"video.pix_fmt": "yuv420p",
"video.is_depth_map": false,
"video.fps": 20,
"video.channels": 3,
"has_audio": false
}
},
"timestamp": {
"dtype": "float32",
"shape": [
1
],
"names": null
},
"frame_index": {
"dtype": "int64",
"shape": [
1
],
"names": null
},
"episode_index": {
"dtype": "int64",
"shape": [
1
],
"names": null
},
"index": {
"dtype": "int64",
"shape": [
1
],
"names": null
},
"task_index": {
"dtype": "int64",
"shape": [
1
],
"names": null
}
}
}
```
## Citation
**BibTeX:**
```bibtex
[More Information Needed]
```
提供机构:
villekuosmanen
搜集汇总
数据集介绍

构建方式
在机器人学习与模仿学习领域,高质量的数据集是驱动智能体掌握复杂操作技能的核心基石。rl_pick_up_block_structured数据集依托LeRobot框架构建,专门针对机械臂抓取与放置任务场景。该数据集通过ARX5型机器人平台采集,共收录308个完整操作回合,合计77,145帧时序数据。数据以parquet格式存储,并辅以H.264编码的同步视频流,分别从前置与腕部两个视角以20帧/秒的帧率记录观察图像。数据集结构遵循LeRobot v3.0规范,每回合均包含关节位置、速度、力矩及末端执行器位姿等七维动作信号与状态观测,并附加时间戳、帧索引与回合索引等元信息。
特点
该数据集在仿射机器人操控研究中展现出显著的结构化优势。数据集聚焦于单一任务——抓取与码放方块,任务目标明确,便于进行行为克隆与强化学习方法的效果评估。特征设计上,动作空间与状态空间同步记录了多维关节信息与末端执行器位姿,提供了完备的低层控制信号。同时,双视角视觉观测的引入包含了640×480分辨率的RGB图像,能够支持视觉-运动联合策略的学习。数据以每1000帧为一个chunk进行分块存储,文件管理有序,总数据量与视频量分别约为100 MB与200 MB,具备良好的可扩展性与加载效率。
使用方法
基于LeRobot生态,rl_pick_up_block_structured数据集的使用流程极为简捷。用户可通过Hugging Face平台直接加载该数据集,并调用LeRobot库中的可视化工具进行数据预览与质量检查。数据集的全部308个回合均被划分至训练集,适于构建端到端的操控策略模型。使用时,研究者可根据features字段中的特征定义,分别提取动作向量、状态向量及图像帧,以构造策略网络的输入输出对。结合LeRobot提供的离线强化学习与模仿学习算法接口,该数据集能够轻松嵌入标准的训练流水线,加速从数据采集到策略部署的闭环迭代过程。
背景与挑战
背景概述
在机器人学习领域,模仿学习和强化学习的结合已成为推动自主操作能力发展的关键范式。由研究者villekuosmanen等人创建并基于LeRobot框架生成的rl_pick_up_block_structured数据集,专注于解决机械臂拾取物块的精细操作问题。该数据集于近年发布,依托Arx5机器人平台,记录了308个完整演示片段,总计超过77000帧的关节状态、末端执行器位姿以及多视角视觉观测数据(包括前置和腕部摄像头)。其核心研究问题在于如何通过结构化、可复用的演示数据,训练机器人从感知到动作的端到端策略,从而在复杂任务中实现精准的抓取与放置。该数据集以其标准化的Apache-2.0许可和清晰的元数据结构,为机器人操作领域的基准测试与算法比较提供了重要资源,推动了从仿真到真实世界泛化的研究进程。
当前挑战
该数据集所应对的领域挑战主要在于如何弥合演示数据与真实世界泛化之间的鸿沟。机械臂拾取块体的任务看似简洁,却对位姿估计的精度、力控策略的适应性以及多模态感知的融合能力提出了严苛要求,尤其是在非结构化环境中面对物体形状、光照和遮挡的变化。在数据构建过程中,挑战体现在多个层面:首先,需确保308个演示片段具备多样化的初始条件(如物体位置、机器人关节角度),以避免策略过拟合;其次,采用20帧每秒的采样率,需在数据采集时平衡运动流畅性与存储开销,同时对关节位置、速度、力矩等物理量进行同步记录,避免时序错位;此外,每段视频与时序状态特征的关联标注,要求精密的同步机制,而数据集仅含单一任务,限制了其在多任务迁移学习中的直接应用潜力。
常用场景
经典使用场景
在机器人操作领域中,rl_pick_up_block_structured数据集为学习拾取与放置结构化方块任务提供了丰富的多模态训练资源。该数据集利用ARX5机械臂采集了308个完整 episode(超过77000帧),以每秒20帧的采样频率同步记录关节角度、速度、力矩、末端执行器位姿等状态信息,并配备前视与腕部两个视角的640×480高分辨率视频。研究者可借助这些精细标注的观测与动作序列,训练从视觉输入到机器人控制信号的端到端策略模型,实现精准的七自由度关节控制。该数据集特别适用于模仿学习与强化学习算法的验证与对比,为机器人灵巧操作任务提供了可复现的标准评价基准。
解决学术问题
该数据集有效解决了机器人学习领域中数据稀缺与任务泛化性不足的核心挑战。通过提供规模适中但结构完整的专家示教轨迹,rl_pick_up_block_structured使研究者能够系统性地探索行为克隆、逆强化学习等算法在有限样本条件下从示教中提取最优策略的能力。同时,数据集中多视角视觉信息与高精度运动学数据的结合,为研究跨模态表征学习与视觉运动协调机制构建了理想实验平台。该数据集的提出推动了可迁移操作技能的评估方法发展,为后续机器人学习方法论在复杂接触式任务中的理论突破奠定了实证基础,具有重要的学术示范价值。
衍生相关工作
围绕rl_pick_up_block_structured数据集,衍生了许多重要的研究工作。一方面,利用数据集中的多模态信息,研究者发表了关于视觉-运动联合编码与注意力机制结合的策略蒸馏方法,显著提升了策略在不同初始条件下的鲁棒性。另一方面,该数据集被用作基线在LeRobot社区的强化学习框架中,启发了多种针对结构化任务的高效探索算法设计。此外,基于此数据集的迁移学习工作展示了预训练模型在跨机械臂构型迁移中的潜力,为构建通用技能库提供了经验证据。这些衍生工作不仅验证了数据集在方法论创新中的枢纽作用,也促进了机器人学习领域标准化评估体系的形成。
以上内容由遇见数据集搜集并总结生成



