CleanK-07/arm-b-test-v050-smoke-20260411
收藏Hugging Face2026-04-11 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/CleanK-07/arm-b-test-v050-smoke-20260411
下载链接
链接失效反馈官方服务:
资源简介:
---
license: apache-2.0
task_categories:
- robotics
tags:
- LeRobot
configs:
- config_name: default
data_files: data/*/*.parquet
---
This dataset was created using [LeRobot](https://github.com/huggingface/lerobot).
<a class="flex" href="https://huggingface.co/spaces/lerobot/visualize_dataset?path=CleanK-07/arm-b-test-v050-smoke-20260411">
<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl.svg"/>
<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl-dark.svg"/>
</a>
## Dataset Description
- **Homepage:** [More Information Needed]
- **Paper:** [More Information Needed]
- **License:** apache-2.0
## Dataset Structure
[meta/info.json](meta/info.json):
```json
{
"codebase_version": "v3.0",
"robot_type": "cleank_follower2",
"total_episodes": 1,
"total_frames": 326,
"total_tasks": 1,
"chunks_size": 1000,
"data_files_size_in_mb": 100,
"video_files_size_in_mb": 200,
"fps": 30,
"splits": {
"train": "0:1"
},
"data_path": "data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet",
"video_path": "videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4",
"features": {
"action": {
"dtype": "float32",
"names": [
"shoulder_pan.pos",
"shoulder_lift.pos",
"shoulder_roll.pos",
"elbow_flex.pos",
"wrist_roll.pos",
"wrist_flex.pos",
"grip.pos"
],
"shape": [
7
]
},
"observation.state": {
"dtype": "float32",
"names": [
"shoulder_pan.pos",
"shoulder_lift.pos",
"shoulder_roll.pos",
"elbow_flex.pos",
"wrist_roll.pos",
"wrist_flex.pos",
"grip.pos",
"shoulder_pan.vel",
"shoulder_lift.vel",
"shoulder_roll.vel",
"elbow_flex.vel",
"wrist_roll.vel",
"shoulder_pan.tor",
"shoulder_lift.tor",
"shoulder_roll.tor",
"elbow_flex.tor",
"wrist_roll.tor"
],
"shape": [
17
]
},
"observation.images.cam_wrist": {
"dtype": "video",
"shape": [
480,
640,
3
],
"names": [
"height",
"width",
"channels"
],
"info": {
"video.height": 480,
"video.width": 640,
"video.codec": "av1",
"video.pix_fmt": "yuv420p",
"video.is_depth_map": false,
"video.fps": 30,
"video.channels": 3,
"has_audio": false
}
},
"observation.images.cam_overhead": {
"dtype": "video",
"shape": [
480,
640,
3
],
"names": [
"height",
"width",
"channels"
],
"info": {
"video.height": 480,
"video.width": 640,
"video.codec": "av1",
"video.pix_fmt": "yuv420p",
"video.is_depth_map": false,
"video.fps": 30,
"video.channels": 3,
"has_audio": false
}
},
"timestamp": {
"dtype": "float32",
"shape": [
1
],
"names": null
},
"frame_index": {
"dtype": "int64",
"shape": [
1
],
"names": null
},
"episode_index": {
"dtype": "int64",
"shape": [
1
],
"names": null
},
"index": {
"dtype": "int64",
"shape": [
1
],
"names": null
},
"task_index": {
"dtype": "int64",
"shape": [
1
],
"names": null
}
}
}
```
## Citation
**BibTeX:**
```bibtex
[More Information Needed]
```
提供机构:
CleanK-07
搜集汇总
数据集介绍

构建方式
在机器人操作领域,数据集的构建往往依赖于真实的硬件交互与系统化记录。arm-b-test-v050-smoke-20260411数据集通过LeRobot平台生成,采用cleank_follower2型机器人进行数据采集。该数据集以30帧每秒的速率录制了单次任务执行过程,涵盖326个连续帧,数据以分块形式存储于Parquet文件中,并同步保存了腕部与顶部摄像头的视频流,确保了动作序列与视觉观测的时空对齐。
特点
该数据集的特点在于其多维度的观测与动作表示。观测部分不仅包含机器人七个关节的位置、速度与力矩共17维状态向量,还整合了双视角RGB视频流,分辨率均为640x480,提供了丰富的环境上下文。动作空间则对应七维关节位置控制指令。数据结构采用分块存储策略,支持高效的数据加载与处理,适用于模仿学习与强化学习算法的训练与验证。
使用方法
使用该数据集时,研究者可通过LeRobot提供的可视化工具直观浏览数据内容。数据文件按chunk索引组织,可通过标准数据加载库读取Parquet格式文件,提取动作、状态、图像及时间戳等特征。由于数据集仅包含单一训练分割,适用于算法开发与原型测试,用户可依据帧索引与任务索引构建训练样本,结合视频文件进行多模态学习模型的训练。
背景与挑战
背景概述
在机器人学习领域,高质量、多模态数据集是推动模仿学习与强化学习算法发展的关键基石。arm-b-test-v050-smoke-20260411数据集由LeRobot项目团队于2024年创建,旨在为机械臂操作任务提供详尽的演示数据。该数据集聚焦于解决机器人灵巧操作中的状态估计与动作生成问题,通过整合关节状态、力矩信息及多视角视觉观测,为研究者构建端到端控制策略提供了丰富的训练资源。其采用Apache 2.0开源协议,促进了学术与工业界的协作创新,对提升机器人在非结构化环境中的自主行为能力具有重要参考价值。
当前挑战
该数据集致力于应对机器人模仿学习中从高维感知到连续动作映射的核心难题,其挑战在于如何从有限的演示样本中泛化出鲁棒且精确的控制策略。在构建过程中,面临多传感器数据的时间同步与标定复杂性,需确保关节编码器、力矩传感器及双目视觉系统采集信息的一致性。此外,大规模视频数据的压缩存储与高效检索,以及机械臂动作在动态环境下的可重复性与安全性验证,均是数据采集与处理环节需要克服的技术障碍。
常用场景
经典使用场景
在机器人学领域,数据集arm-b-test-v050-smoke-20260411为机械臂控制算法的验证与测试提供了关键资源。该数据集记录了清洁机器人(cleank_follower2)在单一任务中的完整操作轨迹,包含关节位置、速度、扭矩等多维状态信息,以及来自腕部和顶部摄像头的视觉数据。这些数据通常用于训练和评估模仿学习或强化学习模型,使算法能够从人类演示中学习精细的抓取和操作策略,从而在仿真或真实环境中复现复杂的机器人动作序列。
解决学术问题
该数据集直接应对机器人学中样本效率低下和泛化能力不足的核心挑战。通过提供高质量、多模态的真实世界交互数据,它支持研究者开发数据驱动的控制策略,减少对昂贵试错或精确物理仿真的依赖。具体而言,数据集有助于解决从视觉感知到关节动作的端到端映射问题,推动模仿学习在复杂动态环境中的实际应用,并为验证新算法在真实机器人平台上的性能提供了基准,加速了从理论到实践的转化进程。
衍生相关工作
围绕此类机器人数据集,学术界已衍生出多项经典研究工作。例如,基于LeRobot框架的模仿学习算法开发,利用类似的多模态数据流训练策略网络,实现了从视觉观察到关节控制的直接映射。相关工作还包括在离线强化学习领域,利用此类演示数据学习保守策略以避免危险动作;以及在元学习方向,利用少量任务数据快速适应新操作场景。这些工作共同推动了数据驱动机器人学的发展,为构建通用机器人操作技能库奠定了基础。
以上内容由遇见数据集搜集并总结生成



