so101_rgb_cube_300_task3_part_5_of_6

Hugging Face2025-11-29 更新2025-11-30 收录

下载链接：

https://huggingface.co/datasets/avanturist/so101_rgb_cube_300_task3_part_5_of_6

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集与机器人学相关，包含51个剧集共17375帧，专注于1个任务。数据集被组织为具有多个特征的结构，包括动作、观测状态、顶部图像、手腕图像等。数据仅分为训练集。该数据集使用LeRobot创建，数据文件为Parquet格式，视频文件为MP4格式。数据集遵循Apache-2.0许可。

创建时间：

2025-11-29

原始信息汇总

数据集概述

基本信息

许可证: Apache-2.0
任务类别: 机器人技术
标签: LeRobot
代码库版本: v3.0
机器人类型: so101_follower

数据集规模

总情节数: 51
总帧数: 17375
总任务数: 1
数据分块大小: 1000
数据文件大小: 100 MB
视频文件大小: 200 MB
帧率: 30 FPS

数据划分

训练集: 0-51

数据结构

数据文件路径

data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet

视频文件路径

videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征描述

动作特征

数据类型: float32
维度: [6]
关节位置:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测状态

数据类型: float32
维度: [6]
关节位置:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

图像观测

顶部摄像头

数据类型: 视频
分辨率: 480×640×3
视频编码: AV1
像素格式: yuv420p
帧率: 30 FPS
音频: 无

腕部摄像头

数据类型: 视频
分辨率: 480×640×3
视频编码: AV1
像素格式: yuv420p
帧率: 30 FPS
音频: 无

索引特征

时间戳: float32 [1]
帧索引: int64 [1]
情节索引: int64 [1]
索引: int64 [1]
任务索引: int64 [1]

创建信息

创建工具: LeRobot (https://github.com/huggingface/lerobot)

引用信息

论文: 待补充
主页: 待补充
BibTeX: 待补充

搜集汇总

数据集介绍

构建方式

在机器人技术领域，数据采集的精确性与系统性至关重要。该数据集基于LeRobot平台构建，通过so101_follower型机器人执行单一任务，记录了51个完整操作序列，共计17375帧数据。数据以分块形式存储于Parquet文件中，每块包含1000帧，确保了高效的数据管理与访问。采集过程中，机器人关节位置与图像信息被同步记录，为后续分析提供了坚实基础。

特点

该数据集在机器人操作研究中展现出多模态特性。其核心特征包括六维关节位置的动作与状态数据，以及来自顶部和腕部摄像头的双视角RGB视频流，分辨率均为640x480像素。数据以30帧每秒的速率采集，视频采用AV1编码，兼顾了视觉质量与存储效率。数据集结构清晰，通过时间戳、帧索引与任务索引等元数据，支持精细的时序分析与任务建模。

使用方法

针对机器人学习任务的应用需求，该数据集提供了标准化的调用接口。用户可通过解析Parquet格式的数据文件获取动作、观测状态及图像流信息。训练集涵盖全部51个操作序列，支持端到端的策略学习或行为克隆研究。视频数据可通过指定路径直接加载，其分层存储结构便于分布式处理。该设计使得数据集能够无缝集成于现代机器人学习框架，加速算法开发与验证进程。

背景与挑战

背景概述

机器人操作任务数据集作为强化学习研究的重要载体，其构建直接关系到智能体在真实环境中的决策能力。so101_rgb_cube_300_task3_part_5_of_6数据集由HuggingFace团队基于LeRobot开源框架开发，聚焦于多视角视觉感知与机械臂关节控制任务。该数据集通过顶部与腕部双摄像头采集480×640分辨率的RGB视频流，同步记录六自由度机械臂的关节位置与夹持器状态，构建了包含51个完整交互序列、17375帧样本的时序数据集，为机器人模仿学习与策略泛化研究提供了结构化数据支持。

当前挑战

机器人操作领域需解决高维状态空间下的动作映射难题，该数据集通过多模态观测数据应对机械臂轨迹规划中的动态环境适应挑战。构建过程中面临传感器同步精度控制与大规模视频数据压缩存储的技术瓶颈，需平衡AV1编码效率与视觉特征保真度。同时，关节动作序列与视觉观测的时间对齐要求微秒级精度，而跨视角图像的空间标定误差可能影响三维操作任务的策略学习效果。

常用场景

经典使用场景

在机器人操作学习领域，该数据集通过多视角视觉观测与关节动作的同步记录，为模仿学习算法提供了丰富的训练素材。其包含的顶部摄像头与腕部摄像头视频流，结合六自由度机械臂的精确位姿数据，能够有效支撑端到端策略网络的训练过程，特别适用于复杂环境下的抓取与放置任务仿真。

实际应用

在工业自动化场景中，该数据集可直接用于训练装配线分拣机械臂的视觉伺服系统。其包含的RGB立方体操作任务与实际生产环境高度契合，通过迁移学习技术可将训练模型部署至实体机器人，实现工件定位、姿态调整等精细化操作，显著提升智能制造系统的适应性。

衍生相关工作

基于该数据集的特性，已催生多项机器人学习领域的创新研究。LeRobot框架下的行为克隆算法改进、多传感器融合策略网络架构设计等工作均以其为实验基础，后续研究进一步拓展至跨任务技能迁移、元强化学习等方向，形成了完整的技术演进脉络。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集