SO101_cube_test

Hugging Face2025-08-05 更新2025-08-06 收录

下载链接：

https://huggingface.co/datasets/zacapa/SO101_cube_test

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个机器人技术相关的数据集，包含了50个剧集，共32997帧，1个任务，100个视频，所有数据被分为1个块，每个块包含1000帧。数据集的帧率为30fps，并提供了一种划分方式，即训练集为全部数据。数据集中的特征包括机器人的动作和状态，以及手腕和俯视视角的图像信息。

创建时间：

2025-08-05

原始信息汇总

数据集概述

基本信息

名称: SO101_cube_test
许可证: Apache-2.0
任务类别: 机器人学 (robotics)
标签: LeRobot, chess, so101, tutorial

数据集描述

创建工具: LeRobot
主页: [未提供]
论文: [未提供]

数据集结构

数据文件格式: Parquet
配置名称: default
数据文件路径: data/*/*.parquet

元数据信息

代码库版本: v2.1
机器人类型: so101_follower
总集数: 50
总帧数: 32997
总任务数: 1
总视频数: 100
总块数: 1
块大小: 1000
帧率 (FPS): 30
分割: 训练集 (0:50)

数据路径

数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

动作 (action)
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
观测状态 (observation.state)
- 数据类型: float32
- 形状: [6]
- 名称: 同动作特征
观测图像 - 手腕 (observation.images.wrist)
- 数据类型: video
- 形状: [480, 640, 3]
- 视频信息: 高度480, 宽度640, 编码av1, 像素格式yuv420p, 非深度图, 帧率30, 通道3, 无音频
观测图像 - 俯视 (observation.images.overhead)
- 数据类型: video
- 形状: [480, 640, 3]
- 视频信息: 同手腕图像
其他特征
- 时间戳 (timestamp): float32, 形状[1]
- 帧索引 (frame_index): int64, 形状[1]
- 集索引 (episode_index): int64, 形状[1]
- 索引 (index): int64, 形状[1]
- 任务索引 (task_index): int64, 形状[1]

引用

BibTeX: [未提供]

搜集汇总

数据集介绍

构建方式

在机器人技术领域，SO101_cube_test数据集通过LeRobot平台精心构建，采用先进的实验设备和数据采集技术。该数据集包含50个完整的情节，总计32997帧数据，以30fps的帧率记录。数据以分块形式存储，每个分块包含1000帧，采用parquet格式高效压缩。通过多角度视觉传感器（手腕摄像头和顶部摄像头）同步采集机器人的状态信息和动作数据，确保数据的全面性和时效性。

特点

SO101_cube_test数据集以其多维度的数据特征脱颖而出，不仅包含6自由度机械臂的关节位置信息，还整合了双视角的高清视频流。数据采用严格的标准化处理，动作和状态观测值均为float32类型，视频数据采用AV1编码。特别值得注意的是，该数据集提供了精确的时间戳和帧索引，为时序分析和动作建模提供了坚实基础。视频数据的分辨率为480×640，色彩通道完整保留，为计算机视觉任务提供了丰富素材。

使用方法

该数据集适用于机器人学习领域的各类研究，用户可通过HuggingFace平台直接获取parquet格式的数据文件。研究人员可利用提供的帧索引和情节编号进行数据切片，实现特定片段的快速定位。视频数据与状态数据严格同步，便于开发基于视觉的强化学习算法。数据集采用Apache-2.0许可协议，允许用户自由地进行修改和再分发，但需遵守相应的引用规范。

背景与挑战

背景概述

SO101_cube_test数据集由HuggingFace的LeRobot项目团队构建，专注于机器人控制与视觉感知领域的研究。该数据集以so101_follower型机器人为实验平台，通过多模态数据采集方式记录了机械臂关节运动参数与视觉观测信息，包含50个完整操作序列共计32997帧数据。其核心价值在于为机器人模仿学习与行为克隆算法提供了高质量的时空对齐多传感器数据，特别是腕部与俯视双视角视频流与六自由度关节状态的同步记录，填补了复杂操作任务中多模态基准数据的空白。

当前挑战

该数据集面临的领域挑战主要体现在机器人操作任务的时空连续性建模，需解决高维视觉观测与低维动作空间的映射难题。构建过程中的技术挑战包括：多传感器数据的时间戳精确同步、大容量视频数据的高效压缩存储（采用AV1编解码）、以及机械臂运动轨迹与视觉观测的跨模态对齐。数据标注的稀疏性也限制了监督学习方法的性能上限，如何从有限的任务演示中提取可泛化的操作策略成为关键研究难点。

常用场景

经典使用场景

在机器人控制与视觉感知领域，SO101_cube_test数据集为研究者提供了一个标准化的测试平台。该数据集通过记录机械臂执行任务时的关节位置、视觉图像及时间戳信息，为机器人动作规划与视觉伺服控制算法的开发与验证提供了丰富的数据支持。其多模态数据特性尤其适合用于端到端机器人学习任务的研究。

衍生相关工作

基于该数据集特性，已有研究团队开发了新型的模仿学习框架，提升了机械臂动作规划的准确性。部分工作利用其多视角视觉数据，提出了改进的3D物体姿态估计方法。数据集还被用于验证基于Transformer的机器人控制算法的泛化能力。

数据集最近研究