five

so101_bimanual_total_0

收藏
Hugging Face2026-05-14 更新2026-05-14 收录
下载链接:
https://huggingface.co/datasets/aaawangge/so101_bimanual_total_0
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个专门用于双手机器人(bi_so_follower)模仿学习或强化学习任务的数据集。它包含590个episodes,总计455,024帧数据,覆盖7个不同任务。数据以parquet文件格式存储,总数据量约100MB,视频文件约200MB,帧率为30fps。数据集特征包括:12维的动作向量(控制左右机械臂的肩部、肘部、腕部和夹爪位置)、12维的观测状态向量(与动作相同)、四个不同视角的图像观测(左左、左上、右前、右右),每个图像分辨率为480x640像素、3通道RGB格式,使用AV1编解码器。此外,还包含补充信息如策略动作、干预标志、状态、收集器策略ID、时间戳、帧索引、episode索引、任务索引等。数据集仅包含训练集,适用于机器人控制、行为克隆或策略学习研究。

This dataset is a robotics dataset specifically designed for imitation learning or reinforcement learning tasks with a bi-manual robot (bi_so_follower). It contains 590 episodes, totaling 455,024 frames of data, covering 7 different tasks. The data is stored in parquet file format, with a total data size of approximately 100MB and video files of about 200MB, at a frame rate of 30fps. Dataset features include: a 12-dimensional action vector (controlling the shoulder, elbow, wrist, and gripper positions of both robotic arms), a 12-dimensional observation state vector (same as the action), image observations from four different perspectives (left-left, left-up, right-front, right-right), each with a resolution of 480x640 pixels, 3-channel RGB format, using the AV1 codec. Additionally, it includes supplementary information such as policy actions, intervention flags, states, collector policy IDs, timestamps, frame indices, episode indices, task indices, etc. The dataset only contains a training set and is suitable for robotics control, behavior cloning, or policy learning research.
提供机构:
aaawangge
创建时间:
2026-05-14
原始信息汇总

数据集总览

  • 数据集名称: so101_bimanual_total_0
  • 许可证: Apache-2.0
  • 任务类别: 机器人学 (robotics)
  • 标签: LeRobot
  • 创建工具: 使用 LeRobot 创建

数据集规模

指标 数值
总片段数 (total_episodes) 590
总帧数 (total_frames) 455,024
总任务数 (total_tasks) 7
帧率 (fps) 30
数据文件大小 (data_files_size_in_mb) 100 MB
视频文件大小 (video_files_size_in_mb) 200 MB
分块大小 (chunks_size) 1000

数据划分

  • 训练集 (train): 片段 0 到 589,共 590 个片段

机器人类型

  • 机器人型号: bi_so_follower

数据特征

动作 (action)

  • 数据类型: float32
  • 形状: [12]
  • 包含: 左右臂各6个自由度位置 (肩部pan/lift、肘部flex、腕部flex/roll、夹爪pos)

观测状态 (observation.state)

  • 数据类型: float32
  • 形状: [12]
  • 内容: 同动作,包含12维机器人关节位置信息

观测图像 (observation.images)

数据集包含4个摄像头视角,每个视角的视频参数相同:

  • 分辨率: 480×640 像素
  • 通道数: 3 (RGB)
  • 视频编码: av1
  • 像素格式: yuv420p
  • 帧率: 30 fps
  • 是否为深度图: 否

具体摄像头视角:

  1. left_left: 左侧左视角
  2. left_top: 左侧顶部视角
  3. right_front: 右侧前方视角
  4. right_right: 右侧右视角

补充信息 (complementary_info)

字段 数据类型 形状 说明
complementary_info.policy_action float32 [12] 与动作相同结构的策略动作
complementary_info.is_intervention float32 [1] 是否干预标记
complementary_info.state float32 [1] 状态标识
complementary_info.collector_policy_id string [1] 采集策略ID

其他特征

特征 数据类型 形状 说明
timestamp float32 [1] 时间戳
frame_index int64 [1] 帧索引
episode_index int64 [1] 片段索引
index int64 [1] 全局索引
task_index int64 [1] 任务索引

数据存储结构

  • 数据路径格式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频路径格式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
  • 配置文件: default 配置,数据文件匹配 data/*/*.parquet
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作