so101_test

Hugging Face2025-08-05 更新2025-08-06 收录

下载链接：

https://huggingface.co/datasets/qiujun/so101_test

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个机器人数据集，包含2个总剧集，1782个总帧数，1个任务，4个视频和1个数据块。数据集以Parquet文件格式存储，并包含有关机器人动作、状态和图像的特征。每个剧集包含1000个数据点，帧率为30fps。数据集目前只有一个训练集分割。

创建时间：

2025-08-01

原始信息汇总

数据集概述

基本信息

许可证: apache-2.0
任务类别: 机器人学 (robotics)
标签: LeRobot, so101, tutorial
配置:
- 默认配置 (default)
- 数据文件: data//.parquet

数据集描述

创建工具: LeRobot
主页: [More Information Needed]
论文: [More Information Needed]

数据集结构

代码库版本: v2.1
机器人类型: so101
总集数: 2
总帧数: 1782
总任务数: 1
总视频数: 4
总块数: 1
块大小: 1000
帧率: 30 fps
数据分割:
- 训练集: 0:2

数据路径

数据文件路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频文件路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

动作 (action):
- 数据类型: float32
- 形状: [6]
- 名称: main_shoulder_pan, main_shoulder_lift, main_elbow_flex, main_wrist_flex, main_wrist_roll, main_gripper
观测状态 (observation.state):
- 数据类型: float32
- 形状: [6]
- 名称: 同动作特征
观测图像 (observation.images.laptop 和 observation.images.phone):
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 视频信息:
  - 高度: 480
  - 宽度: 640
  - 编解码器: av1
  - 像素格式: yuv420p
  - 是否为深度图: false
  - 帧率: 30 fps
  - 通道数: 3
  - 是否有音频: false
时间戳 (timestamp):
- 数据类型: float32
- 形状: [1]
帧索引 (frame_index):
- 数据类型: int64
- 形状: [1]
集索引 (episode_index):
- 数据类型: int64
- 形状: [1]
索引 (index):
- 数据类型: int64
- 形状: [1]
任务索引 (task_index):
- 数据类型: int64
- 形状: [1]

引用

BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人技术领域，数据集的质量直接影响模型性能。so101_test数据集采用LeRobot框架构建，通过记录真实机器人操作任务生成多模态数据。数据以分块形式存储于Parquet文件中，包含2个完整操作片段，共计1782帧图像与对应动作指令，采样频率为30Hz，确保了时序数据的高精度对齐与高效存取。

特点

该数据集显著特点在于其多源异构数据融合能力，同步提供六自由度机械臂动作指令、关节状态观测及双视角视觉输入（笔记本电脑与手机拍摄视频）。所有数据均以标准化张量格式存储，动作与状态维度一致且命名规范，视频数据采用AV1编码并标注分辨率、帧率及色彩通道信息，支持端到端的机器人模仿学习与感知控制研究。

使用方法

研究者可通过加载Parquet文件直接获取结构化数据流，利用帧索引与时间戳实现多模态数据同步。视频数据可通过指定路径解码，动作与观测字段可直接用于策略网络训练。数据集默认划分为训练集，适用于行为克隆、强化学习等任务，需注意根据任务需求预处理图像分辨率或动作归一化。

背景与挑战

背景概述

机器人操作数据集so101_test由HuggingFace的LeRobot项目团队构建，专注于机械臂控制与多模态感知研究。该数据集采用Apache 2.0开源协议，通过六自由度机械臂的关节运动数据与双视角视觉观测，记录了执行特定任务的完整操作序列。其设计初衷在于为模仿学习与强化学习算法提供高质量、多模态的训练资源，推动机器人泛化能力与自主决策水平的发展。数据集采用标准化parquet格式存储，确保了数据的高效访问与跨平台兼容性。

当前挑战

该数据集旨在解决机器人操作任务中的动作规划与视觉-运动协同问题，其核心挑战包括高维连续动作空间的精确建模、多视角视觉信息的时序对齐，以及真实物理环境中的动态适应性。在构建过程中，面临传感器同步精度保障、大规模视频数据压缩存储，以及机械臂状态与图像帧的严格时序匹配等技术难题，需通过高效的编码方案与数据管道优化实现多模态数据的无缝集成。

常用场景

经典使用场景

在机器人学习领域，so101_test数据集作为LeRobot框架的示范性数据，主要用于机器人动作模仿与状态转移研究。该数据集通过记录六自由度机械臂的关节角度变化与多视角视觉观测，为模仿学习算法提供了时空对齐的多模态训练样本。研究者可基于该数据集构建从视觉感知到动作执行的端到端映射模型，验证算法在真实机器人控制任务中的泛化能力。

衍生相关工作

该数据集衍生出多项机器人学习领域的创新研究，包括基于时空注意力的多视角动作预测模型、跨模态表示学习框架等。研究者利用其提供的精确动作标注开发了分层强化学习算法，实现了从视觉输入到连续控制策略的端到端学习。这些工作进一步拓展到多任务学习领域，催生了适用于不同机器人平台的通用模仿学习范式。

数据集最近研究