so101_test_03

Hugging Face2026-03-07 更新2026-03-08 收录

下载链接：

https://huggingface.co/datasets/youto22/so101_test_03

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，专注于机器人技术领域。数据集包含155个总片段，119442帧数据，总数据文件大小为100MB，视频文件大小为200MB，帧率为30fps。数据以parquet格式存储，视频以mp4格式存储。数据集的特征字段包括动作（action）、观察状态（observation.state）、前视图像（observation.images.front）、手腕图像（observation.images.wrist）、时间戳（timestamp）、帧索引（frame_index）、片段索引（episode_index）、索引（index）和任务索引（task_index）。动作和观察状态字段包含6个浮点型数据，分别对应机器人的各个关节位置。前视和手腕图像的分辨率为480x640，3通道，视频编码为av1。数据集适用于机器人控制、行为模仿等任务。

创建时间：

2026-03-06

原始信息汇总

数据集概述

基本信息

数据集名称: youto22/so101_test_03
许可证: Apache-2.0
任务类别: 机器人学
创建工具: LeRobot (https://github.com/huggingface/lerobot)

数据集规模

总情节数: 155
总帧数: 119,442
总任务数: 1
数据文件大小: 100 MB
视频文件大小: 200 MB
帧率: 30 FPS
数据块大小: 1000

数据划分

训练集: 包含全部155个情节。

数据结构与特征

数据以Parquet文件格式存储，视频以MP4格式存储。

数据特征详情

动作: 包含6个浮点型关节位置指令。
- 特征: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
- 数据类型: float32
- 形状: [6]
观测状态: 包含6个浮点型关节位置状态。
- 特征: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
- 数据类型: float32
- 形状: [6]
前视图像观测: 彩色视频数据。
- 数据类型: video
- 形状: [480, 640, 3] (高度, 宽度, 通道)
- 视频信息:
  - 编码: av1
  - 像素格式: yuv420p
  - 非深度图
  - 帧率: 30
  - 无音频
腕部图像观测: 彩色视频数据。
- 数据类型: video
- 形状: [480, 640, 3] (高度, 宽度, 通道)
- 视频信息:
  - 编码: av1
  - 像素格式: yuv420p
  - 非深度图
  - 帧率: 30
  - 无音频
元数据:
- 时间戳 (timestamp): 数据类型 float32，形状 [1]
- 帧索引 (frame_index): 数据类型 int64，形状 [1]
- 情节索引 (episode_index): 数据类型 int64，形状 [1]
- 索引 (index): 数据类型 int64，形状 [1]
- 任务索引 (task_index): 数据类型 int64，形状 [1]

文件路径模式

数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

代码库版本

版本: v3.0

机器人类型

类型: so_follower

引用信息

主页: 信息缺失
论文: 信息缺失
BibTeX引用: 信息缺失

搜集汇总

数据集介绍

构建方式

在机器人学习领域，高质量的数据集是推动算法发展的基石。so101_test_03数据集依托LeRobot开源框架构建，通过真实机器人平台采集了155个完整任务片段，总计包含119,442帧数据。数据以分块形式组织，每个块约1000帧，并以Parquet格式高效存储，确保了大规模时序数据的管理与读取效率。其构建过程系统记录了机器人关节状态、动作指令以及多视角视觉信息，为模仿学习与强化学习研究提供了结构化的现实世界交互轨迹。

使用方法

对于研究者而言，该数据集可直接用于训练与评估机器人策略模型。用户可通过标准数据加载流程访问Parquet文件，并依据元数据中定义的路径模式读取对应的视频文件。数据集已预设训练分割，涵盖全部155个片段，适用于端到端的行为克隆或时空预测模型训练。在实际应用中，可联合利用状态观测、图像序列及动作标签，开发感知与控制一体化的算法，亦可通过时间戳与帧索引进行精细的时序对齐分析，以验证算法在连续决策任务中的有效性。

背景与挑战

背景概述

在机器人学习领域，模仿学习与强化学习的发展亟需高质量、大规模的真实世界交互数据集作为支撑。so101_test_03数据集应运而生，它由LeRobot项目团队创建，旨在为机器人操作任务提供丰富的多模态演示数据。该数据集专注于特定机器人平台（so_follower）的轨迹记录，涵盖了关节状态、视觉观测与动作指令的同步信息，其结构设计支持端到端策略学习的训练与评估，为机器人技能获取与泛化研究奠定了数据基础。

当前挑战

该数据集致力于解决机器人模仿学习中从演示数据到可执行策略的映射难题，其核心挑战在于如何从高维视觉与状态观测中提取鲁棒且可泛化的特征表示。在构建过程中，面临多传感器数据的时间同步校准、大规模视频数据的高效压缩存储，以及在不同环境条件下保持数据一致性与质量等工程挑战。此外，数据集的规模与任务多样性仍需扩展，以支撑更复杂的长期决策与多任务学习研究。

常用场景

经典使用场景

在机器人学习领域，so101_test_03数据集以其丰富的多模态数据为机器人模仿学习提供了经典范例。该数据集记录了机器人执行任务时的关节状态、前视与腕部摄像头视频流，以及精确的时间戳信息，使得研究者能够利用这些同步的观测与动作序列，训练端到端的策略模型。通过模拟真实世界中的机械臂操作场景，该数据集常被用于验证视觉-动作映射算法的有效性，尤其是在复杂环境下的泛化能力评估中展现出重要价值。

解决学术问题

该数据集主要针对机器人学中模仿学习与强化学习的算法验证问题，提供了标准化的基准测试环境。它解决了传统研究中因数据缺失或格式不统一导致的复现困难，通过结构化存储关节位置、图像观测与动作指令，支持多任务策略的端到端训练。其意义在于促进了机器人控制算法的公平比较，推动了基于视觉的机器人操作技术在模拟到真实迁移中的进展，为学术界提供了可扩展的数据基础设施。

实际应用

在实际工业与服务业中，so101_test_03数据集能够支撑自动化装配、物品抓取与精密操作等场景的算法开发。基于该数据集训练的模型可部署于类似构型的机械臂系统，实现从视觉感知到动作执行的自主决策，降低人工编程成本。例如，在仓储物流中，机器人可学习高效分拣技巧；在医疗辅助领域，则能模拟精细的手术器械操控，提升操作的安全性与一致性。

数据集最近研究