so101_test

Hugging Face2026-02-27 更新2026-02-28 收录

下载链接：

https://huggingface.co/datasets/lepao/so101_test

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集使用LeRobot代码库创建，专为机器人学任务设计。数据集包含51个 episodes，总计22,437帧数据，存储为parquet格式文件，并配有相应的视频文件（总大小约300MB）。数据结构包括动作（6个关节位置）和观察数据（状态和两个视角的视频观察，分辨率为360x640）。视频数据以30fps录制，采用AV1编码。数据集适用于机器人控制、行为克隆等任务，但具体应用背景和目的未明确说明。数据采用Apache 2.0许可证。

创建时间：

2026-02-25

原始信息汇总

数据集概述

基本信息

数据集名称: so101_test
创建工具: LeRobot (https://github.com/huggingface/lerobot)
许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot

数据集结构

配置名称: default
数据文件: data//.parquet
总任务数: 1
总情节数: 100
总帧数: 44187
数据块大小: 1000
帧率: 30 FPS
数据文件大小: 100 MB
视频文件大小: 200 MB
数据分割: 训练集 (0:100)

数据特征

动作

数据类型: float32
形状: [6]
特征名:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测状态

数据类型: float32
形状: [6]
特征名:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测图像 (手眼相机)

数据类型: video
形状: [360, 640, 3]
特征名: height, width, channels
视频信息:
- 高度: 360
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 包含音频: false

观测图像 (固定相机)

数据类型: video
形状: [360, 640, 3]
特征名: height, width, channels
视频信息:
- 高度: 360
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 包含音频: false

元数据

时间戳: float32, 形状 [1]
帧索引: int64, 形状 [1]
情节索引: int64, 形状 [1]
索引: int64, 形状 [1]
任务索引: int64, 形状 [1]

文件路径格式

数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

其他信息

代码库版本: v3.0
机器人类型: so_follower
主页: [More Information Needed]
论文: [More Information Needed]
引用: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人技术领域，高质量的数据集对于算法训练与验证至关重要。so101_test数据集依托LeRobot平台构建，通过记录六自由度机械臂在特定任务中的运动轨迹生成。数据采集过程涉及100个完整任务片段，共计44187帧，以30帧每秒的频率同步捕获机械臂关节状态与视觉信息。原始数据经过结构化处理，存储为Parquet格式，并辅以AV1编码的MP4视频文件，确保了数据的高效存储与读取。

特点

该数据集在机器人操作学习领域展现出显著特色，其多维数据融合机制尤为突出。数据集同时包含六维关节位置的动作指令与状态观测，并整合了手眼相机与固定视角的双路视觉流，形成多模态感知体系。数据组织采用分块存储策略，每块包含1000帧数据，既保证数据完整性又便于分布式处理。所有特征均以标准化格式呈现，动作与状态数据采用float32精度，视觉数据保持360×640分辨率，为算法开发提供了统一基准。

使用方法

针对机器人模仿学习与强化学习的研究需求，该数据集提供了清晰的使用路径。研究者可通过加载Parquet文件直接访问结构化数据，利用帧索引与片段索引实现精确数据定位。双路视频数据可通过指定路径加载，支持基于视觉的策略学习。数据集采用单一训练划分，涵盖全部100个任务片段，适用于端到端模型训练。使用过程中需注意数据的时间对齐特性，动作与观测数据严格按时间戳对应，确保时序建模的准确性。

背景与挑战

背景概述

so101_test数据集隶属于机器人学领域，由HuggingFace的LeRobot项目创建，旨在为机器人模仿学习与行为克隆提供高质量的多模态数据资源。该数据集聚焦于机械臂控制任务，具体针对so_follower型机器人，通过记录其关节位置、视觉观测及时间序列信息，构建了包含100个完整交互片段、总计超过44000帧的轨迹数据。数据集采用Apache 2.0开源协议，以Parquet格式高效存储，并同步提供视频流，其结构设计体现了当前机器人数据标准化与可复现性研究的前沿趋势，为开发通用型机器人策略模型奠定了数据基础。

当前挑战

该数据集致力于解决机器人模仿学习中的核心挑战，即如何从高维异构观测中学习稳健且泛化性强的控制策略。具体挑战包括：在复杂动态环境中，从有限的视觉与状态数据中提取有效特征以指导机械臂精确运动；同时，数据构建过程面临多传感器时序对齐、大规模视频数据压缩存储与实时读取效率等工程难题。此外，数据集的单一任务与有限场景覆盖，也制约了模型在多样化现实任务中的迁移与应用能力。

常用场景

经典使用场景

在机器人学习领域，so101_test数据集为模仿学习与强化学习算法的训练与评估提供了关键支持。该数据集通过记录机械臂的关节位置、视觉观察及时间戳等多元信息，构建了丰富的交互轨迹。研究者能够利用这些数据训练模型学习从视觉输入到动作映射的策略，尤其在机械臂跟随任务中，数据集的高帧率视频与精确状态标注为算法提供了逼真的仿真环境，促进了端到端控制方法的开发与验证。

实际应用

在实际工业与服务业场景中，so101_test数据集能够辅助开发自主机械臂系统，适用于物体抓取、装配流水线操作或人机协作任务。基于该数据集训练的模型可提升机械臂对动态环境的感知与响应能力，实现更精准、灵活的动作执行。例如，在仓储物流中，机械臂可学习跟随操作员指令或视觉引导完成物品分拣；在医疗辅助领域，则能支持康复机器人进行适应性训练，增强自动化系统的实用性与安全性。

衍生相关工作

围绕so101_test数据集，已衍生出一系列专注于机器人模仿学习与视觉运动控制的经典研究工作。这些工作通常利用数据集的视觉-动作对，开发深度神经网络架构，如时空卷积网络与递归模型，以提升策略的泛化性能。部分研究进一步整合强化学习框架，探索离线强化学习或逆强化学习方法，旨在从示范数据中提取更优策略。这些衍生工作不仅丰富了机器人学习领域的算法库，也为后续大规模多任务数据集的构建提供了方法论参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集