so100_v1

Hugging Face2025-05-31 更新2025-06-01 收录

下载链接：

https://huggingface.co/datasets/howaboutyu/so100_v1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集与机器人学相关，围绕机器人的动作和观察进行构建，包含so100类型的机器人。每个剧集中的动作和观察以视频的形式呈现，数据集被划分为训练集。数据集中的特征包括机器人手臂各个关节的位置和运动，以及笔记本电脑摄像头捕获的30 FPS无音频图像。

创建时间：

2025-05-31

原始信息汇总

数据集概述

基本信息

名称: so100_v1
许可证: Apache-2.0
任务类别: 机器人学 (Robotics)
标签: LeRobot, so100, tutorial

数据集描述

创建工具: 使用 LeRobot 创建
主页: [未提供]
论文: [未提供]

数据集结构

数据文件: data/*/*.parquet
元数据文件: meta/info.json

元数据详情

代码库版本: v2.0
机器人类型: so100
总集数: 2
总帧数: 1796
总任务数: 1
总视频数: 4
总块数: 1
块大小: 1000
帧率: 30 fps
分割: 训练集 (0:2)

数据路径

数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

动作 (action)
- 数据类型: float32
- 形状: [6]
- 名称: main_shoulder_pan, main_shoulder_lift, main_elbow_flex, main_wrist_flex, main_wrist_roll, main_gripper
观测状态 (observation.state)
- 数据类型: float32
- 形状: [6]
- 名称: main_shoulder_pan, main_shoulder_lift, main_elbow_flex, main_wrist_flex, main_wrist_roll, main_gripper
观测图像 (observation.images.laptop)
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 视频信息:
  - fps: 30.0
  - 分辨率: 480x640
  - 通道: 3
  - 编解码器: av1
  - 像素格式: yuv420p
  - 深度图: false
  - 音频: false
观测图像 (observation.images.laptop2)
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 视频信息:
  - fps: 30.0
  - 分辨率: 480x640
  - 通道: 3
  - 编解码器: av1
  - 像素格式: yuv420p
  - 深度图: false
  - 音频: false
其他特征
- timestamp: float32, [1]
- frame_index: int64, [1]
- episode_index: int64, [1]
- index: int64, [1]
- task_index: int64, [1]

引用

BibTeX: [未提供]

搜集汇总

数据集介绍

构建方式

在机器人技术领域，so100_v1数据集通过LeRobot框架系统性地采集了真实环境中的机械臂操作数据。该数据集构建过程采用分块存储策略，将1796帧数据划分为2个完整操作序列，每个数据块包含1000帧样本，并以30fps的帧率同步记录六自由度机械臂的关节状态与双视角视觉信息。数据以标准化Parquet格式存储，确保时间戳、帧索引与多模态观测数据的精确对齐。

使用方法

研究者可通过HuggingFace平台直接加载数据集，利用LeRobot工具链解析Parquet文件中的多模态序列。每个数据样本包含同步的动作指令、关节状态观测及双视角视觉帧，支持按操作片段索引提取训练数据。数据集已预划分为训练集，可直接用于行为克隆、强化学习等算法的训练与验证，视频数据可通过指定路径流式加载。

背景与挑战

背景概述

在机器人技术领域，高质量数据集对于推动模仿学习与强化学习算法的发展具有关键作用。so100_v1数据集作为LeRobot项目的重要组成部分，专注于采集真实环境中机械臂的操作数据。该数据集通过记录六自由度机械臂的关节状态、动作指令及多视角视觉观测，为研究机器人动作规划与感知控制提供了宝贵资源。其结构化设计融合了时序帧索引与任务上下文信息，体现出面向实际应用场景的数据构建理念。

当前挑战

该数据集旨在解决机器人操作任务中高维动作空间与复杂视觉感知的协同建模难题，其挑战体现在动作轨迹的平滑性与任务泛化能力的要求上。构建过程中需克服多传感器时序同步、大规模视频数据压缩存储等技术瓶颈，同时需确保不同视角图像数据在空间标定上的一致性。此外，有限的任务场景与样本规模也对数据多样性与算法普适性提出了更高要求。

常用场景

经典使用场景

在机器人学习领域，so100_v1数据集作为LeRobot项目的重要组成部分，主要用于机器人操作任务的模仿学习与策略训练。该数据集通过记录六自由度机械臂的关节角度控制指令及多视角视觉观测数据，为研究者提供了丰富的机器人交互轨迹。典型应用场景包括基于视觉的运动规划算法验证，以及端到端机器人控制模型的训练过程。数据集的结构化设计使得其能够有效支持从原始传感器输入到动作输出的映射关系学习，为机器人自主操作能力的提升奠定了数据基础。

解决学术问题

该数据集主要针对机器人学习中的样本效率低下和仿真到真实迁移困难等核心问题。通过提供真实机器人采集的多模态交互数据，它有效缓解了强化学习对大量试错的需求，为基于模仿学习的策略优化提供了高质量示范。在学术层面，该数据集助力解决了高维状态空间下的动作表示学习难题，推动了视觉-运动协同建模的理论发展。其精确的时间同步机制和完整的轨迹记录方式，为研究连续控制任务中的时序依赖性提供了重要实验依据。

实际应用

在实际工业场景中，so100_v1数据集可广泛应用于智能制造领域的机器人分拣、装配等精细化操作任务。基于该数据集训练的模型能够实现机械臂的视觉伺服控制，适应不同光照条件下的工件抓取需求。在服务机器人领域，这些数据支撑了家居环境中的物体操控能力开发，如餐具摆放、物品递送等日常任务。数据集中包含的双视角视觉信息特别有利于开发对遮挡具有鲁棒性的视觉定位系统，为实际部署中的环境适应性提供了技术保障。

数据集最近研究