so100_test
收藏Hugging Face2025-06-01 更新2025-06-02 收录
下载链接:
https://huggingface.co/datasets/Dangvi/so100_test
下载链接
链接失效反馈官方服务:
资源简介:
这是一个关于机器人学的数据集,包含了2个集、1183帧、1个任务和4个视频。数据集以Apache-2.0许可证发布,用于机器人相关的研究和开发。数据集的特征包括机器人的动作、状态、手腕摄像头和网页摄像头图像等。
创建时间:
2025-06-01
原始信息汇总
数据集概述
基本信息
- 许可证: apache-2.0
- 任务类别: robotics
- 标签: LeRobot, so100, tutorial
数据集描述
- 创建工具: LeRobot
- 主页: [More Information Needed]
- 论文: [More Information Needed]
数据集结构
- 数据文件格式: parquet
- 配置名称: default
- 数据文件路径: data//.parquet
元数据信息
- 代码库版本: v2.1
- 机器人类型: so100
- 总集数: 2
- 总帧数: 1183
- 总任务数: 1
- 总视频数: 4
- 总块数: 1
- 块大小: 1000
- 帧率: 30 fps
- 数据分割:
- 训练集: 0:2
特征描述
- 动作 (action):
- 数据类型: float32
- 形状: [6]
- 名称: main_shoulder_pan, main_shoulder_lift, main_elbow_flex, main_wrist_flex, main_wrist_roll, main_gripper
- 观测状态 (observation.state):
- 数据类型: float32
- 形状: [6]
- 名称: main_shoulder_pan, main_shoulder_lift, main_elbow_flex, main_wrist_flex, main_wrist_roll, main_gripper
- 观测图像 (observation.images.wristcam, observation.images.webcam):
- 数据类型: video
- 形状: [480, 640, 3]
- 视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30 fps
- 通道数: 3
- 是否包含音频: false
- 时间戳 (timestamp):
- 数据类型: float32
- 形状: [1]
- 帧索引 (frame_index):
- 数据类型: int64
- 形状: [1]
- 集索引 (episode_index):
- 数据类型: int64
- 形状: [1]
- 索引 (index):
- 数据类型: int64
- 形状: [1]
- 任务索引 (task_index):
- 数据类型: int64
- 形状: [1]
引用
- BibTeX: [More Information Needed]
搜集汇总
数据集介绍

构建方式
so100_test数据集依托LeRobot开源框架构建,采用模块化设计理念将机器人操作数据封装为标准化parquet格式。技术实现上通过30fps同步采集六轴机械臂的关节状态、末端执行器动作及双视角视觉数据,原始数据经时间戳对齐和分块处理后形成1183帧有效样本,每1000帧构成一个数据块以优化存储效率。
特点
该数据集显著特点在于多维异构数据的深度融合,包含六自由度机械臂的精确动作控制参数、双路高清视觉观测流(腕部摄像头和外部监控视角)以及精确到毫秒级的时间同步信息。数据维度设计科学,动作空间与状态空间采用同名参数对应,便于闭环控制算法的训练验证,视频流采用AV1编码压缩在保持画质同时减少存储占用。
使用方法
使用者可通过解析parquet文件获取结构化数据,配合元数据描述文件快速构建机器人强化学习pipeline。典型应用场景包括:利用observation字段中的状态-图像联合数据训练感知控制模型,通过action字段验证运动规划算法效果。视频数据支持帧级随机访问,研究者可灵活提取特定任务片段进行行为克隆或逆强化学习实验。
背景与挑战
背景概述
so100_test数据集由LeRobot团队构建,专注于机器人技术领域的研究与应用。该数据集旨在为机器人控制与行为学习提供高质量的多模态数据支持,涵盖机械臂动作、状态观测以及视觉感知等多维度信息。数据集采用Apache-2.0许可协议,体现了开源共享的科研精神。其核心研究问题聚焦于如何通过真实世界的数据采集与处理,提升机器人学习算法的泛化能力与适应性。尽管数据集的具体创建时间与主要研究人员信息尚未公开,但其在机器人技术领域的潜在影响力不容忽视,尤其是在机械臂控制与视觉感知的联合建模方面具有重要价值。
当前挑战
so100_test数据集面临的挑战主要体现在两个方面。在领域问题层面,数据集需解决机器人动作控制与视觉感知的复杂耦合问题,如何从高维观测数据中提取有效特征以指导精确动作生成仍是一大难题。在构建过程中,数据集面临着多模态数据同步采集与对齐的技术挑战,尤其是机械臂状态数据与视觉数据的时间一致性保障。此外,数据规模相对有限,仅包含2个完整任务序列和1183帧数据,可能影响模型训练的泛化性能。视频数据的编解码格式与分辨率统一性也对数据预处理流程提出了较高要求。
常用场景
经典使用场景
在机器人控制与学习领域,so100_test数据集为研究者提供了丰富的机械臂操作数据,包括关节角度、末端执行器状态以及多视角视觉信息。该数据集最经典的使用场景是用于训练和评估基于强化学习的机械臂控制算法,通过模拟真实环境中的抓取、放置等任务,验证算法在复杂动态环境中的泛化能力。
衍生相关工作
围绕so100_test数据集已衍生出多项标志性研究,包括基于Transformer的多模态策略表示、跨域机械臂技能迁移框架等。这些工作通过创新性地利用数据集中的时序动作序列和视觉观测对应关系,推动了机器人学习领域从仿真到实物的知识迁移研究进展。
数据集最近研究
最新研究方向
在机器人技术领域,so100_test数据集的最新研究方向聚焦于多模态感知与动作控制的深度融合。该数据集通过整合机械臂关节状态、腕部摄像头和外部摄像头等多源传感器数据,为研究端到端模仿学习与强化学习算法提供了丰富素材。当前研究热点集中在利用其高精度时序动作记录和同步视觉观测,开发能够理解复杂操作场景的通用机器人策略模型。随着LeRobot开源生态的完善,该数据集正被用于探索跨任务迁移学习框架,特别是在小样本条件下的适应性训练方法。其标准化数据结构和Apache 2.0许可特性,显著降低了学术界对工业级机器人数据的使用门槛。
以上内容由遇见数据集搜集并总结生成



