so100_test
收藏Hugging Face2025-05-17 更新2025-05-18 收录
下载链接:
https://huggingface.co/datasets/SGQA/so100_test
下载链接
链接失效反馈官方服务:
资源简介:
该数据集使用LeRobot创建,包含多个剧集、帧和任务。数据以Parquet文件格式存储,并包含视频。数据集特征包括各种机器人动作和观察值,并且数据集被划分为训练数据。该数据集遵循Apache-2.0许可。但README文件中未提供数据集的具体描述。
创建时间:
2025-05-17
原始信息汇总
数据集概述
基本信息
- 许可证: apache-2.0
- 任务类别: robotics
- 标签: LeRobot, so100, tutorial
- 创建工具: LeRobot
数据集结构
- 数据文件格式: parquet
- 数据文件路径:
data/*/*.parquet
元数据信息
- 代码库版本: v2.1
- 机器人类型: so100
- 总集数: 1
- 总帧数: 1297
- 总任务数: 1
- 总视频数: 2
- 总块数: 1
- 块大小: 1000
- 帧率: 30 fps
- 训练集划分: "0:1"
数据路径
- 数据路径模板:
data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet - 视频路径模板:
videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
特征描述
动作特征 (action)
- 数据类型: float32
- 形状: [6]
- 名称:
- main_shoulder_pan
- main_shoulder_lift
- main_elbow_flex
- main_wrist_flex
- main_wrist_roll
- main_gripper
观测状态 (observation.state)
- 数据类型: float32
- 形状: [6]
- 名称: 同动作特征
观测图像 (observation.images.laptop & observation.images.phone)
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 视频信息:
- fps: 30.0
- height: 480
- width: 640
- channels: 3
- codec: av1
- pix_fmt: yuv420p
- is_depth_map: false
- has_audio: false
其他特征
- timestamp: float32, shape [1]
- frame_index: int64, shape [1]
- episode_index: int64, shape [1]
- index: int64, shape [1]
- task_index: int64, shape [1]
搜集汇总
数据集介绍

构建方式
在机器人技术领域,so100_test数据集通过LeRobot平台精心构建,采用模块化数据采集策略。数据集以Apache-2.0许可发布,包含1297帧30fps的时序数据,通过分块存储的Parquet格式实现高效管理。每个数据块包含机械臂的6维动作空间数据和双视角视觉观测,视频数据采用AV1编解码器压缩,确保数据完整性的同时优化存储效率。
使用方法
研究者可通过解析Parquet文件直接获取结构化数据,配合附带的MP4视频文件进行多模态验证。数据路径采用模板化设计,支持按分块索引快速定位。典型应用场景包括机械臂控制策略的模仿学习、基于视觉的强化学习算法开发等,建议使用LeRobot配套工具链实现数据加载与预处理。
背景与挑战
背景概述
so100_test数据集由LeRobot团队构建,专注于机器人控制领域的研究。该数据集以so100型机器人为研究对象,记录了机械臂关节运动参数、视觉观测数据及时间戳信息,为机器人动作学习与状态预测提供了多模态数据支持。其构建基于LeRobot开源框架v2.1版本,采用Apache-2.0许可协议,包含1297帧30fps的视频数据及6自由度机械臂运动轨迹,填补了特定机器人型号标准化数据集的空白。
当前挑战
该数据集面临的挑战主要体现在两个方面:在领域问题层面,多传感器时序数据对齐与高维动作空间建模存在技术难点,需解决机械臂运动学参数与视觉观测的跨模态关联问题;在构建过程中,数据采集系统需同步处理6轴关节角度数据与双路高清视频流,对硬件同步精度与存储吞吐量提出严苛要求,且原始视频的AV1编码格式增加了后续解码处理的复杂度。
常用场景
经典使用场景
在机器人控制领域,so100_test数据集为研究多关节机械臂的运动控制提供了标准化的测试平台。该数据集通过记录SO100型机械臂的关节角度、末端执行器状态以及多视角视频数据,为模仿学习算法的训练与验证创造了理想条件。其包含的1297帧高精度动作轨迹和同步视觉观测,特别适合用于研究视觉-动作映射关系这一机器人学核心问题。
解决学术问题
该数据集有效解决了机械臂控制研究中样本稀缺、数据异构的难题。通过提供标准化的关节空间动作指令与状态观测配对数据,研究人员能够系统性评估不同控制算法的泛化性能。其六自由度机械臂的完整运动记录,为研究高维连续动作空间的策略优化、状态表征学习等关键问题提供了基准测试环境,显著推动了模仿学习在机器人领域的应用进展。
实际应用
在工业自动化场景中,该数据集支持了装配线机械臂的快速技能迁移。基于数据集训练的视觉伺服系统已成功应用于电子产品组装场景,通过迁移学习将仿真环境中习得的抓取策略适配到真实机械臂。多模态观测数据中的手机与笔记本视角视频,特别适用于开发基于多视角视觉的精细操作算法,大幅降低了真实机器人试错成本。
数据集最近研究
最新研究方向
在机器人控制与视觉感知领域,so100_test数据集凭借其多模态数据结构和精细的动作标注,正成为强化学习与模仿学习算法验证的重要基准。该数据集通过LeRobot框架整合了机械臂关节状态、双视角视觉输入及时间序列信息,为研究跨模态表征学习提供了理想实验平台。近期研究聚焦于如何利用其高精度动作轨迹和同步视觉流,开发能够理解复杂操作任务的通用机器人策略。随着具身智能研究的兴起,此类包含真实物理交互的数据集在仿真到现实迁移学习中展现出独特价值,尤其在少样本学习与元学习场景下,为降低真实机器人训练成本提供了数据支撑。
以上内容由遇见数据集搜集并总结生成



