so100_test
收藏Hugging Face2025-05-28 更新2025-05-29 收录
下载链接:
https://huggingface.co/datasets/fjpaxkm/so100_test
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个与机器人学相关的数据集,使用LeRobot创建。它包含多个片段,每个片段包含多个视频和剧集,总共包含2个剧集、836帧、1个任务和4个视频。数据集的结构详细描述了包含的数据类型,如动作、观察值(包括笔记本电脑和手机的图像)、时间戳和索引。数据以Apache-2.0许可证授权。
创建时间:
2025-05-27
原始信息汇总
数据集概述
基本信息
- 名称: so100_test
- 许可证: Apache-2.0
- 任务类别: 机器人学 (robotics)
- 标签: LeRobot, so100, tutorial
数据集描述
- 创建工具: LeRobot
- 主页: [More Information Needed]
- 论文: [More Information Needed]
数据集结构
- 配置名称: default
- 数据文件: data//.parquet
- 元数据文件: meta/info.json
元数据详情
- 代码库版本: v2.1
- 机器人类型: so100
- 总集数: 2
- 总帧数: 836
- 总任务数: 1
- 总视频数: 4
- 总块数: 1
- 块大小: 1000
- 帧率: 30 fps
- 数据分割:
- 训练集: 0:2
数据路径
- 数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
- 视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
特征描述
-
动作 (action)
- 数据类型: float32
- 形状: [6]
- 名称: main_shoulder_pan, main_shoulder_lift, main_elbow_flex, main_wrist_flex, main_wrist_roll, main_gripper
-
观测状态 (observation.state)
- 数据类型: float32
- 形状: [6]
- 名称: 同动作特征
-
观测图像 - 笔记本 (observation.images.laptop)
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 非深度图
- 帧率: 30 fps
- 通道数: 3
- 无音频
-
观测图像 - 手机 (observation.images.phone)
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 视频信息: 同笔记本观测图像
-
其他特征
- 时间戳 (timestamp): float32, 形状 [1]
- 帧索引 (frame_index): int64, 形状 [1]
- 集索引 (episode_index): int64, 形状 [1]
- 索引 (index): int64, 形状 [1]
- 任务索引 (task_index): int64, 形状 [1]
引用
- BibTeX: [More Information Needed]
搜集汇总
数据集介绍

构建方式
在机器人技术领域,so100_test数据集通过LeRobot平台系统化构建,采用分块存储策略将数据组织为Parquet格式文件。该数据集收录了2个完整交互片段,涵盖836帧多模态观测数据,以30fps的采样频率同步记录机械臂关节状态与双视角视觉信息。数据采集过程严格遵循时序一致性原则,每个数据块包含1000个时间步长的连续交互序列,确保动作-观测对的时空对齐。
使用方法
研究人员可通过解析Parquet文件直接访问结构化数据,利用帧索引字段实现跨模态数据同步。训练集包含全部2个交互片段,视频数据存储于独立路径支持流式加载。使用时应重点关注动作向量与关节状态观测的对应关系,双视角图像数据可作为视觉特征提取的互补来源。数据加载接口兼容标准机器学习流程,建议结合LeRobot代码库实现端到端的机器人策略学习实验。
背景与挑战
背景概述
在机器人学习领域,高质量数据集对于推动算法发展具有关键作用。so100_test数据集作为LeRobot项目的重要组成部分,专注于机器人操作任务的示范数据收集。该数据集通过记录机械臂关节状态、多视角视觉观测及动作指令,为模仿学习与强化学习研究提供结构化数据支持。其设计体现了机器人领域对可复现实验和数据标准化日益增长的需求,旨在促进机器人控制策略的泛化能力研究。
当前挑战
该数据集需解决机器人操作任务中高维状态空间与动作空间的精确映射挑战,包括多传感器数据同步与异构模态融合的复杂性。构建过程中面临机械臂轨迹示教的数据采集效率瓶颈,需平衡动作平滑性与任务多样性;同时,多视角视频数据的存储压缩与实时解码对计算架构提出严格要求,且小规模样本的分布偏差可能影响策略迁移的鲁棒性。
常用场景
经典使用场景
在机器人学习领域,so100_test数据集作为LeRobot项目的重要组成部分,主要用于机器人控制策略的验证与调试。该数据集记录了六自由度机械臂的关节角度、夹爪状态以及多视角视频数据,为研究者提供了丰富的仿真与真实环境交互样本。通过复现机械臂的抓取、放置等基础操作,该数据集能够有效支持机器人动作模仿、状态估计等核心任务的算法开发。
解决学术问题
该数据集通过结构化存储机械臂的运动轨迹与视觉观测数据,为解决机器人领域的状态空间建模、动作序列生成等关键问题提供了基准。其多模态特征设计有助于探索视觉-动作关联性,推动模仿学习与强化学习算法的融合研究。数据集标注的时序一致性为长期任务规划、动作分割等时序建模课题提供了可靠的数据支撑,显著降低了机器人学习任务的实验门槛。
实际应用
在工业自动化场景中,该数据集可应用于机械臂操作技能的快速迁移。通过解析数据集中的关节运动轨迹与视觉反馈,工程师能够优化生产线上的抓取路径规划,减少实际调试中的碰撞风险。教育领域则可借助其标准化数据格式开展机器人编程教学,学生可通过对比数据集动作序列与仿真结果,直观理解机器人运动控制原理。
数据集最近研究
最新研究方向
在机器人学习领域,so100_test数据集作为LeRobot框架下的示范性资源,正推动模仿学习与多视角视觉感知的融合研究。该数据集通过笔记本电脑和手机双摄像头采集的同步视频流,结合六自由度机械臂的动作轨迹,为跨模态表征学习提供了实验基础。当前前沿探索集中在利用此类多传感器数据流,开发端到端的策略网络,以提升机器人对复杂环境的适应性。随着具身智能概念的兴起,这类富含时空上下文信息的开源数据集,正成为验证分层强化学习算法和仿真到真实迁移效果的关键基准。其标准化数据格式与轻量化存储设计,也为社区开展分布式协作研究提供了技术便利。
以上内容由遇见数据集搜集并总结生成



