so101_test
收藏Hugging Face2025-06-03 更新2025-06-04 收录
下载链接:
https://huggingface.co/datasets/Jeevesh2009/so101_test
下载链接
链接失效反馈官方服务:
资源简介:
LeRobot数据集是一个专注于机器人学的数据集,包含机器人执行任务时的动作、状态和视频数据。数据集共有2个剧集,294帧,1个任务,4个视频和1个片段,每个片段包含1000个数据点。数据集以Parquet文件格式存储,并提供了顶部和侧面视频流。所有数据均遵循apache-2.0许可证。
创建时间:
2025-05-26
原始信息汇总
数据集概述
基本信息
- 名称: so101_test
- 许可证: Apache-2.0
- 任务类别: 机器人学 (robotics)
- 标签: LeRobot, so101, tutorial
数据集描述
- 创建工具: 使用 LeRobot 创建
- 主页: [无信息]
- 论文: [无信息]
数据集结构
- 数据文件:
data/*/*.parquet - 代码库版本: v2.1
- 机器人类型: so101
- 总集数: 2
- 总帧数: 294
- 总任务数: 1
- 总视频数: 4
- 总块数: 1
- 块大小: 1000
- 帧率 (fps): 30
- 训练集划分: 0:2
数据路径
- 数据文件路径:
data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet - 视频文件路径:
videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
特征
-
动作 (action)
- 数据类型: float32
- 形状: [6]
- 名称: main_shoulder_pan, main_shoulder_lift, main_elbow_flex, main_wrist_flex, main_wrist_roll, main_gripper
-
观测状态 (observation.state)
- 数据类型: float32
- 形状: [6]
- 名称: 同动作特征
-
观测图像 (observation.images.top)
- 数据类型: video
- 形状: [800, 1280, 3]
- 视频信息:
- 高度: 800
- 宽度: 1280
- 编码: av1
- 像素格式: yuv420p
- 非深度图
- 帧率: 30
- 通道: 3
- 无音频
-
观测图像 (observation.images.side)
- 数据类型: video
- 形状: [480, 640, 3]
- 视频信息:
- 高度: 480
- 宽度: 640
- 编码: av1
- 像素格式: yuv420p
- 非深度图
- 帧率: 30
- 通道: 3
- 无音频
-
其他特征
- timestamp: float32, 形状 [1]
- frame_index: int64, 形状 [1]
- episode_index: int64, 形状 [1]
- index: int64, 形状 [1]
- task_index: int64, 形状 [1]
引用
- BibTeX: [无信息]
搜集汇总
数据集介绍

构建方式
在机器人技术领域,so101_test数据集依托LeRobot框架构建,采用结构化数据采集方法记录机械臂操作任务。数据集包含2个完整情节,总计294帧数据,以30fps的帧率同步采集关节状态与视觉信息。数据以分块形式存储于Parquet格式文件中,每个数据块包含1000帧,确保高效存储与读取。
使用方法
研究者可通过加载Parquet数据文件获取结构化观测-动作对,利用帧索引实现多模态数据对齐。视频数据存储于独立MP4文件,支持逐帧分析与视觉特征提取。数据集已预设训练集划分,可直接用于行为克隆、强化学习等算法训练,其标准化接口兼容主流机器人学习框架。
背景与挑战
背景概述
机器人学习领域近年来在模仿学习与强化学习方面取得显著进展,so101_test数据集作为LeRobot项目的重要组成部分,专注于解决工业机械臂的自主操作问题。该数据集由HuggingFace团队基于Apache 2.0许可证构建,通过记录六自由度机械臂的多模态交互数据,为机器人动作预测与环境感知研究提供关键支撑。其结构化设计融合了关节状态、视觉观测与时间序列信息,体现了现代机器人学习数据集对真实世界任务泛化能力的高度重视。
当前挑战
该数据集主要应对机器人操作任务中的高维连续控制难题,特别是在动态环境下机械臂的精确轨迹规划与视觉-动作映射问题。构建过程中面临多传感器时序同步、大规模视频数据压缩存储等技术挑战,需确保不同观测模态(双RealSense相机视频流与关节状态数据)在时间维度上的精确对齐。同时,工业机械臂的安全操作约束与真实场景下的数据采集复杂度,进一步增加了数据集构建的工程难度。
常用场景
经典使用场景
在机器人学习领域,so101_test数据集作为LeRobot框架的示范性资源,主要用于机械臂控制算法的验证与调试。其包含的六自由度关节动作数据和双视角视觉观测序列,为模仿学习与强化学习提供了标准化的训练环境。研究者通过该数据集能够系统评估机械臂轨迹规划、视觉伺服控制等核心算法的性能表现,为复杂操作任务的算法开发奠定基础。
解决学术问题
该数据集有效解决了机器人控制研究中缺乏标准化评估基准的难题。通过提供精确的关节状态记录与同步视觉数据,支持研究者深入探究高维连续动作空间下的策略优化问题。其结构化数据格式显著降低了多模态感知与控制算法融合的研究门槛,为机器人学习领域的可复现研究提供了重要基础设施,推动了视觉运动控制理论的实证发展。
实际应用
基于so101_test数据集开发的算法可直接迁移至工业自动化场景,适用于精密装配、物料分拣等需要视觉引导的机械臂操作任务。双RealSense相机提供的RGB视觉流能够模拟真实工作环境中的多角度感知需求,其记录的关节控制数据为实际机器人系统的运动规划模块提供了可靠的参数校准依据,显著提升自动化生产线的操作精度与适应性。
数据集最近研究
最新研究方向
在机器人操作学习领域,so101_test数据集作为LeRobot生态的重要组成部分,正推动多模态感知与动作生成的融合研究。当前前沿工作聚焦于利用其同步采集的关节状态数据与双视角视觉信息,开发端到端的模仿学习框架。研究者们积极探索基于Transformer的时空建模方法,旨在实现从高维视觉输入到连续动作空间的精确映射。该数据集的应用显著促进了真实场景下机器人技能迁移的研究,特别是在少样本学习与跨任务泛化方面展现出重要价值。随着具身智能研究的升温,这类高质量真实机器人数据集已成为验证算法实用性与鲁棒性的关键基准。
以上内容由遇见数据集搜集并总结生成



