so101_3_cup_no4
收藏Hugging Face2025-08-08 更新2025-08-09 收录
下载链接:
https://huggingface.co/datasets/Askel1419/so101_3_cup_no4
下载链接
链接失效反馈官方服务:
资源简介:
这是一个与LeRobot项目相关的机器人数据集,包含115个episodes,101858帧图像,1个任务,230个视频。数据集以Parquet格式存储,并提供机器人的动作、状态、主副视角图像等多种特征。
This is a robotic dataset associated with the LeRobot project. It includes 115 episodes, 101,858 image frames, 1 task, and 230 videos. The dataset is stored in Parquet format, and provides multiple features such as robot actions, states, main and auxiliary viewpoint images, and other features.
创建时间:
2025-07-29
原始信息汇总
数据集概述
基本信息
- 许可证: apache-2.0
- 任务类别: 机器人学 (robotics)
- 标签: LeRobot, so101, tutorial
- 代码库版本: v2.1
- 机器人类型: so101_follower
数据集结构
- 总集数: 115
- 总帧数: 101858
- 总任务数: 1
- 总视频数: 230
- 总块数: 1
- 块大小: 1000
- 帧率 (fps): 30
- 数据路径:
data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet - 视频路径:
videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
特征描述
- 动作 (action):
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
- 观测状态 (observation.state):
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
- 主图像观测 (observation.images.main):
- 数据类型: video
- 形状: [480, 640, 3]
- 视频信息:
- 高度: 480
- 宽度: 640
- 编码: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 是否包含音频: false
- 次图像观测 (observation.images.secondary):
- 数据类型: video
- 形状: [480, 640, 3]
- 视频信息: 同主图像观测
- 其他特征:
- timestamp (float32, [1])
- frame_index (int64, [1])
- episode_index (int64, [1])
- index (int64, [1])
- task_index (int64, [1])
引用信息
- BibTeX: [More Information Needed]
搜集汇总
数据集介绍

构建方式
在机器人操作任务数据采集领域,so101_3_cup_no4数据集依托LeRobot框架系统构建,通过so101_follower型机器人平台记录115条完整操作序列。数据以30fps采样频率捕获多模态信息,包含101,858帧时序数据,采用Apache-2.0许可协议存储为标准化parquet格式,每条数据均包含关节状态、视觉观测与时间戳的同步记录。
使用方法
研究人员可通过加载parquet数据文件获取结构化操作序列,利用帧索引实现动作-观测对齐。视觉数据支持视频解码还原操作场景,状态量可直接用于模仿学习算法训练。数据集默认配置为全训练集划分,建议采用时序验证策略评估模型泛化性能,特别注意双视角视觉信息在三维空间任务中的互补性应用。
背景与挑战
背景概述
机器人操作数据集so101_3_cup_no4隶属于LeRobot开源项目生态,专为机器人模仿学习与行为克隆研究设计。该数据集采集自so101_follower型机器人平台,包含115条完整操作序列与超过10万帧多模态数据,记录机械臂六维关节空间动作与双视角视觉观测。其构建遵循Apache 2.0开源协议,通过标准化数据格式推动机器人学习算法的可复现性与跨平台适配研究。
当前挑战
该数据集核心挑战在于解决高维连续动作空间下的精细操作任务泛化问题,需从多视角视频流与低维状态观测中提取鲁棒特征以生成精确的关节控制指令。构建过程中面临多传感器时序同步、大规模视频数据压缩存储与隐私信息过滤等技术难点,同时需确保动作轨迹的平滑性与任务执行的物理可行性。
常用场景
经典使用场景
在机器人操作学习领域,该数据集通过记录六自由度机械臂的关节位置与双视角视觉数据,为模仿学习算法提供多模态训练素材。研究者可利用其包含的115个完整操作序列,构建从视觉感知到动作执行的端到端映射模型,特别适用于基于视觉的机械臂抓取与放置任务仿真研究。
解决学术问题
该数据集有效解决了机器人模仿学习中多模态数据对齐与长期动作序列建模的难题。通过提供精确的时间戳同步机制和标准化数据格式,显著降低了研究者处理原始传感器数据的复杂度,为验证行为克隆、逆强化学习等算法在真实机器人平台上的泛化性能提供了基准测试环境。
实际应用
工业自动化场景中,该数据集可直接用于训练智能分拣系统的视觉伺服控制器。其包含的抓取器位置数据与双摄像头视角,能够模拟真实产线上物体抓取的操作流程,为仓储物流领域的自主装箱、物品归类等任务提供算法验证平台,加速机器人技能迁移到实际应用的过程。
数据集最近研究
最新研究方向
在机器人操作学习领域,so101_3_cup_no4数据集正推动模仿学习与多模态感知的融合研究。该数据集通过双视角视觉输入与六维关节状态数据,为机器人抓取任务提供了丰富的时空上下文信息。当前研究热点集中于利用此类数据开发端到端的视觉运动策略网络,结合自监督表征学习提升模型在动态环境中的泛化能力。随着具身智能概念的兴起,该数据集支持的跨模态对齐技术已成为实现机器人精细操作的关键突破口,为家庭服务机器人的自主技能学习奠定了重要数据基础。
以上内容由遇见数据集搜集并总结生成



