eval_so101_act_pick_green_cube_amp

Hugging Face2026-04-16 更新2026-04-17 收录

下载链接：

https://huggingface.co/datasets/annyi/eval_so101_act_pick_green_cube_amp

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，专注于机器人技术领域。数据集包含机器人的动作和状态观测数据，具体包括肩部、肘部、手腕和夹持器的位置信息，以及来自顶部和手腕摄像头的图像数据。数据以parquet格式存储，并包含视频文件。技术细节包括：动作和观测状态的数据类型为float32，图像数据为视频格式，分辨率为480x640，3通道。数据集的总大小包括100MB的数据文件和200MB的视频文件，帧率为30fps。适用于机器人控制、行为学习和视觉导航等任务。许可证为Apache-2.0。

创建时间：

2026-04-16

原始信息汇总

数据集概述

基本信息

数据集名称: annyi/eval_so101_act_pick_green_cube_amp
创建工具: 使用 LeRobot (https://github.com/huggingface/lerobot) 创建
许可证: Apache 2.0
任务类别: 机器人学
标签: LeRobot

数据集结构

数据文件格式: Parquet 文件
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 30 FPS
代码库版本: v3.0
机器人类型: so_follower

数据特征

动作 (action)
- 数据类型: float32
- 形状: [6]
- 包含字段:
  - shoulder_pan.pos
  - shoulder_lift.pos
  - elbow_flex.pos
  - wrist_flex.pos
  - wrist_roll.pos
  - gripper.pos
观测状态 (observation.state)
- 数据类型: float32
- 形状: [6]
- 包含字段:
  - shoulder_pan.pos
  - shoulder_lift.pos
  - elbow_flex.pos
  - wrist_flex.pos
  - wrist_roll.pos
  - gripper.pos
顶部图像观测 (observation.images.top)
- 数据类型: video
- 形状: [480, 640, 3]
- 维度说明: [高度, 宽度, 通道数]
腕部图像观测 (observation.images.wrist)
- 数据类型: video
- 形状: [480, 640, 3]
- 维度说明: [高度, 宽度, 通道数]
时间戳 (timestamp)
- 数据类型: float32
- 形状: [1]
帧索引 (frame_index)
- 数据类型: int64
- 形状: [1]
回合索引 (episode_index)
- 数据类型: int64
- 形状: [1]
索引 (index)
- 数据类型: int64
- 形状: [1]
任务索引 (task_index)
- 数据类型: int64
- 形状: [1]

数据统计

总回合数: 0
总帧数: 0
总任务数: 0
数据分割: 未提供

可视化

可视化空间: https://huggingface.co/spaces/lerobot/visualize_dataset?path=annyi/eval_so101_act_pick_green_cube_amp

引用信息

主页: 未提供
论文: 未提供
BibTeX 引用: 未提供

搜集汇总

数据集介绍

构建方式

在机器人操作任务领域，eval_so101_act_pick_green_cube_amp数据集依托LeRobot平台构建，采用结构化数据采集流程。数据以Parquet格式存储，按块组织，每块包含1000帧记录，确保了高效的数据管理与访问。采集过程中，机器人状态、动作指令及多视角图像被同步记录，形成了时序对齐的多模态数据流，为后续分析提供了坚实基础。

特点

该数据集显著特点在于其丰富的多模态观测信息，不仅包含六自由度机械臂的关节位置状态与动作指令，还整合了顶部与腕部摄像头的视觉数据，图像分辨率为480x640。数据以30帧每秒的速率采集，确保了动作的连续性与细节捕捉。结构上，数据集通过索引字段明确标识了帧、片段及任务层级，便于进行精细的时序分析与任务划分。

使用方法

研究人员可通过HuggingFace平台直接访问该数据集，利用提供的可视化工具直观探索数据内容。数据集适用于机器人模仿学习、策略评估等任务，用户可依据帧索引或片段索引加载特定时序数据，结合状态观测与视觉输入训练模型。数据以标准化特征格式呈现，便于集成到现有机器学习流程中，支持端到端的算法开发与验证。

背景与挑战

背景概述

在机器人操作学习领域，模仿学习与强化学习等数据驱动方法正逐渐成为实现复杂任务自主执行的关键途径。eval_so101_act_pick_green_cube_amp数据集由HuggingFace的LeRobot项目创建，专注于机械臂操作任务，具体针对拾取绿色立方体这一精细化动作。该数据集整合了多模态观测数据，包括关节状态与视觉信息，旨在为机器人动作策略的评估与优化提供标准化基准。其构建依托开源机器人社区，反映了当前研究对真实世界交互数据的需求，以推动端到端控制模型的泛化能力与鲁棒性发展。

当前挑战

该数据集致力于解决机器人操作中基于视觉的抓取任务所面临的挑战，包括在动态环境中对目标物体的精准识别、位姿估计以及灵巧抓取策略的生成。构建过程中，数据采集需协调多传感器同步，确保关节状态与视觉帧的时间对齐，同时维持高帧率视频流与动作指令的一致性。此外，标注大规模机器人交互数据涉及高昂的硬件成本与时间开销，且需克服现实场景中光照变化、物体遮挡以及机械臂运动噪声等因素对数据质量的影响。

常用场景

经典使用场景

在机器人操作领域，eval_so101_act_pick_green_cube_amp数据集聚焦于机械臂执行特定任务——拾取绿色立方体的动作序列记录。该数据集通过LeRobot平台构建，整合了来自顶部和腕部摄像头的视觉观测、关节位置状态以及精确的时间戳信息，为模仿学习与强化学习算法提供了丰富的多模态训练数据。研究者能够利用这些序列化的动作-观测对，训练模型理解并复现复杂的抓取操作，从而推动机器人灵巧操控能力的发展。

衍生相关工作

围绕此类机器人操作数据集，已衍生出多项经典研究工作。例如，基于模仿学习的BC（行为克隆）算法常利用此类序列数据学习专家策略；而更先进的逆强化学习（IRL）方法则试图从演示中推断潜在奖励函数。此外，该数据集也支撑了视觉-动作表征学习、跨模态预训练以及基于模型的强化学习等方向的研究。这些工作共同推动了机器人从演示中学习技能（Learning from Demonstration, LfD）这一领域的深入发展，并催生了更多专注于复杂操作任务的专用数据集与基准测试。

数据集最近研究