eval_pi0-zeroshot-1
收藏Hugging Face2026-05-16 更新2026-05-17 收录
下载链接:
https://huggingface.co/datasets/asdl-unist/eval_pi0-zeroshot-1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个使用LeRobot框架创建的机器人学领域数据集,遵循Apache 2.0许可证。它包含多模态机器人控制数据,具体包括:动作和观测状态,均为6维浮点向量,对应机器人关节(如肩部平移、肩部抬升、肘部弯曲、腕部弯曲、腕部旋转、夹爪)的位置信息;观测图像包含三个RGB视频流,分别来自基础视角(base_0_rgb)、左腕视角(left_wrist_0_rgb)和右腕视角(right_wrist_0_rgb),每个视频帧分辨率为480x640,具有3通道。此外,数据集还包含时间戳、帧索引、回合索引、数据索引和任务索引等元数据字段。数据以Parquet文件格式存储,视频以MP4格式存储,组织结构为分块形式。该数据集适用于机器人模仿学习、强化学习或视觉运动控制等任务,但具体数据规模(如总回合数、总帧数、总任务数)在提供的元数据中暂未明确。
This dataset is created using the LeRobot framework and belongs to the field of robotics, following the Apache 2.0 license. It contains multimodal robot control data with specific features including: actions and observation states, both as 6-dimensional floating-point vectors corresponding to robot joint positions (such as shoulder translation, shoulder lift, elbow bend, wrist bend, wrist rotation, and gripper); observation images consist of three RGB video streams from base view (base_0_rgb), left wrist view (left_wrist_0_rgb), and right wrist view (right_wrist_0_rgb), each with a frame resolution of 480x640 and 3 channels. Additionally, it includes metadata fields such as timestamp, frame index, episode index, data index, and task index. The data is stored in Parquet file format, videos in MP4 format, and organized in chunks. The dataset is suitable for tasks like robot imitation learning, reinforcement learning, or visual-motor control, but specific data scale details (e.g., total episodes, total frames, total tasks) are not explicitly provided in the metadata.
创建时间:
2026-05-15
原始信息汇总
根据您提供的数据集详情页面 README 文件内容,以下是对该数据集的总结:
数据集概述
- 数据集名称:eval_pi0-zeroshot-1
- 许可证:Apache-2.0
- 任务类别:机器人学 (Robotics)
- 标签:LeRobot
- 创建工具:使用 LeRobot 创建
数据集结构
基本信息
- 代码库版本:v3.0
- 机器人类型:so_follower
- 总集数:0
- 总帧数:0
- 总任务数:0
- 数据块大小:1000
- 数据文件大小:100 MB
- 视频文件大小:200 MB
- 帧率:30 FPS
数据路径
- 数据文件路径:
data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet - 视频文件路径:
videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
特征字段
| 特征名 | 数据类型 | 形状 | 描述 |
|---|---|---|---|
| action | float32 | [6] | 包含 shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos 共6个维度 |
| observation.state | float32 | [6] | 与 action 相同的6个机器人关节位置维度 |
| observation.images.base_0_rgb | video | [480, 640, 3] | 机器人基座视角的RGB视频,分辨率480x640 |
| observation.images.left_wrist_0_rgb | video | [480, 640, 3] | 左腕视角的RGB视频,分辨率480x640 |
| observation.images.right_wrist_0_rgb | video | [480, 640, 3] | 右腕视角的RGB视频,分辨率480x640 |
| timestamp | float32 | [1] | 时间戳 |
| frame_index | int64 | [1] | 帧索引 |
| episode_index | int64 | [1] | 集索引 |
| index | int64 | [1] | 索引 |
| task_index | int64 | [1] | 任务索引 |
配置信息
- 配置名称:default
- 数据文件:
data/*/*.parquet
搜集汇总
数据集介绍

构建方式
该数据集基于 LeRobot 框架构建,面向机器人领域的零样本评估任务,采用 so_follower 机器人平台采集数据。数据集以 Parquet 格式存储,包含动作、状态观测及多视角视觉图像(如 base_0_rgb、left_wrist_0_rgb、right_wrist_0_rgb)等关键特征。所有数据以 chunk 和 file 方式分片组织,视频则单独以 MP4 格式存储,确保了大规模数据的高效管理与加载。
特点
数据集的突出特点在于其多模态融合能力,同时提供6维机器人关节动作与状态数据,以及三个视角的高清 RGB 视频(480x640分辨率)。虽然当前版本包含0个 episode 和 task,但其预留的 splits、chunks_size 等参数设计,为未来扩展和零样本评估任务提供了灵活的数据结构支持。此外,采用 Apache-2.0 许可证,便于学术与工业界自由使用。
使用方法
用户可通过 LeRobot 库直接加载该数据集进行零样本策略评估。使用时,利用 info.json 中定义的 features 结构解析 action、observation.state 及多视角图像数据。数据集支持按 episode 索引或 frame 索引批量访问,便于构建机器人行为克隆或强化学习评估流程。对于需要自定义评估任务的场景,可基于预留的 task_index 字段进行任务筛选与适配。
背景与挑战
背景概述
在机器人学习领域,零样本泛化能力是评估模型能否应对未知任务与环境的关键指标。eval_pi0-zeroshot-1数据集由基于LeRobot框架构建,专注于机器人操作任务的零样本评估,其创建旨在测试机器人策略在不经微调的情况下适应新场景的能力。该数据集采用so_follower机械臂,采集了包括多视角RGB图像(基座相机、左右腕部相机)与六维关节状态(位置、夹爪开合)在内的多模态数据,以30帧每秒的速率记录了精细的操作轨迹。其设计理念与当前具身智能研究中追求通用机器人策略的趋势紧密相关,为衡量模型在未见任务上的迁移性能提供了标准化测试平台,对推动机器人基础模型的泛化性评估具有重要参考价值。
当前挑战
该数据集所面临的挑战首先源于机器人零样本泛化这一领域难题:模型需在无额外训练或演示的情况下,仅凭预训练知识完成全新任务,这要求数据能覆盖足够多样的场景与动作模式,而当前数据集的总片段数与任务数为零,表明其尚处于框架定义阶段,尚未纳入实际采集样本,因此无法支撑有效的泛化性评估。构建过程中的挑战则体现在多模态数据的同步与标定上:三个摄像头视角与关节状态序列需精确对齐时间戳,同时高分辨率视频(480×640)与动作序列(每秒30帧)的存储管理(100MB数据与200MB视频)对存储与处理效率提出了要求;此外,基于LeRobot的标准化格式虽便于集成,但如何设计包含多样化任务与干扰因素的零样本测试协议,仍是数据集构建的核心瓶颈。
常用场景
经典使用场景
在仿人灵巧手操作领域,eval_pi0-zeroshot-1数据集为评估零样本学习算法的泛化能力提供了关键基准。该数据集基于so_follower机械臂采集,包含六自由度关节角度和三维视觉信息,特别适用于验证策略模型在未训练环境中的直接部署效果。研究者常利用其多视角视频与状态轨迹的对应关系,测试视觉-运动联合表征的跨场景迁移性能,例如通过对比基线模型在新任务上的执行成功率,量化零样本策略对姿态扰动与光照变化的鲁棒程度。
解决学术问题
该数据集致力于破解机器人学习中的两大核心困境:数据稀缺性与环境动态性。通过提供标准化评估框架,它解决了零样本策略在未知物体位姿、非固定背景下的泛化验证难题,填补了灵巧操作领域缺乏统一零样本测试基准的空白。其价值在于推动研究者超越特定任务过拟合,探索更接近人类适应能力的通用操作模型,对理解视觉-运动耦合机制与构建开放式学习范式具有里程碑式意义。
衍生相关工作
基于该数据集,学界已衍生出多个标志性工作:PI0系列模型利用其多视角视频与状态同步特性,验证了条件扩散策略在零样本任务中的高效性;LeRobot框架以其为标准示例,推动了可复现的机器人学习评估流程设计。此外,该数据集的特性启发了注意力机制在视觉-运动对齐中的改进,催生了如‘抗扰动动作解码器’等新型网络结构,为后续非确定性环境下的操作策略研究奠定了方法基础。
以上内容由遇见数据集搜集并总结生成



