eval_pi05_pipette_ood
收藏Hugging Face2026-05-20 更新2026-05-21 收录
下载链接:
https://huggingface.co/datasets/allenai/eval_pi05_pipette_ood
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由LeRobot项目创建,是一个用于机器人任务的开源演示数据集。数据集包含来自双雅马哈跟随者(bi_yam_follower)机器人的交互数据,涵盖3个不同任务,总计20个episodes和9269帧。数据以分块形式存储,数据文件总大小约100 MB,视频文件总大小约200 MB。数据集结构包括以下关键字段:动作(action)为14维浮点数组,表示左右机械臂各6个关节及夹爪的位置;状态观测(observation.state)为14维浮点数组,与动作结构对应;图像观测(observation.images)包含右、左、顶三个视角的视频流,每路视频分辨率为360x640,3通道彩色,编码为AV1,帧率为30 fps;此外还包括时间戳(timestamp)、帧索引(frame_index)、episode索引(episode_index)、全局索引(index)和任务索引(task_index)。数据集适用于机器人学习、模仿学习、强化学习等任务,尤其适合多模态(视频+状态)策略训练。数据已划分为训练集(全部20个episodes),采用Apache 2.0许可协议。
This dataset is created by the LeRobot project and is an open-source demonstration dataset for robotic tasks. It contains interaction data from the bi_yam_follower robot, covering 3 different tasks, with a total of 20 episodes and 9269 frames. The data is stored in chunks, with the total data file size approximately 100 MB and video file size approximately 200 MB. The dataset structure includes key fields: action as a 14-dimensional float array representing the positions of 6 joints per arm and the gripper; observation.state as a 14-dimensional float array corresponding to the action; observation.images includes video streams from right, left, and top views, each with a resolution of 360x640, 3-channel color, encoded as AV1, and a frame rate of 30 fps; additionally, it includes timestamp, frame_index, episode_index, index, and task_index. The dataset is suitable for robotic learning, imitation learning, reinforcement learning, and is particularly suited for multimodal (video+state) policy training. The data is split into a training set (all 20 episodes) and is licensed under Apache 2.0.
提供机构:
Allen Institute for AI
创建时间:
2026-05-20
搜集汇总
数据集介绍

构建方式
该数据集基于LeRobot框架构建,旨在为机器人学习领域提供高质量的离线训练样本。数据采集自双机械臂协同作业平台,共计20个回合(episode),包含9269帧有效数据,涵盖3种不同的任务类型。数据以Parquet格式存储,为提升访问效率与内存管理效率,数据被划分为多个大小为1000帧的块(chunk),每个块内进一步按文件索引组织。同时,多视角视频数据(左、右、顶部摄像头)以AV1编码的MP4格式独立存储,与结构化数据文件协同引用,保证了多媒体数据与特征数据的一体化与可追溯性。
使用方法
借助LeRobot库可便捷地加载与本数据集,用户只需通过`load_dataset`接口即可按需获取完整的数据流。数据集兼容标准的机器人学习流水线,每一帧数据可通过字典形式访问,其中`action`和`observation.state`字段为14维连续值向量,而`observation.images`字段则返回解码后的视频帧张量。为适应模型训练需求,建议使用Dataset的`map`函数对数据进行归一化、重采样或时序窗口裁剪,并将多视角图像通过`torch.stack`合并为高维输入。结合数据集中提供的`episode_index`与`frame_index`,用户可灵活重构连贯的任务片段,用于离线策略优化或预训练-微调范式下的视觉运动策略学习。
背景与挑战
背景概述
该数据集为机器人操作领域中的基准测试集,由LeRobot平台创建于近期,采用Apache-2.0许可协议。核心研究问题在于评估机器人仿人双臂在分布外场景下的操作泛化能力,尤其是针对精密操作任务(如移液器使用)的鲁棒性。数据集聚焦于“分布外”设定,旨在推动模型从简单模仿向在动态、未训练环境中执行复杂双手协同动作的跨越,对模仿学习、强化学习及机器人稳健控制具有重要验证价值。
当前挑战
领域问题方面,主要挑战在于机器人双臂操作面临的高维动作空间与状态感知问题,特别是移液器这类精密工具要求亚毫米级关节控制与实时多视觉反馈融合,传统模型难以泛化至未学习场景。构建过程中,挑战体现在需同步采集14自由度关节数据与三视角高清视频(30fps),并确保多源数据在时间轴上的精确对齐;同时,仅包含20条轨迹(9269帧)的规模对数据分布的覆盖性与OOD评估的代表性构成显著约束。
常用场景
经典使用场景
在机器人学习领域,数据集是驱动算法蓬勃发展的基石。eval_pi05_pipette_ood作为一个精心设计的机器人操控数据集,专注于评估模型在面对分布外场景时的泛化能力。其经典使用场景聚焦于模仿学习与强化学习算法的鲁棒性测试,通过提供涵盖多种操控任务的高保真观测轨迹,研究者得以系统性地检验模型在训练分布之外的未知环境、目标位姿或外力扰动下的行为表现。该数据集包含来自14维关节空间的动作与状态信息,以及三个不同视角的高清视频流,为构建端到端的机器人操控策略提供了理想的数据支撑。
解决学术问题
学术研究中,机器人系统在部署时遭遇的分布偏移是长期困扰学界的核心挑战。eval_pi05_pipette_ood的诞生直指这一痛点,它系统地支持了关于模型外推能力与分布鲁棒性的深入探究。通过该数据集,研究者能够量化分析现有模仿学习算法在面对未见过物体属性、光照变化或动力学参数漂移时的性能退化边界,进而推动因果表示学习、域随机化与对抗性训练等前沿理论的迭代。其意义在于,为构建能够安全应对现实复杂不确定性的通用机器人智能提供了可验证的基准,深刻影响了具身智能领域的研究范式。
实际应用
从工程落地的视角审视,该数据集的实际应用价值体现在工业精密操作与医疗辅助机器人等高风险场景中。在自动化实验室场景里,利用该数据集训练的模型可被部署于微量液体处理设备,使其在试剂瓶偏移或移液器磨损等未曾预见的工况下,依然保持准确的吸取与分液操作。此外,该数据集所倡导的分布外评估方法,已逐步成为机器人智造流水线上质检与异常处理模块的标准化验证流程,显著缩短了从算法原型到实际产线部署的鸿沟。
数据集最近研究
最新研究方向
在机器人学习领域,面向分布外(OOD)泛化能力的评估正成为核心议题。eval_pi05_pipette_ood数据集聚焦于精细操作任务,捕捉了20条包含双机械臂14维关节状态与多视角视觉观测(左、右、顶部三路640×360视频流)的示范轨迹,专为挑战模型在未知环境下的鲁棒性而设计。该数据集与LeRobot开源框架深度集成,为验证模仿学习与强化学习算法在微操场景中的零样本迁移能力提供了标准化基准。伴随具身智能从仿真迈向真实世界的热潮,此类OOD数据集成为衡量策略泛化安全性的关键标尺,其多模态融合特性与高保真物理采样(30 FPS)推动了机器人从‘记忆演示’向‘动态适应’的范式演进,对工业精密装配与医疗外科手术等高风险应用具有深刻奠基意义。
以上内容由遇见数据集搜集并总结生成



