five

eval_openvla_pipette_ood

收藏
Hugging Face2026-05-20 更新2026-05-21 收录
下载链接:
https://huggingface.co/datasets/allenai/eval_openvla_pipette_ood
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个机器人操作数据集,使用LeRobot工具创建,专门针对bi_yam_follower(一种双臂机器人配置)设计,旨在记录和提供机器人执行任务时的感知-动作数据。数据内容包含机器人执行4个不同任务时产生的24条完整轨迹(episodes),总计20010个时间步(帧)。每个数据样本包含多模态信息:1)动作空间:一个14维的浮点向量,分别对应左、右机械臂各6个关节和1个夹爪的位置指令;2)观测空间:包括机器人的状态(与动作空间相同的14维关节位置)以及来自三个固定视角(右、左、顶)的RGB视频流,每个视频分辨率为360x640,帧率为30fps;3)元数据:包括时间戳、帧索引、episode索引、样本全局索引和任务索引。数据以分块Parquet文件格式组织,便于高效读取,并配有独立的MP4视频文件。该数据集适用于机器人学习任务,如模仿学习、行为克隆、强化学习以及多模态感知-动作策略建模的研究与开发。

This dataset is a robot manipulation dataset created using the LeRobot tool. It is specifically designed for the bi_yam_follower (a dual-arm robot configuration) to record and provide perception-action data during robot task execution. The dataset contains 24 complete trajectories (episodes) generated by the robot performing 4 different tasks, totaling 20,010 timesteps (frames). Each data sample includes multimodal information: 1) Action space: a 14-dimensional floating-point vector corresponding to position commands for 6 joints and 1 gripper each for the left and right arms. 2) Observation space: includes the robots state (14-dimensional joint positions, same as the action space) and RGB video streams from three fixed viewpoints (right, left, top), each with a resolution of 360x640 and a frame rate of 30fps. 3) Metadata: includes timestamps, frame index, episode index, global sample index, and task index. The data is organized in chunked Parquet file format for efficient reading, accompanied by separate MP4 video files. This dataset is suitable for robot learning tasks such as imitation learning, behavior cloning, reinforcement learning, and research and development of multimodal perception-action policy modeling.
提供机构:
Allen Institute for AI
创建时间:
2026-05-20
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作领域,面向分布外(Out-of-Distribution,OOD)场景的模型评估至关重要。该数据集是基于LeRobot框架构建,用于评估开放词汇视觉-语言-动作(OpenVLA)模型在未知环境中的泛化能力。数据采集自一款双臂机器人平台,共包含24个任务片段,总计20010帧数据,覆盖4种不同的操作任务。数据以Parquet格式存储,每1000帧为一个块,同时视频数据以AV1编码的MP4文件保存。训练集与测试集划分明确,所有数据均用于训练场景。
使用方法
使用该数据集时,研究者可通过HuggingFace的datasets库加载Parquet文件,并结合LeRobot提供的API进行数据预处理。建议将视频帧与状态序列对齐,构建符合OpenVLA输入格式的多模态观测数据。数据集默认以训练模式加载,用户可根据需求定义批次大小与采样策略。为评估OOD泛化能力,推荐将已知任务与未知任务分开测试。由于数据规模较小(约300MB),可高效进行快速实验迭代。具体实现可参考LeRobot官方文档中的示例脚本。
背景与挑战
背景概述
eval_openvla_pipette_ood数据集由Hugging Face社区基于LeRobot框架创建,专注于机器人操作领域的模仿学习与泛化性能评估。该数据集以双机械臂(bi_yam_follower)为硬件平台,采集了24个回合、超过20000帧的精细操作数据,涵盖四种特定任务。其核心研究问题在于评估视觉-语言-行动(VLA)模型在面对分布外(Out-of-Distribution, OOD)场景时的鲁棒性与迁移能力,为机器人技能泛化研究提供了标准化基准。作为OpenVLA模型评测体系的关键组成部分,该数据集推动了具身智能领域从封闭环境模拟向真实世界复杂操作的跨越,对验证多模态感知与控制策略的泛化边界具有重要参考价值。
当前挑战
该数据集所解决的领域挑战聚焦于机器人模仿学习在非受控环境下的泛化瓶颈。机器人系统常因训练数据与部署场景的分布偏移导致策略失效,例如物体位置、光照或背景的变化可能使模型无法适应。eval_openvla_pipette_ood通过刻意引入OOD条件,逼近真实操作中的鲁棒性需求。构建过程中,数据集面临双机械臂高精度协调注释的挑战,需同步采集14维度联合动作、左右及顶部多视角视觉流(360×640分辨率,30FPS),确保状态与动作时空对齐。同时,有限的数据规模(24个回合)却要求覆盖充分的任务变体,这对数据采集的质量控制与场景多样性设计提出了极高要求,以避免过拟合风险。
常用场景
经典使用场景
在机器人学习与具身智能的交叉领域中,eval_openvla_pipette_ood数据集为评估视觉-语言-动作(VLA)模型在拾取-放置任务上的泛化能力提供了标尺。该数据集包含24个完整操作回合、超过两万帧的精细标注数据,涵盖四种不同任务,结合多视角视觉观测(左、右、顶部相机)与14维关节及夹爪状态信息。经典的场景在于利用其'out-of-distribution'(OOD)设计理念,专门测试训练时未见的物体排列、背景变化或任务变体,从而衡量模型在真实物理世界中处理分布外情形时的鲁棒性与适应性。
解决学术问题
在学术研究中,该数据集直面机器人操作领域长期存在的'分布偏移'瓶颈——即模型在实验室受控环境下表现优异,却难以应对现实世界无穷变化的挑战。通过提供元数据统一、任务多样且包含OOD变体的标准化基准,它使研究者能够系统性地探究视觉策略对光照变化、物体位姿扰动及背景混杂的抵抗能力。其意义在于推动从静态模仿学习向动态泛化学习的范式跃迁,为构建真正可部署于非结构化环境的通用机器人操控系统奠定了数据根基。
实际应用
实际应用中,该数据集聚焦于工业与家庭场景中精细拾取操作的真实需求。例如,自动化生产线中机械臂需从随机堆叠的零部件中准确抓取特定工件,抑或服务机器人在厨台上识别并夹取不同大小和材质的器具。数据集中的动作空间包含双臂协调控制与夹爪力矩调节,其多模态数据(图像+关节状态)可直接用于训练具备抗干扰能力的实时操控策略,落地场景涵盖精密装配、医疗手术辅助乃至危险环境下的远程操作,显著提升机器人对复杂物理交互的容错率。
数据集最近研究
最新研究方向
在机器人学习与模仿学习的交叉前沿,eval_openvla_pipette_ood 数据集针对开放词汇视觉-语言-动作(OpenVLA)模型在移液操作任务中的分布外泛化能力展开研究。该数据集利用 LeRobot 框架采集了双机械臂在执行四种精细移液任务时的多视角视觉与关节状态数据,共计24个episode,超过两万帧。当前研究热点聚焦于如何将大规模预训练的视觉-语言模型与机器人控制策略深度耦合,以应对操作环境中未曾观测的物体姿态、光照变化及工具形态。这一方向正值具身智能热潮,该数据集为评估模型在面向实体世界时的鲁棒性与零样本适应力提供了关键基准,推动了机器人从实验室预设场景迈向真实动态操作的关键跃迁。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作