five

eval_pi05_pipette_in-distribution

收藏
Hugging Face2026-05-20 更新2026-05-21 收录
下载链接:
https://huggingface.co/datasets/allenai/eval_pi05_pipette_in-distribution
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集使用LeRobot框架创建,是一个机器人领域的数据集,适用于机器人控制、模仿学习等任务。数据集包含51个episode,总计24001帧,涵盖1个任务。数据以分块parquet文件形式组织,总数据文件大小约100 MB,视频文件大小约200 MB。数据特征包括:动作(14维浮点数组,表示左右机械臂各6个关节及夹爪的位置)、状态观测(与动作相同的14维关节位置)、图像观测(来自右、左、顶三个摄像头的视频,分辨率360x640,RGB三通道,帧率30fps,使用AV1编码)、时间戳、帧索引、episode索引、全局索引和任务索引。数据集仅提供训练集划分,采用Apache 2.0许可证。

This dataset is created using the LeRobot framework and belongs to the robotics domain, suitable for tasks such as robot control and imitation learning. It contains 51 episodes, totaling 24001 frames, covering 1 task. The data is organized in chunked parquet files, with a total data file size of approximately 100 MB and video file size of about 200 MB. Features include: actions (14-dimensional floating-point arrays representing the positions of 6 joints per arm and the gripper for both left and right arms), state observations (14-dimensional joint positions identical to actions), image observations (videos from right, left, and top cameras with a resolution of 360x640, RGB three-channel, frame rate 30fps, encoded with AV1), timestamps, frame indices, episode indices, global indices, and task indices. The dataset only provides a training set split and is licensed under Apache 2.0.
提供机构:
Allen Institute for AI
创建时间:
2026-05-20
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于LeRobot框架构建,聚焦于移液管操作这一精细机器人操控任务。数据采集自双机械臂机器人平台,通过遥操作方式记录51个完整演示片段,共计24,001帧时序数据。原始传感器读数与动作指令以14维向量形式保存,涵盖左右各六关节位置及夹爪开合度。多视角视觉信息由左、右及顶部三台摄像头同步采集,以AV1编码的360p视频流形式存储。数据集按1,000帧为单元进行分块,便于高效加载与分布式处理。
特点
该数据集的核心特质在于其面向分布内场景的精细化设计。所有51个演示均在固定实验条件下采集,保障了任务模式的高度一致性。动作与状态空间皆为14维连续变量,完整刻画了双臂协调运动的动力学特性。三视角视频数据提供了丰富的空间上下文信息,有利于学习稳健的视觉-运动映射关系。数据以parquet格式存储,结合视频文件组织,兼顾了结构化数据与高维视觉信息的存取效率,且遵循Apache-2.0开源协议。
使用方法
数据集采用Hugging Face Datasets库进行加载,用户可通过LeRobot框架中的标准数据加载器直接读取。使用时需指定'default'配置,数据文件路径遵循'data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet'模式。所有51个片段均归属于单一训练集,无需划分验证集。推荐的批量用法为按episode_index索引,逐一提取动作序列、机器人状态及多视角图像帧,用于训练模仿学习或行为克隆模型。visual数据以视频帧形式动态解码,需注意AV1编解码器的兼容性配置。
背景与挑战
背景概述
该数据集名为eval_pi05_pipette_in-distribution,由Hugging Face LeRobot团队创建,基于LeRobot框架构建,旨在为机器人操作学习提供标准化数据。数据集发布于2023年,聚焦于双机械臂(BiYam Follower)的精密操作任务,特别是移液器操作这一典型实验室场景。核心研究问题在于如何通过模仿学习使机器人掌握高精度、多自由度协同动作。数据集包含51个演示片段、24001帧数据,动作空间涵盖14维联合位置(左右各6自由度加夹爪),并采集三视角视频(右侧、左侧、顶部),为多模态学习提供基础。该数据集对机器人学习领域具有显著影响力,推动了精细操作任务的标准化评估,特别是在分布内场景下验证算法泛化能力。
当前挑战
数据集所解决的领域问题在于机器人模仿学习中动作精度与多任务泛化的矛盾,即如何在低容错场景(如移液操作)下习得稳健策略。具体挑战包括:1)高维动作空间(14维)下的精确控制,需协调双臂运动与夹爪力控,避免任务失败;2)多视角视觉信息融合,三路摄像头图像(360×640像素)需同时处理以应对遮挡和环境变化;3)数据采集的一致性,51个演示片段需保持任务行为规范,避免人为变异;4)训练与测试分布对齐,当前仅含训练集(split为0:51),需构建均匀分布的验证集以测试分布内泛化能力。此外,数据以压缩视频(AV1编码)和Parquet存储,对实时训练时I/O效率提出额外挑战。
常用场景
经典使用场景
在机器人学习与操控领域,eval_pi05_pipette_in-distribution数据集主要被用于评估和训练基于视觉-运动联合策略的精细操作任务。该数据集聚焦于移液管操作这一典型场景,提供了包含双机械臂14个关节动作、左右及顶部三视角高清视频、以及状态观测在内的完整轨迹数据。研究者可以借助此数据探索模仿学习、行为克隆等范式,训练机器人从像素输入直接映射到精确的关节动作,尤其在分布内条件下验证模型的泛化能力与操作精度。
实际应用
实际应用中,该数据集为生物医学实验室自动化与工业精密装配提供了技术验证平台。移液管操作是核酸检测、药物配制等场景中的核心环节,数据集可训练机器人从观看人类演示中自主学会吸取、转移和释放液体的精细动作。通过与LeRobot框架的深度集成,开发者能快速部署低成本视觉引导的操控系统,在生物安全柜或洁净环境中替代人工进行高重复性、高风险的液体处理,显著提升实验通量并降低污染风险。
衍生相关工作
该数据集衍生工作主要集中在基于Transformer的动作序列建模以及跨形态迁移学习。例如,研究者利用其多视角图像与动作标签,发展了隐式行为克隆(IBC)和扩散策略(Diffusion Policy)等生成式模型,实现了对移液管轨迹的平滑预测与抗扰动控制。此外,部分工作在此基础上引入领域随机化与数据增强,探索将分布内性能迁移至分布外光照、背景或工具变化的场景。这些工作共同推动了具身智能从固定任务泛化到开放环境的理论演进。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作