dAgger_openpi_all_RETAIL
收藏Hugging Face2026-02-19 更新2026-02-20 收录
下载链接:
https://huggingface.co/datasets/villekuosmanen/dAgger_openpi_all_RETAIL
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是与机器人技术相关的数据集,使用LeRobot创建。数据集包含20个episodes,总计6679帧,涉及1个任务。数据以parquet格式存储,总数据文件大小为100MB,视频文件大小为200MB,帧率为20fps。数据集的结构包括动作和观察两部分:动作部分包含7个关节的位置、速度、力和末端执行器姿态;观察部分包含7个关节的状态(位置、速度、力)和末端执行器姿态,以及来自前部和腕部摄像头的图像(分辨率480x640,3通道)。视频文件使用av1编解码器,格式为yuv420p,无音频。数据集适用于机器人控制、行为模仿等任务。
创建时间:
2026-02-16
搜集汇总
数据集介绍
构建方式
在机器人学习领域,高质量的数据集对于算法训练至关重要。dAgger_openpi_all_RETAIL数据集通过LeRobot平台构建,采用数据聚合(DAgger)策略收集机器人执行任务时的交互数据。具体而言,数据集记录了ARX5跟随机器人在单一任务中的20个完整轨迹,总计6679帧,以20帧每秒的速率采集。数据以分块形式存储于Parquet文件中,每块包含1000帧,便于高效处理与访问。
特点
该数据集在机器人操作任务中展现出多维度的数据表征能力。其核心特征在于同时整合了机器人的动作指令与状态观测,动作数据涵盖位置、速度、力矩及末端执行器姿态,而观测数据则包括关节状态与双视角视觉信息——前方摄像头与腕部摄像头均提供480x640分辨率的RGB视频流。这种多模态结构支持从低级控制到高级感知的各类研究,且数据以标准化格式组织,确保了跨平台使用的兼容性。
使用方法
为促进机器人模仿学习与强化学习的研究,该数据集可直接通过HuggingFace平台加载。用户需利用LeRobot库或兼容的数据处理工具读取Parquet文件,并依据元数据中的特征描述解析各字段。数据集已预设训练集划分,涵盖全部20个轨迹,研究者可将其用于策略训练、行为克隆或轨迹分析。视频数据以MP4格式独立存储,可与状态动作数据同步调用,实现端到端的视觉运动控制模型开发。
背景与挑战
背景概述
在机器人学习领域,模仿学习与强化学习的融合为复杂任务的数据驱动策略优化提供了新范式。dAgger_openpi_all_RETAIL数据集依托LeRobot开源框架构建,专注于零售场景下的机器人操作任务,其核心研究问题在于解决现实环境中机器人动作的精确模仿与泛化能力。该数据集通过集成多模态观测数据,包括关节状态、末端执行器位姿及视觉信息,旨在推动机器人从演示中学习策略的研究,对提升服务机器人在动态零售环境中的自主性与适应性具有显著影响力。
当前挑战
该数据集致力于解决机器人模仿学习在非结构化零售环境中的挑战,包括从有限演示中泛化到未见场景,以及处理高维视觉与状态空间的复杂映射。构建过程中,挑战体现在多传感器数据的同步与对齐、大规模视频数据的高效存储与检索,以及确保动作轨迹在真实物理系统中的可行性与安全性,这些因素共同增加了数据采集与处理的复杂度。
常用场景
经典使用场景
在机器人学习领域,dAgger_openpi_all_RETAIL数据集为模仿学习与强化学习算法的训练与评估提供了关键支持。该数据集通过记录ARX5机械臂在零售环境中的操作轨迹,包括关节位置、速度、末端执行器姿态及多视角视觉观测,为研究者构建端到端的机器人控制策略奠定了数据基础。其经典应用场景在于训练机器人执行精细的抓取与放置任务,例如在零售货架上处理商品,通过高频率的传感器数据与动作序列,模拟真实世界的交互过程,从而优化策略网络的泛化能力。
解决学术问题
该数据集有效应对了机器人学中样本效率低下与仿真到现实迁移的挑战。通过提供真实机械臂在结构化环境中的交互数据,它使得模仿学习算法能够直接从人类示范或专家策略中学习,减少对昂贵试错的依赖。同时,多模态观测数据(如视觉与状态信息)的融合,促进了跨模态表示学习的研究,帮助解决动态环境下的感知与控制耦合问题,为数据驱动的机器人自主决策提供了实证基础。
衍生相关工作
围绕该数据集,衍生出多项经典研究工作,主要集中在机器人行为克隆与离线强化学习领域。例如,利用其多模态数据流,研究者开发了基于Transformer的序列建模方法,以预测机械臂的连续动作;同时,结合DAgger(数据集聚合)算法框架,该数据集被用于迭代式策略改进,减少分布漂移问题。此外,一些工作探索了从视觉观测到关节控制的端到端映射,推动了具身智能在真实场景中的部署。
以上内容由遇见数据集搜集并总结生成



