five

asdl-unist/eval_1-multiple-128LR-5aug-32b-VEF-12k-3

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/asdl-unist/eval_1-multiple-128LR-5aug-32b-VEF-12k-3
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由LeRobot项目创建,是一个机器人相关数据集,主要包含机械臂的动作数据、状态观测数据和视频数据。数据集采用Apache 2.0许可证,包含10个episodes,总计11564帧数据,涉及1个任务。数据以parquet格式存储,视频数据分辨率为480x640,帧率为30fps。数据集记录了机械臂的6个关节位置(肩部平移、肩部升降、肘部弯曲、腕部弯曲、腕部旋转和夹持器位置)以及顶部和腕部摄像头的视频数据。

This dataset was created by the LeRobot project and is a robotics-related dataset containing robotic arm action data, state observation data, and video data. The dataset is licensed under Apache 2.0, includes 10 episodes with a total of 11,564 frames, and involves 1 task. Data is stored in parquet format, with video data at 480x640 resolution and 30fps. The dataset records 6 joint positions of the robotic arm (shoulder pan, shoulder lift, elbow flex, wrist flex, wrist roll, and gripper) along with video data from top and wrist cameras.
提供机构:
asdl-unist
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于LeRobot框架构建,专为机器人模仿学习任务设计。数据集包含10个完整操作回合,共计11564帧画面,所有数据均源自SO_Follower机器人平台。数据以Parquet格式存储,每1000帧构成一个数据块,并配有对应的高清视频文件。数据采集频率为30帧/秒,确保了时间维度的细粒度一致性。特征空间涵盖6维关节动作指令与对应的状态信息,同时整合了顶部及腕部两个视角的视觉观测,以640×480像素的AV1编码视频格式呈现,深度还原了机器人操作的时空细节。
特点
数据集突出的特点在于其结构化的多模态融合设计。观测空间同时包含关节角度状态与双路视觉流,为模型提供了丰富的感知上下文。动作空间采用连续值控制,覆盖6个自由度,适合进行精细操作策略的建模。数据规模经过精心裁剪,约100MB的表格数据与200MB的视频数据搭配,在保证信息量的同时降低了存储与处理门槛。所有样本按回合索引组织,便于序列化建模与轨迹级别的评估。任务单一集中,利于针对性算法验证与对比研究。
使用方法
数据集可通过LeRobot库便捷加载,调用`load_dataset`函数并指定`eval_1-multiple-128LR-5aug-32b-VEF-12k-3`名称即可获取。返回的数据对象包含完整的动作序列、状态序列以及视频帧,可直接用于模仿学习或行为克隆模型的训练与评估。开发者可按回合索引遍历,提取连续的轨迹数据;也可按帧索引采样,构建离线强化学习的经验池。视频帧以高密度时间戳对齐,支持多模态特征的联合编码。建议用户结合LeRobot提供的评测流水线,在标准化的评估协议下比较不同算法的性能表现。
背景与挑战
背景概述
该数据集为机器人模仿学习领域提供了高质量的演示数据,由LeRobot框架构建并遵循Apache-2.0许可协议开放共享。数据集聚焦于单任务精细操作场景,采用so_follower机械臂平台,记录了一组包含11564帧和10个完整回合的专家演示序列。通过高帧率(30 FPS)的顶部与腕部双视角视觉观测以及六自由度关节状态与动作数据的同步采集,为机器人学习从人类演示中提取操作策略奠定了坚实基础。尽管创建时间与研究人员未明确标注,但借助LeRobot生态系统的广泛影响力,该数据集有望推动低成本机器人操作技能迁移与泛化研究,为多模态融合的机器人学习社区提供标准化评测基准。
当前挑战
当前面临的核心挑战之一是领域问题的复杂性:机器人操作任务需要从高维视觉输入与连续动作空间中精准解耦出关键决策因素,而仅包含单一任务与有限回合(10个)的数据规模可能不足以支撑模型对未见场景的泛化能力。构建过程中的挑战则体现在数据采集的精确性与一致性上,包括机械臂重复运动产生的轨迹误差累积、多视角视频与本体感知状态之间的时空对齐难题,以及高帧率数据流在存储与处理时对系统资源的压力。此外,自动化数据清洗方法在剔除异常演示的同时如何最大化保留有效样本,也是亟需解决的关键技术瓶颈。
常用场景
经典使用场景
该数据集专为机器人模仿学习研究而设计,核心用途在于训练和评估基于视觉的操控策略。通过记录单次任务(如物体抓取或装配操作)中机械臂末端执行器的六维动作序列与同步的高清视觉信息(包括顶部和腕部摄像头视角),它为从演示中学习复杂技能提供了标准化数据。经典使用场景涵盖行为克隆、逆强化学习以及端到端策略训练,其中研究者常利用其30Hz的高时间分辨率与多模态观测信号,探索机器人如何在动态环境中精准复现专家示范动作。
解决学术问题
该数据集直面机器人学习中高成本数据采集与操作泛化性的核心挑战。它通过提供包含完整动作、关节状态及多视角视觉信息的10个短片段,为验证小样本模仿学习算法有效性提供了可控基准。学术上,它重点支持解决如下问题:如何从有限演示中解耦冗余运动模式、如何利用视觉-运动关联性提升策略鲁棒性、以及跨实体迁移的共性表示学习。其开放格式还推动了可复现性研究,减弱了对私有仿真环境的依赖。
衍生相关工作
该数据集催生了多项围绕数据效率与跨域泛化的衍生研究。例如,有工作基于其多视角视频归一化策略,提出注意力增强的行为克隆网络;亦有团队利用其6自由度动作表示,开发出结合隐式运动先验的逆动力学模型。此外,因数据包含精确时间戳与帧索引,部分学者将其作为时序对比学习基准,评估预训练视觉编码器在机器人下游任务中的迁移效果。这些成果共同推动了低成本机器人技能学习从仿真到物理世界的落地。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作