asdl-unist/eval_1-multiple-128LR-32b-12k-3
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/asdl-unist/eval_1-multiple-128LR-32b-12k-3
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由LeRobot创建,主要用于机器人技术领域。数据集包含10个episodes,共9791帧数据,涉及1个任务。数据特征包括机器人动作(6个关节位置)、观察状态(6个关节位置)、顶部和腕部摄像头图像(480x640分辨率,RGB三通道)、时间戳、帧索引、episode索引、任务索引等。数据以parquet格式存储,视频以mp4格式存储,帧率为30fps。
This dataset was created by LeRobot and is primarily used in the field of robotics. It contains 10 episodes with a total of 9791 frames, involving 1 task. The data features include robot actions (6 joint positions), observation states (6 joint positions), top and wrist camera images (480x640 resolution, RGB three channels), timestamps, frame indices, episode indices, task indices, etc. The data is stored in parquet format, videos are stored in mp4 format, with a frame rate of 30fps.
提供机构:
asdl-unist
搜集汇总
数据集介绍

构建方式
本数据集基于LeRobot框架构建,聚焦于机器人领域的模仿学习任务。数据采集自SO-Follower机器人,共包含10个完整回合(episode),总计9791帧原始数据,对应一个单一操作任务。全部数据以30帧每秒的帧率记录,原始数据以Parquet格式存储于data目录下的分块文件中,而视觉信息则以AV1编码的MP4视频文件保存于videos目录中。数据集提供了一个标准训练集划分(train),涵盖全部10个回合,确保了数据划分的简洁性与完整性。
特点
该数据集的一个显著特点在于其多模态融合的架构。它同时收录了六维机器人关节动作指令(action)与观测状态(observation.state),二者均涵盖肩部、肘部、腕部及夹爪的位姿信息。此外,数据集包含两个视觉模态——顶部摄像头与腕部摄像头,提供的640×480像素的RGB图像序列,具备AV1编解码格式与30帧/秒的高帧率,为模仿学习提供了丰富的环境感知与末端执行器视角信息。每个样本还附有时间戳、帧索引及回合索引等元数据,支持细粒度的时序分析。
使用方法
使用该数据集时,研究者可借助LeRobot库(来自HuggingFace)直接加载与管理数据,无需手动处理底层存储格式。利用meta/info.json中的特征定义,可以轻松访问机器人的动作和观测状态,并调用对应的视频数据进行视觉编码。数据集支持按回合(episode)与帧(frame)索引进行遍历,适用于策略学习中的序列建模与行为克隆。对于基于视觉的模仿学习任务,顶部与腕部图像的同步回放为构建端到端控制策略提供了理想的训练素材。
背景与挑战
背景概述
该数据集依托于LeRobot框架构建,由Hugging Face团队主导开发,其名称中的“eval_1-multiple-128LR-32b-12k-3”暗示了实验参数与评估场景的复杂性。数据集聚焦于机器人灵巧操作领域,核心研究问题在于如何通过多模态数据(包括6维关节状态与双视角视觉流)驱动仿人机械臂(so_follower型)完成精确的模仿学习任务。数据集包含10个示范片段、近万帧高频采样(30fps)数据,其结构化的特征空间(动作、状态、图像、时间戳等)为端到端机器人学习算法提供了标准化的训练与评估基座。作为开源社区的重要资源,该数据集填补了低成本、高可控性机器人操作数据集的空白,推动了模仿学习与强化学习在真实机器人平台上的交叉验证。
当前挑战
当前该数据集面临的挑战主要体现在两个层面。领域问题层面,机器人操作任务固有的高维连续动作空间(6自由度)与环境动态性使得模型泛化成为瓶颈,数据集仅包含单一任务与10个示范片段,难以覆盖物体姿态、初始条件等变量的自然变异,易导致过拟合;数据利用效率低,如何从有限示范中提取通用动作基元仍是核心难题。构建过程层面,数据采集依赖人工遥操作与物理机器人实时运行,成本高昂且重复性劳动易引入轨迹噪声;视频编码采用AV1格式虽压缩率高,却增加了解码计算负担;此外,元信息中未提供深度图、力反馈等模态,限制了多传感器融合方法的探索空间。
常用场景
经典使用场景
在机器人学习领域,该数据集专为模仿学习与行为克隆任务设计。依托LeRobot框架,它记录了SO-Follower机械臂在单一任务下10个完整示教回合的高频时序数据,包含6维关节空间的动作与状态观测,以及顶部与腕部双摄像头提供的30帧每秒视觉流。研究者可利用此数据训练策略网络,实现从视觉输入到本体感受动作的直接映射,是验证端到端机器人操控范式的理想基准。
衍生相关工作
该数据集的工作模式启发了多个方向的研究延伸。基于其结构,衍生出面向跨任务迁移学习的元学习框架,以及利用视频重建进行域随机化的数据增强策略。相关经典工作包括:利用该数据格式验证了对抗性扰动对策略鲁棒性的影响,以及开发基于扩散策略的通用动作生成器。这些成果均以该数据集的标准化特征定义(如“观察.图像.顶部”字段)为起点,构建了从示范收集到模型迭代的完整生态闭环。
数据集最近研究
最新研究方向
基于LeRobot框架的机器人模仿学习数据集构建与多视角视觉-动作联合建模成为前沿焦点。该数据集采用so_follower机器人平台,采集了10个完整回合、近万帧包含肩臂与夹爪6维关节运动状态的高频数据(30fps),并同步记录了640×480分辨率的顶部与腕部双视角视频流。在当前具身智能热潮中,此类小样本、多模态的精细操控数据集正推动着从传统示教编程向数据驱动的行为克隆范式跃迁。结合AV1视频压缩与parquet高效存储,该数据集为研究视觉-动作协变关系、攻克少样本泛化难题提供了标准化验证床,其意义在于加速低成本机器人规模化落地与通用操作技能的涌现。
以上内容由遇见数据集搜集并总结生成



