eval_record-test
收藏Hugging Face2026-05-04 更新2026-05-05 收录
下载链接:
https://huggingface.co/datasets/GroupOneRobot/eval_record-test
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是由LeRobot创建的机器人操作数据集,采用Apache-2.0许可协议。数据集包含2个任务片段,总计1732帧数据,数据文件大小为100MB,视频文件大小为200MB。数据结构包含:6自由度机械臂关节位置信息(包括动作指令和状态观测)、前视RGB视频流(分辨率480×640,30帧/秒)以及时间戳、帧索引、片段索引等元数据字段。视频数据采用AV1编码,YUV420p像素格式。数据集适用于机器人控制、行为克隆等机器人学习任务的研究与开发。
创建时间:
2026-05-01
原始信息汇总
数据集概述
数据集名称:eval_record-test
许可证:Apache-2.0
任务类别:机器人学(Robotics)
标签:LeRobot
数据集描述
该数据集使用 LeRobot 框架创建,是一个机器人学相关的数据集。
数据集结构
- 代码库版本:v3.0
- 机器人类型:so_follower
- 总片段数:2
- 总帧数:1732
- 总任务数:1
- 块大小:1000
- 帧率:30 FPS
- 数据文件大小:100 MB
- 视频文件大小:200 MB
- 数据划分:仅包含训练集(train),索引范围为 0:2
特征(Features)
| 特征名称 | 数据类型 | 形状 | 说明 |
|---|---|---|---|
| action | float32 | [6] | 动作数据,包含6个关节位置 |
| observation.state | float32 | [6] | 观察状态,与动作相同,包含6个关节位置 |
| observation.images.front | video | [480, 640, 3] | 前置摄像头视频,分辨率480×640,3通道,AV1编码,30 FPS |
| timestamp | float32 | [1] | 时间戳 |
| frame_index | int64 | [1] | 帧索引 |
| episode_index | int64 | [1] | 片段索引 |
| index | int64 | [1] | 索引 |
| task_index | int64 | [1] | 任务索引 |
数据路径
- 数据文件:
data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet - 视频文件:
videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
引用信息
目前暂无提供 BibTeX 引用格式。
搜集汇总
数据集介绍

构建方式
eval_record-test数据集依托LeRobot框架构建,通过so_follower机器人平台采集真实操作数据生成。数据以分块形式存储,包含2个完整操作序列,共计1732帧画面,覆盖单一任务类型。构建时将动作指令与观测状态对齐,同步记录六自由度关节位置与夹爪控制信息,并以30帧/秒的采样频率同步捕获前方视野影像。所有原始数据均以Parquet格式分包存储,视频则采用AV1编码压缩为MP4文件,确保数据的高效存取与扩展性。
特点
该数据集最突出的特点在于其精密的时空对齐结构——每个时间步均包含6维动作向量、对应的6维关节状态向量以及480×640分辨率的前视视频帧,三者通过时间戳与帧索引严格对应。数据经过结构化封装,支持按序列索引快速检索完整操作片段。此外,数据集内置了训练集划分方案,并提供了元信息文件,详细记录了机器人类型、操作总数、帧率等关键统计量,便于用户快速了解数据全貌。
使用方法
用户可借助LeRobot工具库直接加载该数据集,通过指定config为default自动读取所有Parquet分片。加载后的数据以Episode形式组织,每个Episode包含连续的帧序列与对应的动作、状态及图像数据。在训练模仿学习或强化学习模型时,可便捷地按索引切片获取批量样本,并利用内置的chunks_size参数控制内存加载粒度。推荐通过Hugging Face Spaces提供的可视化平台直观浏览各序列的轨迹与影像内容,辅助理解数据分布与任务特点。
背景与挑战
背景概述
eval_record-test数据集诞生于机器人学习领域对高效数据驱动方法的迫切需求之中,由Hugging Face社区基于LeRobot框架创建,旨在为机器人操作任务的模仿学习与强化学习提供标准化测试基准。该数据集聚焦于单任务、多模态的机器人控制场景,通过记录6维关节动作序列、状态观测及前端摄像头视觉信息,为算法评估提供细粒度的运动与感知耦合数据。尽管规模较小(仅含2个示范片段、1732帧),但其结构化设计(如统一的数据分块与视频存储格式)为验证模仿学习算法在有限样本下的泛化能力奠定了重要基础,对推动低成本机器人数据采集与算法对比具有潜在影响力。
当前挑战
eval_record-test数据集所解决的领域问题聚焦于机器人操作技能的模仿学习,即如何从少量示范中高效复现复杂操作行为。其核心挑战在于:有限示范样本下(仅2个episode),算法需克服动作分布偏移与状态噪声干扰,实现策略的稳健泛化;同时,视觉观测(640x480 RGB视频)与关节状态(6维向量)的高维异质性融合,对多模态表征学习构成考验。构建过程中,该数据集面临示范一致性维护的难题,如不同轨迹间动作序列的时间对齐与机械臂末端精度的控制,此外,仅依赖单一任务(so_follower)的设计限制了跨任务迁移能力的评估,反映了小规模数据集在覆盖任务多样性上的天然局限。
常用场景
经典使用场景
在机器人学习领域,eval_record-test 数据集为模仿学习与行为克隆算法提供了标准化的测试基准。该数据集源自 LeRobot 框架,包含由 SO-100 双臂协作机器人的从臂(so_follower)在单一任务上采集的两条完整示范轨迹,共计1732帧,以30帧每秒的速度记录。每帧数据涵盖6维关节动作指令、对应本体状态观测以及来自前视摄像头的640×480 RGB图像流。这些多模态信息为训练端到端机器人操控模型、验证策略在有限示范下的泛化能力和鲁棒性提供了理想素材,尤其适合作为小样本学习或快速原型评估的初始数据集。
解决学术问题
该数据集巧妙回应了机器人学习领域中数据稀缺性与可复现性之间的核心矛盾。传统研究常因数据采集成本高昂、硬件平台差异较大而导致实验难以复现,而 eval_record-test 依托 Apache-2.0 开源许可和标准化的 Parquet 存储格式,使得研究者能够在统一基准上公平比较不同模仿学习算法(如 ACT、Diffusion Policy)的效能。其简洁的设计——仅用2条示范即可构建完整的训练-验证分割——有力地推动了对小样本模仿学习、行为表征解耦以及闭环控制的深入研究,显著降低了机器人社区进行可重复实验的门槛。
衍生相关工作
基于 eval_record-test 的范式,衍生出了一系列推动机器人学习社区发展的重要工作。LeRobot 框架的核心开发者围绕此类格式构建了从数据采集、策略训练到硬件部署的完整工具链,催生了如扩散策略(Diffusion Policy)在真实机器人上的高效实现。研究者们进一步利用类似的多模态示范数据,探索了跨机器人形态的迁移学习、基于预训练视觉表征的零样本泛化,以及面向精细操作任务的契合度评估。这些后继工作不仅验证了小样本模仿学习在 SO-100 等开源机械臂上的可行性,也为构建更大规模的共享机器人数据集(如 DROID、Open X-Embodiment)提供了极具参考价值的设计模式。
以上内容由遇见数据集搜集并总结生成



