thomas0829/eval_depi_fork_plate
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/thomas0829/eval_depi_fork_plate
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个机器人技术相关的数据集,使用LeRobot创建,包含15个episodes,35313帧数据,30个视频,1个任务。数据以parquet格式存储,视频以mp4格式存储。数据集包含动作数据(6个浮点数)、观察状态(6个浮点数)、顶部和腕部摄像头图像(480x640x3的视频数据)、时间戳、帧索引、episode索引等信息。
This dataset is related to robotics and was created using LeRobot. It includes 15 episodes, 35313 frames, 30 videos, and 1 task. The data is stored in parquet format, and videos are stored in mp4 format. The dataset contains action data (6 floats), observation states (6 floats), top and wrist camera images (video data of 480x640x3), timestamps, frame indices, episode indices, etc.
提供机构:
thomas0829
搜集汇总
数据集介绍

构建方式
eval_depi_fork_plate数据集是基于LeRobot框架构建的机器人操作数据集,旨在为机械臂的精细操控任务提供标准化训练与评估资源。该数据集采集自so100型机器人平台,共包含15个完整示范片段(episode),累计35313帧时序数据,帧率固定为30帧/秒。所有数据以Parquet格式存储于分块文件中,视频流则采用AV1编码的MP4格式保存。数据集涵盖单一任务类型,训练集划分采用0至15号片段的全部数据,确保示范过程的一致性与完整性。每个时间步均记录6维关节动作指令(action)与对应的6维状态观测(observation.state),同时提供来自顶部与腕部两个视角的RGB视频图像(分辨率480x640),为多模态学习提供支撑。
特点
该数据集在结构设计上展现出高度的规范性与实用性。其核心特点在于严格对齐的动作与状态空间:动作向量与状态向量均包含6个维度,分别对应机械臂的肩部旋转、肩部抬升、肘部弯曲、腕部弯曲、腕部回转及夹爪开合,便于实现模仿学习中的直接状态-动作映射。双视角视觉输入(顶部全局视角与腕部近端视角)弥补了单一视角的观测盲区,尤其适用于精细化的物体操作任务。此外,数据集保留了完整的时序索引(frame_index、episode_index、timestamp)与任务标签(task_index),为离线强化学习、行为克隆及序列建模研究提供了清晰的时空关联结构。数据以30Hz的高采样频率记录,确保了动态过程的高保真捕获。
使用方法
借助LeRobot生态,该数据集可轻松加载至主流深度学习框架中。用户可通过LeRobot的dataset API直接读取Parquet文件与对应视频帧,返回标准化字典结构,包含'action'、'observation.state'及'observation.images.top'和'observation.images.wrist'等键值。推荐的使用流程包括:首先利用lerobot.common.datasets.load_dataset函数加载整个数据集,随后根据实际需求提取连续片段或随机采样帧进行模型训练。对于模仿学习任务,可将(图像+状态)作为输入、动作作为监督目标;对于强化学习,则可利用环境状态转换与奖励信号构建仿真闭环。由于数据集已预分块并配备元信息文件(meta/info.json),用户亦可通过调整chunks_size参数控制内存占用,适应不同规模的计算设备。
背景与挑战
背景概述
该数据集由LeRobot平台创建,围绕SO100型机器人展开,专注于机器人操作任务的模仿学习研究。数据集于近期发布,旨在为机器人从人类演示中学习精细操作技能提供标准化训练资源。核心研究问题在于如何利用有限的演示数据,使机器人掌握诸如叉取盘子等日常任务的精确动作序列。通过记录6自由度的关节状态、动作指令以及双视角视频流,该数据集为机器人学习算法提供了丰富的多模态观测信息,对推动低成本机器人平台上的行为克隆和强化学习研究具有潜在影响力。
当前挑战
在该领域,主要挑战在于克服从少量演示中泛化至新场景的困难,以及处理高维视觉和动作空间下的策略学习问题。具体而言,仅包含15个演示片段的规模限制了模型对复杂任务变体的适应能力,且单任务设定难以评估算法的多任务迁移性能。构建过程中,挑战包括精确同步多种传感器数据流、确保视频与状态信息的时间对齐,以及在不同环境光照条件下保持视觉观测的一致性。此外,机器人硬件固有的噪声和误差也增加了数据采集与标注的难度。
常用场景
经典使用场景
在机器人学习与操作领域,eval_depi_fork_plate数据集为基于视觉的机械臂精细操作任务提供了理想的训练与评估平台。该数据集利用SO100型机器人,采集了15个完整回合、超过35000帧的高质量数据,涵盖顶部与腕部双视角视频流以及六维关节动作指令。其典型使用场景聚焦于机器人从示教数据中学习如何执行叉取餐盘这一精密动作,通过模仿学习或强化学习方法,使机械臂能够自主完成对餐盘的稳定叉取与转移。数据集中state与action的对齐关系、高帧率(30fps)的时序信息,为端到端策略网络的训练奠定了坚实基础。
衍生相关工作
基于eval_depi_fork_plate数据集,学术社区已衍生出多项具有影响力的研究工作。其中,利用该数据集训练的模仿学习模型被用于对比不同策略表征(如高斯混合模型、扩散策略)在精细操作任务上的性能差异。部分工作进一步将其与仿真环境的迁移学习相结合,探索Sim-to-Real策略中的域随机化技术。此外,该数据集的公开不仅催生了针对叉取动作的专用抓取规划算法,还促使研究者开发新的数据增强方法以提升模型对未见物体姿态的泛化能力。这些衍生工作共同推动了机器人操作领域中数据集标准化与算法可复现性的进步。
数据集最近研究
最新研究方向
在机器人学习与具身智能的前沿领域,eval_depi_fork_plate数据集以SO100机械臂为平台,聚焦于餐具夹取与摆放这一精细化操作任务。该数据集收录了15个演示片段、逾3.5万帧高帧率视觉与运动轨迹数据,涵盖顶部与腕部双视角视频流及六自由度关节状态与动作序列,为模仿学习、行为克隆及视觉-运动策略的跨模态对齐研究提供了高保真样本。其采用Apache-2.0开源协议并依托LeRobot标准化框架发布,契合了当前机器人领域对可复现基准与低成本数据采集方案的热切需求,尤其推动了面向复杂非结构化环境的泛化操作策略探索。该数据集的发布不仅为细粒度灵巧操作任务建立了一个量化评估标尺,更通过与社区共享真实机器人交互数据,助力弥合仿真到现实迁移的鸿沟,对家庭服务与工业辅助等场景下的自主决策研究具有深远意义。
以上内容由遇见数据集搜集并总结生成



