ykorkmaz/play_424
收藏Hugging Face2026-04-24 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/ykorkmaz/play_424
下载链接
链接失效反馈官方服务:
资源简介:
该数据集使用LeRobot框架创建,包含机器人任务的相关数据。数据集结构包括1个episode,1373帧,1个任务,6个视频和1个chunk。数据特征包括14维的关节动作和状态观测,以及来自多个摄像头(高分辨率、低分辨率、左右手腕摄像头)的视频数据,视频分辨率为480x640,帧率为30fps。数据集适用于涉及运动和视觉数据的机器人任务。
This dataset was created using the LeRobot framework and contains data related to robotics tasks. The dataset structure includes 1 episode, 1373 frames, 1 task, 6 videos, and 1 chunk. The features include 14-dimensional joint actions and state observations, as well as video data from multiple cameras (high-resolution, low-resolution, left and right wrist cameras) with a resolution of 480x640 and a frame rate of 30fps. The dataset is suitable for robotics tasks involving motion and visual data.
提供机构:
ykorkmaz
搜集汇总
数据集介绍

构建方式
该数据集基于LeRobot框架构建,专为机器人模仿学习研究设计。数据源自一台固定式Trossen AI机器人,通过遥操作收集了单一任务下的一段完整操作轨迹,共包含1373帧。数据集以Parquet格式存储序列化的动作与状态数据,采用分块方式组织,每个块最多容纳1000帧,便于高效加载与处理。同时,来自六个视角(包括高、低位RGB相机及其深度对应、左右腕部相机)的视频数据以AV1编码压缩为MP4文件,与时间戳、帧索引等元数据共同构成完整的多模态数据集。
特点
该数据集最显著的特点在于其多视角、多模态的丰富观测信息。机器人左右臂各七个关节的动作与状态数据均以14维浮点向量记录,命名规范直观。视觉方面,六路视频流覆盖了全局与局部视角,其中深度图像为单通道,其余为三通道RGB图像,分辨率统一为480×640像素,帧率为30FPS,满足精细动作分析需求。数据集规模虽小,但结构完整,包含训练集单次划分,非常适合作为LeRobot框架的入门教程数据或算法原型测试用例。
使用方法
数据集可通过LeRobot库直接加载使用。用户只需指定数据集路径并调用相关API,即可自动读取Parquet文件中的动作、状态序列以及对应视频帧。在模仿学习或强化学习任务中,可将'observation.state'和'observation.images'作为输入特征,'action'作为预测目标,结合时间戳与帧索引构建时序模型。此外,数据集结构清晰,便于按需提取特定视角图像或关节子集,适应不同算法的输入格式要求。
背景与挑战
背景概述
play_424数据集是由Hugging Face团队基于LeRobot框架构建的机器人操作数据集,旨在为机器人学习与模仿学习研究提供标准化、高质量的训练数据。该数据集记录了Trossen Robotics Stationary型双臂机器人执行单一任务的轨迹,包含1373帧时序数据,涵盖14维关节动作及状态信息,并配备6个视角的视觉观测(含彩色与深度图像)。作为开源机器人数据集生态的一部分,play_424遵循Apache-2.0许可,为研究人员提供了从原始传感器数据到行动指令的完整映射,推动了机器人技能学习从仿真环境向真实世界的迁移。
当前挑战
该数据集的构建与使用面临多重挑战。在领域问题层面,机器人操作任务面临高维连续动作空间与灵巧操作的泛化难题——14关节的协同控制要求模型捕捉长时序依赖,而单集数据(仅1个任务、1个片段)的规模难以支撑复杂技能的鲁棒学习。在数据集构建过程中,挑战包括:多模态数据(视觉、关节状态、时间戳)的精确同步,视频编码与深度图像的压缩保真度平衡,以及从遥操作演示到结构化parquet格式的管道标准化。此外,双臂协作中左右腕部视角的遮挡与光照变化也给特征提取带来困难。
常用场景
经典使用场景
在机器人学习领域,play_424数据集专为双臂协作任务的研究与算法验证而设计,是模仿学习和行为克隆等经典范式的重要数据根基。该数据集依托Trossen Robotics Stationary平台采集,录入了14维的关节空间状态与动作对,辅以多视角高清视觉观测,包括高、低两个固定视角及左、右腕部第一人称视角。研究者通过此数据集可训练机器人从示教数据中习得精确的关节映射策略,进而复现复杂的双臂协同操作技能。
实际应用
在实际部署中,基于play_424数据集训练的模型可赋能双臂机器人执行精细化的装配、分拣及物料搬运任务。例如,在制造业产线上,机器人能够根据视觉反馈自主调整左右机械臂的位姿,完成诸如轴承压入、电路板插件等需高度协调的工序。此外,该数据集亦适用于医疗手术辅助领域,帮助机器人从专家演示中掌握稳定持械与同步操作的技能,从而提升微创手术中动作执行的精准度与安全性。
衍生相关工作
围绕该数据集已衍生出多项开创性工作,尤其在LeRobot生态系统中催生了关于数据增强与跨平台迁移的研究。一些经典工作通过引入时序注意力机制和多模态融合架构,提升了模型在处理遮挡或光照变化时的预测稳定性。此外,基于此数据集的表征学习研究还推动了隐式动作空间建模方法的发展,使得策略能够从有限示教样本中提取更具泛化能力的特征,为后续更复杂的动态环境下的机器人自主决策奠定了理论与实验基础。
以上内容由遇见数据集搜集并总结生成



