Tamanenishiki/record-0430v1
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/Tamanenishiki/record-0430v1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是使用LeRobot创建的机器人数据集。它包含机器人关节位置、速度、扭矩以及前置摄像头图像等特征。数据集结构包括2个episodes、2686帧、1个任务,数据文件大小为100MB,视频文件大小为200MB,帧率为30fps。数据格式为Parquet,视频格式为MP4。数据集采用Apache 2.0许可证。
This dataset is a robotics dataset created using LeRobot. It includes features related to robot joint positions, velocities, torques, and images from a front camera. The dataset structure consists of 2 episodes, 2686 frames, 1 task, with data files size of 100MB and video files size of 200MB, at 30fps. The data format is Parquet, and the video format is MP4. The dataset is licensed under Apache 2.0.
提供机构:
Tamanenishiki
搜集汇总
数据集介绍

构建方式
在机器人学习领域,高质量的数据集对于培养机器人的操作能力至关重要。record-0430v1数据集依托LeRobot框架构建,旨在为双臂机器人操控任务提供标准化数据资源。该数据集通过操作BiOpenArmFollower型双臂机器人进行单任务示范采集而成,共包含2个完整轨迹(episode)和2686帧时序数据,采样频率为30帧/秒。数据以Parquet格式存储底层物理量,同时将前视摄像头录制的H.264编码视频以独立MP4文件保存,实现了结构化数据与视觉信息的协同存储。数据集已预先划分为训练集,并采用分块(chunk)与文件编号机制组织数据路径,便于进行大规模并行加载与索引。
特点
该数据集的核心特点在于其精细化的双臂操控信息结构。动作(action)与观测状态(observation.state)均包含48维浮点向量,完整覆盖左右各7个关节的位置、速度、扭矩以及夹爪的三元状态,提供了挖掘机器人动力学特性的丰富维度。视觉观测通过单目前视640×480像素的RGB视频流实现,在30帧/秒的采样下捕捉动态交互细节。数据集还规范地表征了时间戳、帧索引、轨迹索引等辅助字段,配合总帧数达2686帧的规模,兼顾了数据质量与小体积样本的复用灵活性。
使用方法
使用record-0430v1数据集时,研究者可借助LeRobot库加载Parquet数据与对应视频文件,按需重构状态-动作序列进行模仿学习或强化学习训练。数据集中动作与观测状态特征维度一致,便于直接在状态空间上进行策略推导或构建端到端的视觉-运动控制模型。用户可通过Hugging Face Spaces提供的可视化工具直观浏览轨迹回放,验证数据质量。由于数据集仅包含单一任务、2条轨迹,更适合用于算法验证与原型开发的快速迭代,大规模训练则需在此基础上扩增数据容量。
背景与挑战
背景概述
机器人学习领域长期受困于数据采集成本高、多样性不足等瓶颈,缺乏标准化、可复现的高质量数据集成为制约该领域发展的关键因素。在此背景下,由Hugging Face社区主导,依托其LeRobot框架构建的record-0430v1数据集于近期发布。该数据集聚焦于双臂协作机器人操作任务,具体针对Tamanenishiki团队部署的bi_openarm_follower型号机器人,记录了2个完整操作回合、总计2686帧的高频运动数据,包含前视摄像头视觉观测、48维关节与夹爪状态及动作序列。数据集采用Apache-2.0许可协议,为机器人模仿学习、运动规划与策略泛化研究提供了标准化基准,其双机械臂多模态数据特性有望推动精细化操作技能的迁移研究。
当前挑战
record-0430v1数据集所解决的领域问题核心在于双臂机器人操作的模仿学习与行为克隆——传统方法依赖手工设计的运动规划器,难以应对复杂非结构化环境中的多关节协同控制。具体挑战包括:1) 高维动作空间导致的样本低效问题,48维动作向量需在有限演示中捕捉冗余关节间的耦合关系;2) 视觉-运动域的异构模态对齐,30fps的前视图像流与高频运动数据间的时序同步存在误差累积风险;3) 数据集规模限制,仅2个回合的演示难以覆盖任务空间的全分布,模型易过拟合于单一操作模式;4) 构建过程中LeRobot框架的数据格式标准化带来挑战,需确保parquet分块存储与H.264视频编码在不同硬件平台上的无损回溯一致性。
常用场景
经典使用场景
在机器人学领域,record-0430v1数据集为双机械臂操作任务的学习与仿真提供了宝贵的资源。该数据集基于Bi-OpenArm Follower机器人平台,记录了2个完整情节、2686帧的高精度运动数据,涵盖左右各7个关节的位置、速度与力矩信息,以及夹爪状态和前置摄像头图像。其最经典的使用场景在于训练模仿学习与强化学习模型,使机器人能通过观察专家演示来复制复杂的双臂协调动作,如装配、搬运或操作物体。研究者可借助LeRobot框架,轻松加载这些结构化的动作与观测数据,构建端到端的策略网络。
实际应用
在实际应用中,record-0430v1数据集赋能工业与服务机器人实现自主技能迁移。例如,在智能制造场景中,机器人可通过学习本数据集中的力矩与位置曲线,精确执行电路板插件或零件分拣等精密操作。在医疗辅助领域,数据集中的双目观测与关节数据可帮助机器人模拟护理人员的轻柔抓取动作。此外,该数据集的标准化格式便于部署于真实硬件,缩短从模拟到现实的迁移周期,降低调试成本,加速人机协作任务的落地。
衍生相关工作
该数据集衍生了多项经典工作,包括基于预训练视觉-运动表征的迁移学习方法,以及利用扩散策略生成平滑动作序列的框架。研究者曾借鉴其数据格式,扩展至多任务元学习场景,验证了动态力矩约束下的泛化能力。同时,该数据集催生了针对双臂避碰与阻抗控制的行为克隆评估基准,相关论文在机器人顶会中探讨了数据量对策略鲁棒性的影响。此外,LeRobot社区基于此数据集开发了标准化训练管线,推动了开放性模仿学习研究的可复现性。
以上内容由遇见数据集搜集并总结生成



