hovak101/record-test
收藏Hugging Face2026-04-25 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/hovak101/record-test
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由LeRobot创建,属于机器人领域。数据集包含50个episodes,23961帧,1个任务。数据文件占用100MB存储空间,视频文件占用200MB存储空间。数据集的特征包括动作(6个浮点数表示的关节位置)、观测状态(同样6个浮点数表示的关节位置)、图像(顶部和正面视角,480x640分辨率,3通道,30fps)、时间戳、帧索引、episode索引等。数据集的帧率为30fps,采用Apache 2.0许可证。
This dataset was created using LeRobot and belongs to the robotics domain. It contains 50 episodes, 23961 frames, and 1 task. The data files occupy 100MB of storage space, while the video files occupy 200MB. The dataset features include actions (6 float32 numbers representing joint positions), observation states (same 6 float32 numbers representing joint positions), images (top and front views, 480x640 resolution, 3 channels, 30fps), timestamps, frame indices, episode indices, etc. The dataset has a frame rate of 30fps and is licensed under Apache 2.0.
提供机构:
hovak101
搜集汇总
数据集介绍

构建方式
该数据集依托于LeRobot框架构建,专为机器人模仿学习研究设计。数据采集自名为'so_follower'的机器人平台,共收录100个示范回合,涵盖53,599帧时序数据。所有数据以分块方式存储于parquet文件中,视频则采用H.264编码压缩为MP4格式,通过高清视觉与关节状态信息的同步记录,实现了对机器人操作过程的完整复现。
特点
数据集的一个显著特色在于其多模态时序数据的耦合结构。每个时间步均包含6自由度关节角度所构成的动作指令与状态观测,以及来自顶置与前向两个视角的480×640分辨率彩色视频流。这种设计使得智能体能够同时从本体感觉与视觉反馈中学习操作策略。此外,30帧每秒的采样频率确保了动作执行的精细程度,为高频控制任务提供了理想的数据基础。
使用方法
数据集在HuggingFace平台上通过LeRobot库提供便捷的访问接口。研究人员可直接使用内置可视化工具浏览数据内容,或通过配置文件中定义的训练集划分(前100回合全部用于训练)快速加载数据。建议将parquet格式的时序数据与对应视频帧进行对齐解析,以构建适用于模仿学习或行为克隆模型的训练管线,利用'action'字段与'observation.state'的对应关系监督策略网络的学习过程。
背景与挑战
背景概述
record-test数据集诞生于机器人学习领域对高质量、标准化示范数据日益增长的迫切需求。由数据科学家hovak101基于LeRobot框架创建,该数据集旨在为机器人操作技能学习提供可复现的训练基准。数据集收录了100个示范轨迹,共计53,599帧,涵盖了单任务场景下六自由度机械臂的精细操作。通过整合高帧率视频与关节状态信息,record-test为模仿学习与行为克隆算法提供了多模态输入,弥补了现有机器人数据集在标准化采集协议与细粒度动作标注方面的不足,对推动机器人操作技能的迁移学习与性能评估具有重要参考价值。
当前挑战
当前机器人学习面临的核心挑战在于如何从有限的示范数据中泛化出鲁棒的操作策略。record-test数据集仅包含单任务、6个自由度的动作空间,难以覆盖现实环境中物体几何、摩擦力、光照等动态变化。构建过程中,数据采集依赖于人工遥操作演示,不仅耗时且易引入操作者偏好偏差。此外,视频数据采用H.264压缩格式,可能丢失高频运动细节。如何在不增加采集成本的前提下,通过数据增强、域随机化或时序建模等手段提升数据集对复杂场景的适应性,仍是亟待解决的问题。
常用场景
经典使用场景
在机器人学习领域,record-test数据集凭借其精细化的数据采集与标准化格式,成为模仿学习与行为克隆研究的理想基准。该数据集记录了SO Follower机械臂在单任务场景下的100个完整演示回合,涵盖6自由度关节位置指令及对应的高清视觉观测数据。其典型应用在于训练深度神经网络,使机器人从专家演示中直接学习动作映射策略,例如通过端到端的卷积-循环网络模型将视觉输入与关节控制指令关联,从而复现复杂的抓取与操作行为。该数据集的低层级控制信号与多视角视频流(顶部和前方摄像头)的结合,为探索状态表征学习与跨视角泛化提供了宝贵资源。
衍生相关工作
该数据集催生了一系列围绕数据增强与领域泛化的研究工作,例如基于扩散策略的轨迹生成模型从record-test的数据分布中学习去噪过程,从而合成多样化演示以弥补小样本学习的局限性。在表征学习方面,有学者利用其多视角图像特征对比预训练视觉编码器,显著提升了跨任务迁移的性能。针对数据效率问题,时间对比网络与逆动力学模型的设计也借鉴了该数据集的时序结构。此外,基于租赁生态系统的标准格式,record-test被纳入LeRobot协作框架,作为评估各类离线策略基线(如IQL、TD3-BC)的核心指标之一,推动了机器人社区数据与模型复现的标准化进程。
数据集最近研究
最新研究方向
record-test数据集作为基于LeRobot框架生成的机器人操作示例集,聚焦于模仿学习与数据驱动控制的前沿探索。该数据集包含100条演示轨迹,记录了so_follower机械臂的六自由度关节状态和动作,并辅以双目视觉观测,为端到端策略学习奠定了标准化数据基础。当前,机器人学界正围绕大规模示范数据如何泛化至复杂任务展开热议,该数据集凭借其规范的parquet与视频存储结构,成为验证行为克隆、逆强化学习等算法的理想基准。通过将真实操作过程转化为可复现的数值与图像序列,它呼应了非结构化环境中机器人自主学习的热潮,加速了从实验室场景到工业应用的迁移节奏。
以上内容由遇见数据集搜集并总结生成



