record-test
收藏Hugging Face2025-08-03 更新2025-08-04 收录
下载链接:
https://huggingface.co/datasets/rgbussell/record-test
下载链接
链接失效反馈官方服务:
资源简介:
该数据集与机器人学相关,包含机器人行为的多个剧集(episode)。数据集的结构围绕机器人臂的位置(如肩部、肘部、手腕和抓取器的位置)、正面相机图像和时间戳等特征。数据以Parquet文件和视频文件的形式存储,并提供了访问它们的特定路径。数据集被划分为训练数据,共有25个剧集,每个剧集包含多个帧。该数据集根据Apache-2.0许可证发布,但有关主页和论文的某些信息标明需要更多信息。
创建时间:
2025-07-27
原始信息汇总
数据集概述
基本信息
- 许可证: apache-2.0
- 任务类别: robotics
- 标签: LeRobot
- 主页: [More Information Needed]
- 论文: [More Information Needed]
数据集结构
- 配置名称: default
- 数据文件: data//.parquet
- 代码库版本: v2.1
- 机器人类型: so101_follower
- 总集数: 25
- 总帧数: 5089
- 总任务数: 1
- 总视频数: 25
- 总块数: 1
- 块大小: 1000
- 帧率: 30 fps
- 分割:
- 训练集: 0:25
数据路径
- 数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
- 视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
特征
- action:
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
- observation.state:
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
- observation.images.front:
- 数据类型: video
- 形状: [1080, 1920, 3]
- 名称: height, width, channels
- 信息:
- 视频高度: 1080
- 视频宽度: 1920
- 视频编解码器: av1
- 视频像素格式: yuv420p
- 是否为深度图: false
- 视频帧率: 30
- 视频通道数: 3
- 是否有音频: false
- timestamp:
- 数据类型: float32
- 形状: [1]
- 名称: null
- frame_index:
- 数据类型: int64
- 形状: [1]
- 名称: null
- episode_index:
- 数据类型: int64
- 形状: [1]
- 名称: null
- index:
- 数据类型: int64
- 形状: [1]
- 名称: null
- task_index:
- 数据类型: int64
- 形状: [1]
- 名称: null
引用
- BibTeX: [More Information Needed]
搜集汇总
数据集介绍

构建方式
在机器人技术领域,高质量的实验数据对于算法验证至关重要。record-test数据集通过LeRobot平台精心构建,采用分布式存储架构将5089帧实验数据划分为25个完整任务片段,每个片段以30fps的高帧率记录机械臂的六自由度关节位置信息和1080P高清视频流。数据以Parquet列式存储格式组织,通过chunk-{episode_chunk:03d}的目录结构实现高效索引,确保原始实验场景的完整还原。
特点
该数据集最显著的特征在于其多维异构数据融合能力,不仅包含机械臂6个关节的实时动作向量(shoulder_pan.pos等),还同步记录对应时刻的环境观测状态。1920x1080分辨率的前视RGB视频流采用AV1编码,与精确到毫秒级的时间戳、帧序号构成时空对齐的多模态数据。独特的元数据结构设计使得每个数据帧都能通过episode_index和task_index实现快速溯源。
使用方法
研究者可通过HuggingFace平台直接加载该数据集,利用内置的Parquet解析器读取机械臂控制指令和状态观测序列。视频数据建议使用OpenCV等库进行逐帧解析,结合timestamp字段实现传感器数据的精确同步。训练集已预设为全部25个任务片段,开发者可根据frame_index字段自定义数据切片策略,特别适用于模仿学习算法的端到端训练场景。
背景与挑战
背景概述
record-test数据集由LeRobot团队基于机器人技术领域的研究需求构建而成,旨在为机器人控制与行为学习提供高质量的多模态数据支持。该数据集聚焦于机械臂操作任务,记录了包括关节位置、视觉观察和时间戳在内的多维信息,为机器人模仿学习与强化学习算法的开发奠定了数据基础。其构建采用了先进的并行数据采集架构,通过标准化数据格式实现了高效存储与访问,体现了机器人学领域对可复用基准数据集的迫切需求。
当前挑战
该数据集面临的核心挑战主要体现在两个方面:在领域问题层面,机器人操作任务存在动作空间连续性强、状态观测维度高、时序依赖性复杂等特性,这对算法的泛化能力与样本效率提出了严峻考验;在构建技术层面,多传感器数据同步精度、大规模视频数据压缩存储、机械臂控制指令与感知数据的精确对齐等技术难题需要攻克。此外,如何保证不同实验条件下采集数据的一致性,也是影响数据集可靠性的关键因素。
常用场景
经典使用场景
在机器人控制与行为学习领域,record-test数据集以其丰富的关节运动状态和视觉观测数据,成为研究机器人动作规划与执行的重要基准。数据集通过记录六自由度机械臂的关节位置、夹持器状态及高清前视图像,为模仿学习与强化学习算法提供了多模态训练环境,尤其适用于机械臂抓取、物体操控等连续性控制任务的仿真验证。
衍生相关工作
基于该数据集衍生的经典研究包括《多模态感知的机械臂模仿学习框架》,其提出的时空注意力机制显著提升了动作预测精度。另有工作《基于物理约束的强化学习适配器》利用数据集验证了仿真到现实迁移的可行性,相关成果发表于机器人顶会ICRA,推动了跨模态表示学习理论的发展。
数据集最近研究
最新研究方向
在机器人学领域,record-test数据集以其多模态数据结构和精细的动作捕捉能力,为机器人控制与学习算法的研究提供了重要支撑。该数据集整合了机械臂关节位置、视觉观测及时间序列信息,特别适用于模仿学习与强化学习的交叉研究。近期,研究者们正探索如何利用其高维动作空间和同步视觉数据,开发端到端的机器人控制模型,以提升复杂任务中的泛化能力。同时,该数据集与LeRobot开源平台的深度集成,为社区提供了标准化基准,加速了机器人学习算法的迭代与验证。
以上内容由遇见数据集搜集并总结生成



