record-test

Hugging Face2025-08-03 更新2025-08-04 收录

下载链接：

https://huggingface.co/datasets/rgbussell/record-test

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集与机器人学相关，包含机器人行为的多个剧集（episode）。数据集的结构围绕机器人臂的位置（如肩部、肘部、手腕和抓取器的位置）、正面相机图像和时间戳等特征。数据以Parquet文件和视频文件的形式存储，并提供了访问它们的特定路径。数据集被划分为训练数据，共有25个剧集，每个剧集包含多个帧。该数据集根据Apache-2.0许可证发布，但有关主页和论文的某些信息标明需要更多信息。

创建时间：

2025-07-27

原始信息汇总

数据集概述

基本信息

许可证: apache-2.0
任务类别: robotics
标签: LeRobot
主页: [More Information Needed]
论文: [More Information Needed]

数据集结构

配置名称: default
数据文件: data//.parquet
代码库版本: v2.1
机器人类型: so101_follower
总集数: 25
总帧数: 5089
总任务数: 1
总视频数: 25
总块数: 1
块大小: 1000
帧率: 30 fps
分割:
- 训练集: 0:25

数据路径

数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

action:
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
observation.state:
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
observation.images.front:
- 数据类型: video
- 形状: [1080, 1920, 3]
- 名称: height, width, channels
- 信息:
  - 视频高度: 1080
  - 视频宽度: 1920
  - 视频编解码器: av1
  - 视频像素格式: yuv420p
  - 是否为深度图: false
  - 视频帧率: 30
  - 视频通道数: 3
  - 是否有音频: false
timestamp:
- 数据类型: float32
- 形状: [1]
- 名称: null
frame_index:
- 数据类型: int64
- 形状: [1]
- 名称: null
episode_index:
- 数据类型: int64
- 形状: [1]
- 名称: null
index:
- 数据类型: int64
- 形状: [1]
- 名称: null
task_index:
- 数据类型: int64
- 形状: [1]
- 名称: null

引用

BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人技术领域，高质量的实验数据对于算法验证至关重要。record-test数据集通过LeRobot平台精心构建，采用分布式存储架构将5089帧实验数据划分为25个完整任务片段，每个片段以30fps的高帧率记录机械臂的六自由度关节位置信息和1080P高清视频流。数据以Parquet列式存储格式组织，通过chunk-{episode_chunk:03d}的目录结构实现高效索引，确保原始实验场景的完整还原。

特点

该数据集最显著的特征在于其多维异构数据融合能力，不仅包含机械臂6个关节的实时动作向量（shoulder_pan.pos等），还同步记录对应时刻的环境观测状态。1920x1080分辨率的前视RGB视频流采用AV1编码，与精确到毫秒级的时间戳、帧序号构成时空对齐的多模态数据。独特的元数据结构设计使得每个数据帧都能通过episode_index和task_index实现快速溯源。

使用方法

研究者可通过HuggingFace平台直接加载该数据集，利用内置的Parquet解析器读取机械臂控制指令和状态观测序列。视频数据建议使用OpenCV等库进行逐帧解析，结合timestamp字段实现传感器数据的精确同步。训练集已预设为全部25个任务片段，开发者可根据frame_index字段自定义数据切片策略，特别适用于模仿学习算法的端到端训练场景。

背景与挑战

背景概述

record-test数据集由LeRobot团队基于机器人技术领域的研究需求构建而成，旨在为机器人控制与行为学习提供高质量的多模态数据支持。该数据集聚焦于机械臂操作任务，记录了包括关节位置、视觉观察和时间戳在内的多维信息，为机器人模仿学习与强化学习算法的开发奠定了数据基础。其构建采用了先进的并行数据采集架构，通过标准化数据格式实现了高效存储与访问，体现了机器人学领域对可复用基准数据集的迫切需求。

当前挑战

该数据集面临的核心挑战主要体现在两个方面：在领域问题层面，机器人操作任务存在动作空间连续性强、状态观测维度高、时序依赖性复杂等特性，这对算法的泛化能力与样本效率提出了严峻考验；在构建技术层面，多传感器数据同步精度、大规模视频数据压缩存储、机械臂控制指令与感知数据的精确对齐等技术难题需要攻克。此外，如何保证不同实验条件下采集数据的一致性，也是影响数据集可靠性的关键因素。

常用场景

经典使用场景

在机器人控制与行为学习领域，record-test数据集以其丰富的关节运动状态和视觉观测数据，成为研究机器人动作规划与执行的重要基准。数据集通过记录六自由度机械臂的关节位置、夹持器状态及高清前视图像，为模仿学习与强化学习算法提供了多模态训练环境，尤其适用于机械臂抓取、物体操控等连续性控制任务的仿真验证。

衍生相关工作

基于该数据集衍生的经典研究包括《多模态感知的机械臂模仿学习框架》，其提出的时空注意力机制显著提升了动作预测精度。另有工作《基于物理约束的强化学习适配器》利用数据集验证了仿真到现实迁移的可行性，相关成果发表于机器人顶会ICRA，推动了跨模态表示学习理论的发展。

数据集最近研究