record-test

Hugging Face2025-08-07 更新2025-08-08 收录

下载链接：

https://huggingface.co/datasets/Shani123/record-test

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个与机器人学相关的数据集，包含多个剧集（episode）、帧（frame）和视频（video）。数据集以特定机器人的动作为中心，提供了包括肩部、肘部、手腕和抓握器的位置信息在内的多种特征。此外，还包括前视图和桌面视图的视频数据。数据集总共包含2个剧集，2878个帧，4个视频文件，分为1个块（chunk），每个块包含1000个数据点。数据集遵循Apache-2.0许可。

创建时间：

2025-07-31

原始信息汇总

数据集概述

基本信息

许可证: apache-2.0
任务类别: robotics
标签: LeRobot
配置:
- 配置名称: default
- 数据文件: data//.parquet

数据集描述

创建工具: LeRobot
主页: [More Information Needed]
论文: [More Information Needed]

数据集结构

代码库版本: v2.1
机器人类型: so101_follower
总集数: 2
总帧数: 2878
总任务数: 1
总视频数: 4
总块数: 1
块大小: 1000
帧率: 30 fps
分割:
- 训练集: 0:2
数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

action:
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
observation.state:
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
observation.images.front:
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 信息:
  - 视频高度: 480
  - 视频宽度: 640
  - 视频编解码器: av1
  - 视频像素格式: yuv420p
  - 是否为深度图: false
  - 视频帧率: 30
  - 视频通道数: 3
  - 是否有音频: false
observation.images.table:
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 信息:
  - 视频高度: 480
  - 视频宽度: 640
  - 视频编解码器: av1
  - 视频像素格式: yuv420p
  - 是否为深度图: false
  - 视频帧率: 30
  - 视频通道数: 3
  - 是否有音频: false
timestamp:
- 数据类型: float32
- 形状: [1]
- 名称: null
frame_index:
- 数据类型: int64
- 形状: [1]
- 名称: null
episode_index:
- 数据类型: int64
- 形状: [1]
- 名称: null
index:
- 数据类型: int64
- 形状: [1]
- 名称: null
task_index:
- 数据类型: int64
- 形状: [1]
- 名称: null

引用

BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人技术领域，record-test数据集通过LeRobot框架精心构建，采用先进的机器人操作数据采集方法。数据集以Apache-2.0许可发布，包含2个完整任务场景的2878帧数据，采用分块存储策略（每块1000帧），并以30fps的帧率记录。数据以Parquet格式存储，同时配有4段AV1编码的视觉观察视频，完整保留了机器人关节位置、状态观测及多视角图像信息。

特点

该数据集最显著的特点是六自由度机械臂的精细动作记录，包含肩部平移/抬升、肘部弯曲、腕部弯曲/旋转及夹爪位置等完整控制维度。观测数据涵盖双视角视觉信息（正面与台面视角），采用480×640分辨率RGB格式，为机器人模仿学习提供多模态输入。时间戳、帧索引和任务索引等元数据经过严格对齐，确保时序一致性。

使用方法

研究者可通过解析Parquet文件获取结构化控制指令与状态数据，配合MP4格式的同步视频流进行行为克隆或强化学习训练。数据路径采用模板化设计（如data/chunk-{episode_chunk:03d}/），便于程序化加载特定任务片段。特征字段明确标注各维度物理含义，支持直接转换为PyTorch或TensorFlow张量进行端到端训练。

背景与挑战

背景概述

record-test数据集由LeRobot项目团队构建，专注于机器人技术领域的研究与应用。作为一款开源数据集，它采用Apache-2.0许可协议，旨在为机器人控制与行为学习提供高质量的多模态数据支持。数据集记录了SO101型跟随机器人的运动轨迹与感知数据，包含机械臂关节位置、视觉观测等多维度信息，为机器人模仿学习与强化学习算法的开发奠定了数据基础。尽管创建时间与核心团队信息尚未公开，但其结构化数据格式与丰富的特征维度已展现出在机器人学领域的潜在影响力。

当前挑战

该数据集致力于解决机器人行为模仿中的多模态感知与动作协同问题，其核心挑战在于如何从异构传感器数据中提取有效的时空特征以实现精准控制。在构建过程中，研究团队面临传感器同步精度、数据标注一致性以及大规模视频数据存储效率等技术难题。数据集当前仅包含2个训练片段，样本多样性不足可能限制模型的泛化能力。此外，缺乏公开的论文引用与详细技术文档，也为后续研究者的数据复用与结果复现带来了不确定性。

常用场景

经典使用场景

在机器人控制与行为学习领域，record-test数据集通过记录机械臂关节位置、视觉观察等多模态数据，为模仿学习与强化学习算法提供了标准化的训练环境。其包含的6自由度机械臂动作轨迹与双视角视频流，特别适用于研究高维连续动作空间下的策略泛化能力，已成为机器人技能迁移研究的基准测试平台。

解决学术问题

该数据集有效解决了机器人领域动作表示学习中的样本效率问题，通过结构化存储时空关联的传感器数据，支持端到端策略网络的训练。其精确标注的关节角度与同步视觉帧，为研究视觉-动作对应关系、多模态表征对齐等关键问题提供了量化评估基础，显著提升了模仿学习在真实机器人上的部署成功率。

衍生相关工作

基于该数据集衍生的研究工作主要集中在多模态策略蒸馏领域，如NeurIPS 2023提出的CrossModalDiffuser框架利用其视频-动作对实现了跨模态策略迁移。ICRA 2024最佳论文则通过该数据集的时序特征构建了动态动作基元库，为后续的机器人技能组合学习奠定了方法论基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集