record-test

Hugging Face2025-07-16 更新2025-07-17 收录

下载链接：

https://huggingface.co/datasets/sunsettttt/record-test

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集使用LeRobot创建，包含机器人操作的相关数据。数据集采用Apache-2.0许可证。数据集的结构包括3个总剧集，1825个总帧数，1个总任务，6个总视频和1个总块，块大小为1000。每秒帧数（fps）为30，训练集划分从0到3。数据集包含多种特征，如动作和观察状态，以及两个视频图像，视频分辨率为720x1280，使用av1编解码器，没有音频。

创建时间：

2025-07-14

原始信息汇总

数据集概述

基本信息

许可证: apache-2.0
任务类别: robotics
标签: LeRobot
配置:
- 默认配置: data//.parquet

数据集描述

创建工具: LeRobot
主页: [More Information Needed]
论文: [More Information Needed]

数据集结构

代码库版本: v2.1
机器人类型: so101_follower
总集数: 3
总帧数: 1825
总任务数: 1
总视频数: 6
总块数: 1
块大小: 1000
帧率: 30
拆分:
- 训练集: 0:3
数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

action:
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
observation.state:
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
observation.images.OBS_IMAGE_1:
- 数据类型: video
- 形状: [720, 1280, 3]
- 名称: height, width, channels
- 信息:
  - 视频高度: 720
  - 视频宽度: 1280
  - 视频编解码器: av1
  - 视频像素格式: yuv420p
  - 是否为深度图: false
  - 视频帧率: 30
  - 视频通道数: 3
  - 是否有音频: false
observation.images.OBS_IMAGE_2:
- 数据类型: video
- 形状: [720, 1280, 3]
- 名称: height, width, channels
- 信息:
  - 视频高度: 720
  - 视频宽度: 1280
  - 视频编解码器: av1
  - 视频像素格式: yuv420p
  - 是否为深度图: false
  - 视频帧率: 30
  - 视频通道数: 3
  - 是否有音频: false
timestamp:
- 数据类型: float32
- 形状: [1]
- 名称: null
frame_index:
- 数据类型: int64
- 形状: [1]
- 名称: null
episode_index:
- 数据类型: int64
- 形状: [1]
- 名称: null
index:
- 数据类型: int64
- 形状: [1]
- 名称: null
task_index:
- 数据类型: int64
- 形状: [1]
- 名称: null

引用

BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人技术领域，高质量数据集的构建对算法训练至关重要。record-test数据集通过LeRobot平台采集，采用so101_follower型机器人执行任务，以30fps的采样频率记录多模态数据。数据以分块方式存储于parquet格式文件中，包含5个完整交互片段，总计942帧时序数据，确保动作与观测状态的精确同步。

特点

该数据集突出表现为多模态融合特性，同时包含六维关节空间的动作向量与观测状态向量，并配备双视角720p彩色视频流。数据结构采用分层命名体系，明确标注关节位姿、时间戳及帧索引等信息。所有视频均采用AV1编解码技术存储，在保证视觉质量的同时显著降低存储开销，适用于实时控制系统研究。

使用方法

研究者可通过解析parquet文件获取结构化数据，利用帧索引实现动作-观测对齐。视频数据支持直接加载为视觉输入，而六维动作向量可直接用于策略网络训练。数据集默认划分为训练集，包含全部5个交互片段，适用于模仿学习与行为克隆等任务，可通过LeRobot生态工具链实现端到端 pipeline 构建。

背景与挑战

背景概述

机器人学习领域近年来对高质量示范数据的需求日益增长，record-test数据集应运而生。该数据集由LeRobot团队基于Apache 2.0许可证构建，专门面向so101_follower型机器人系统。其核心研究问题聚焦于多模态机器人控制，通过整合关节状态观测与双视角视觉输入，为模仿学习与强化学习算法提供丰富的训练样本。数据集包含5个完整 episodes 共942帧数据，以30fps的采样频率精确记录机械臂的6自由度动作轨迹与对应环境状态，为机器人技能迁移研究提供了重要基础。

当前挑战

该数据集主要解决机器人视觉运动控制中的动作-观测对齐难题，其构建面临多重技术挑战。多传感器时序同步要求毫米级精度，双路720p视频流与关节状态数据需严格对齐。高维动作空间的连续控制策略学习存在维度灾难问题，6自由度机械臂的精确位姿控制需要大量多样化示范。数据采集过程中还需克服机械系统延迟、视觉遮挡以及环境光照变化等干扰因素，确保示范数据的准确性与一致性。

常用场景

经典使用场景

在机器人学习领域，record-test数据集通过记录六自由度机械臂的关节角度与双视角视觉观测，为模仿学习算法提供多模态训练数据。研究者可基于该数据集构建从视觉输入到动作输出的端到端映射模型，典型应用于机械臂轨迹复现与动作预测任务。其时序连续的帧序列结构特别适合训练循环神经网络或时空卷积模型，以捕捉动态操作过程中的状态演变规律。

衍生相关工作

基于此类机器人操作数据集，研究者已开发出多种深度模仿学习架构，如行为克隆模型与逆强化学习框架。LeRobot项目团队进一步扩展了多任务学习范式，衍生出基于时空注意力机制的动作预测网络。相关成果推动了机器人操作知识迁移研究，为跨任务技能泛化、少样本操作学习等方向提供了基准测试平台。

数据集最近研究