record-test

Hugging Face2025-09-07 更新2025-09-08 收录

下载链接：

https://huggingface.co/datasets/heyuan1993/record-test

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个用于机器人学领域的_dataset_，包含了机器人类型为so101_follower的一个任务的数据。数据集共有1671帧，分为一个视频和一个数据块，数据块大小为1000帧。数据集的采样率为30帧每秒，并提供了一种训练数据的分割方式。数据集的特征包括机器人的动作和状态，以及前视摄像头捕获的图像。所有数据存储为Parquet文件，视频文件为MP4格式。

创建时间：

2025-09-07

原始信息汇总

数据集概述

基本信息

许可证: apache-2.0
任务类别: 机器人学
标签: LeRobot

数据集结构

配置名称: default
数据文件: data//.parquet
代码库版本: v2.1
机器人类型: so101_follower
总片段数: 1
总帧数: 1671
总任务数: 1
总视频数: 1
总块数: 1
块大小: 1000
帧率: 30
分割: {"train": "0:1"}
数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征描述

action:
- 数据类型: float32
- 形状: [6]
- 名称: ["shoulder_pan.pos", "shoulder_lift.pos", "elbow_flex.pos", "wrist_flex.pos", "wrist_roll.pos", "gripper.pos"]
observation.state:
- 数据类型: float32
- 形状: [6]
- 名称: ["shoulder_pan.pos", "shoulder_lift.pos", "elbow_flex.pos", "wrist_flex.pos", "wrist_roll.pos", "gripper.pos"]
observation.images.front:
- 数据类型: video
- 形状: [1080, 1920, 3]
- 名称: ["height", "width", "channels"]
- 信息: {"video.height": 1080, "video.width": 1920, "video.codec": "av1", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "video.fps": 30, "video.channels": 3, "has_audio": false}
timestamp:
- 数据类型: float32
- 形状: [1]
- 名称: null
frame_index:
- 数据类型: int64
- 形状: [1]
- 名称: null
episode_index:
- 数据类型: int64
- 形状: [1]
- 名称: null
index:
- 数据类型: int64
- 形状: [1]
- 名称: null
task_index:
- 数据类型: int64
- 形状: [1]
- 名称: null

创建信息

创建工具: LeRobot (https://github.com/huggingface/lerobot)

引用信息

BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人技术领域，record-test数据集依托LeRobot平台构建，采用高效的数据采集与处理流程。该数据集通过so101_follower型机器人记录真实环境中的操作序列，以30帧每秒的速率捕获高分辨率视频与同步关节状态数据，并采用分块存储策略将1671帧数据整合为标准化parquet格式，确保时序一致性与存储效率。

特点

该数据集显著特点在于多模态数据的深度融合，包含六维关节动作指令、同步机器人状态观测及1080p高清前端视觉画面，形成完整的闭环交互记录。其结构化特征设计涵盖时空索引（时间戳、帧序号、任务索引等），支持精细化的轨迹分析与跨模态关联研究，为模仿学习与行为克隆提供丰富上下文。

使用方法

研究者可通过加载parquet文件直接访问多通道数据流，利用预定义的特征字段（如observation.images.front视频流及action指令序列）构建训练管道。数据集默认划分为训练集，适用于端到端策略学习、视觉运动控制等任务，同时提供标准化视频解码接口以适配主流深度学习框架。

背景与挑战

背景概述

在机器人技术迅猛发展的背景下，record-test数据集作为LeRobot项目的重要组成部分应运而生，专注于机器人行为模仿与强化学习领域的研究。该数据集由HuggingFace机构基于Apache 2.0开源协议构建，采用so101_follower型机器人采集多模态交互数据，包含1671帧高精度动作序列与同步视觉观测。其核心价值在于为机器人策略学习提供真实世界的动作-状态对应关系，通过6自由度机械臂控制与1080p前端视觉的协同记录，推动具身智能在复杂环境中的适应能力发展。

当前挑战

该数据集主要解决机器人模仿学习中动作-观测对齐与跨模态表征的挑战，具体体现在高维连续动作空间与视觉感知的时序同步精度要求。构建过程中面临多传感器数据融合的技术难题，包括机械臂关节角度与前端摄像头30fps视频帧的毫秒级同步，以及1080p高清视频流与6维动作数据的存储优化。此外，真实环境下的光照变化与机械控制噪声对数据质量构成显著影响，需通过精密校准与数据清洗保障数据集可靠性。

常用场景

经典使用场景

在机器人学习领域，record-test数据集以其高质量的多模态数据记录，为模仿学习算法的训练与验证提供了典型范例。该数据集通过整合六自由度机械臂的关节状态、前端视觉观测与时间戳信息，构建了完整的动作-状态-观测映射关系，使得研究人员能够基于真实世界交互数据开展策略学习研究。其精心设计的帧序列结构和视频流同步机制，为动态环境下的行为克隆与逆强化学习提供了标准化评估基准。

衍生相关工作

基于该数据集的特性，研究者开发了多种创新性工作，包括基于时空注意力的行为预测模型和跨模态表示学习框架。这些工作充分利用数据集提供的多模态对齐特性，实现了视觉观测到动作序列的端到端映射。部分研究团队在此基础上构建了分层强化学习架构，将高层任务规划与底层运动控制相结合。此外，该数据集还催生了多个针对真实世界机器人学习的评估基准，推动了模仿学习算法在物理系统中的标准化测试进程。

数据集最近研究