record-test

Hugging Face2026-05-09 更新2026-05-10 收录

下载链接：

https://huggingface.co/datasets/Mehul07-merai/record-test

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是通过LeRobot框架创建的机器人相关数据集，适用于机器人技术研究和应用。数据集以Apache-2.0许可证发布，包含动作和观测数据，具体包括29维的动作向量（涵盖左右手臂和手的多个关节位置及运动参数）和71维的观测状态向量（包括关节位置、速度、基座姿态等）。此外，数据集还提供前视摄像头视频观测（480x640分辨率，3通道）。数据以parquet文件格式存储，视频以mp4格式存储。数据集的结构通过meta/info.json文件详细描述，包括数据块大小、文件大小、帧率等信息。

创建时间：

2026-05-07

原始信息汇总

数据集概述：record-test

数据集地址：https://huggingface.co/datasets/Mehul07-merai/record-test
许可证：Apache-2.0
任务类别：机器人学（Robotics）
标签：LeRobot
创建工具：使用 LeRobot 创建

数据集结构

代码版本：v3.0
机器人类型：g1
总回合数：0
总帧数：0
总任务数：0
数据块大小：1000
数据文件大小：100 MB
视频文件大小：200 MB
帧率：30 FPS
数据路径：data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频路径：videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
配置文件：default，数据文件位于 data/*/*.parquet

特征字段

字段	数据类型	形状	描述
`action`	float32	(29,)	包含29个动作控制值（如肩关节、肘关节、手部关节位置及移动基座参数）
`observation.state`	float32	(71,)	包含71个机器人状态值（包括29个关节位置、29个关节速度，以及基座姿态、角速度、线速度、四元数）
`observation.images.front`	video	(480, 640, 3)	前置摄像头视频数据，分辨率480×640，彩色三通道
`timestamp`	float32	(1,)	时间戳
`frame_index`	int64	(1,)	帧索引
`episode_index`	int64	(1,)	回合索引
`index`	int64	(1,)	数据索引
`task_index`	int64	(1,)	任务索引

数据集用途

此数据集为机器人控制数据集，包含机器人关节动作、传感器状态及视频观测数据，适用于模仿学习或机器人控制任务。

搜集汇总

数据集介绍

构建方式

record-test数据集基于LeRobot框架构建，专为机器人学习任务设计。数据以Parquet格式存储于'data/*/*.parquet'路径下，并通过default配置进行加载。数据集内部结构遵循v3.0代码库规范，包含来自G1机器人的演示数据。每个演示片段被分割成大小为1000帧的chunk，并配以对应的视频文件（mp4格式）。特征涵盖多维动作指令（29维）、机器人状态观测（71维）以及来自前视摄像头的图像数据（480x640分辨率），同时记录时间戳、帧索引、片段索引等元信息。当前版本尚未包含实际演示片段（total_episodes为0），因此数据集更偏向于提供一个模版框架，便于用户根据G1机器人的运动学和感知特征填充真实数据。

特点

该数据集最显著的特点在于其面向双足人形机器人G1的精细控制需求，动作空间涵盖了双臂、双手及全身运动指令的29个自由度，观测空间则包含了29个关节的位置与速度信息，以及基座姿态、角速度、线速度和四元数等完整动力学数据。视觉感知方面，数据集收录了来自前视摄像头的视频流，支持高维度视觉-运动联合建模。借助LeRobot框架，数据集可通过HuggingFace Spaces交互式可视化界面直接预览，极大降低了数据探索门槛。此外，数据以模块化的chunk形式组织，有利于大规模分布式训练与流式加载。

使用方法

通过安装LeRobot库并加载record-test数据集，用户可利用其层次化特征结构进行模仿学习或强化学习策略训练。数据集默认配置可直接通过HuggingFace Datasets库进行加载，访问path字段中的Parquet文件与视频目录。对于动作预测任务，可将'action'特征作为回归目标，'observation.state'与'observation.images.front'构成观测输入。视频数据已预设高度、宽度及通道维度，便于直接输入卷积神经网络。由于数据集为模板框架，用户需首先调用LeRobot的数据采集API收集G1机器人的真实演示数据，并按照chunk格式组织后存入data目录，方可构建完整的训练管线。

背景与挑战

背景概述

record-test数据集由Hugging Face社区成员Mehul07-merai于近期创建，依托LeRobot框架构建，旨在服务于具身智能与机器人学习研究领域。该数据集聚焦于Unitree G1人形机器人的遥操作数据采集，核心研究问题在于如何通过多模态感知与高维动作空间的高效表征，促进机器人从人类示范中学习复杂技能。数据集包含29维动作指令（涵盖双臂、双手及运动关节）、71维状态观测（包括关节角度、速度、基座姿态与线速度）以及前视视觉图像（480×640分辨率），为模仿学习和强化学习提供了统一的数据结构。尽管当前样本量尚处初期阶段，但其规范的Parquet存储格式与LeRobot生态系统的兼容性，为后续大规模机器人行为数据集的建设奠定了基础，有望推动双足人形机器人在灵巧操作与动态运动控制领域的标准化评估。

当前挑战

record-test数据集所面对的领域挑战在于，人形机器人的高自由度运动（共29个执行器）与复杂环境交互导致的动作-状态空间指数级膨胀，使得传统模型难以泛化；同时，遥操作中人类演示数据的不一致性（如操作速度、力控制差异）加剧了策略学习的噪声敏感性。在数据构建层面，挑战体现为多源传感器（视觉、关节编码器、IMU）的时间同步问题，以及需确保30帧/秒的实时数据流与Parquet分块存储（每块1000帧）之间的无缝衔接；此外，初始阶段零样本量的统计特性暗示数据质量验证流程的缺失，且视频与表格数据的联合压缩策略（MP4视频与Parquet表格分离存储）对异构数据的高效读取提出工程化要求。

常用场景

经典使用场景

在机器人学习与灵巧操控领域，record-test数据集为研究双臂人形机器人（如Unitree G1）的精细运动控制提供了关键数据基础。其经典使用场景聚焦于模仿学习与行为克隆，研究者可利用该数据集记录的高频动作序列（30 fps）和状态观测，训练机器人复现复杂的双臂协作任务，例如同时操控双手的关节自由度（共29维动作空间，涵盖肩、肘、腕及手指多关节）并结合移动底盘的线速度与角速度，实现全身协调的灵巧操作。该数据集以25个双肩关节、4个腕部自由度及5个手指关节等细粒度动作为核心，特别适合探索多模态感知融合下的动作生成，例如将前视摄像头图像与关节状态、速度进行联合编码，从而驱动机器人执行精确抓取或装配操作。

衍生相关工作

围绕record-test数据格式与结构，机器人社区已衍生出一系列经典工作。基于其多关节角度序列，涌现了动态运动原语（DMP）的适配方法，通过将29维动作空间分解为可组合的运动基元，实现技能迁移与泛化。视觉-运动联合建模方面，研究者利用其前视图像与状态数据开发了逆强化学习算法，在缺少显式奖励函数下推导出隐含的操控意图。此外，数据集的Parquet结构化存储促进了时间序列预测模型在机器人控制中的应用，例如采用Transformer架构对动作序列进行自回归建模。值得关注的是，LeRobot生态系统的集成使得该数据成为多任务模仿学习框架的测试床，催生了基于扩散策略的动作生成模型，显著提升了动作复刻的真实性。

数据集最近研究