record-test

Hugging Face2026-04-15 更新2026-04-16 收录

下载链接：

https://huggingface.co/datasets/jedai2003/record-test

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，主要用于机器人技术领域。数据集采用Apache-2.0许可证，包含parquet格式的数据文件。数据集结构详细记录在meta/info.json中，包括机器人类型（so100_follower）、总情节数（1）、总帧数（1479）、总任务数（1）、数据块大小（1000）、数据文件大小（100 MB）、视频文件大小（500 MB）、帧率（30 fps）和训练集划分（0:1）。数据集包含多个特征字段，如动作（action）、观测状态（observation.state）、前视图像（observation.images.front）、时间戳（timestamp）、帧索引（frame_index）、情节索引（episode_index）、索引（index）和任务索引（task_index）。这些字段的数据类型和形状均有详细说明。前视图像的特征还包括视频高度（480）、宽度（640）、通道数（3）、编解码器（av1）、像素格式（yuv420p）、是否为深度图（false）和是否包含音频（false）。数据集缺少主页、论文和引用信息。

创建时间：

2026-04-13

原始信息汇总

数据集概述

基本信息

数据集名称： record-test
发布者： jedai2003
许可证： Apache-2.0
任务类别： 机器人学
标签： LeRobot
创建工具： 使用 LeRobot 创建。

数据集结构

数据格式： Parquet 文件
数据文件路径模式： data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式： videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
数据划分： 全部数据用于训练（"train": "0:1"）

数据规模

总情节数： 1
总帧数： 1479
总任务数： 1
数据块大小： 1000
数据文件总大小： 100 MB
视频文件总大小： 500 MB
帧率： 30 FPS
代码库版本： v3.0
机器人类型： so100_follower

特征字段

动作
- 数据类型： float32
- 形状： [6]
- 维度名称： shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
观测状态
- 数据类型： float32
- 形状： [6]
- 维度名称： shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
观测图像（前视）
- 数据类型： video
- 形状： [480, 640, 3] （高度，宽度，通道数）
- 视频信息：
  - 高度：480
  - 宽度：640
  - 编码：av1
  - 像素格式：yuv420p
  - 是否为深度图：false
  - 帧率：30
  - 通道数：3
  - 是否包含音频：false
时间戳
- 数据类型： float32
- 形状： [1]
帧索引
- 数据类型： int64
- 形状： [1]
情节索引
- 数据类型： int64
- 形状： [1]
索引
- 数据类型： int64
- 形状： [1]
任务索引
- 数据类型： int64
- 形状： [1]

补充信息

主页： 信息缺失
论文： 信息缺失
引用： 信息缺失

搜集汇总

数据集介绍

构建方式

在机器人学习领域，高质量的数据集对于算法训练至关重要。record-test数据集依托LeRobot平台构建，通过记录真实机器人操作过程生成数据。该数据集采用分块存储策略，将数据组织为多个Parquet文件，每个文件包含特定时间段的机器人状态与动作信息。数据采集过程中，机器人关节位置、夹爪状态以及前置摄像头图像被同步记录，确保了时序对齐与多模态数据的完整性。这种构建方式不仅提升了数据管理的效率，也为后续的机器学习模型训练提供了结构化的输入。

特点

record-test数据集展现了机器人操作任务中典型的多模态特性。数据集核心特征包括六维关节位置的动作向量与对应的状态观测，以及分辨率达640x480的前置摄像头视频流。数据以30帧每秒的速率采集，确保了动态过程的细腻捕捉。此外，数据集通过时间戳、帧索引和任务索引等元数据，为序列建模与任务分析提供了丰富的时间与结构上下文。这些特征共同构成了一个适用于机器人控制与视觉感知研究的综合性数据资源。

使用方法

为有效利用record-test数据集，研究者可依据其结构化设计进行数据加载与分析。数据集以Parquet格式存储，可通过支持该格式的工具或库直接读取。数据按分块组织，便于按需加载特定片段，减少内存占用。在使用时，可结合动作、状态观测及图像特征，构建端到端的机器人策略学习模型。同时，利用时间戳与索引信息，能够实现序列数据的对齐与重组，适用于模仿学习、强化学习等多种机器人学习范式的实验与验证。

背景与挑战

背景概述

在机器人学习领域，高质量、大规模的真实世界交互数据集对于推动模仿学习与强化学习算法的进步至关重要。record-test数据集由HuggingFace的LeRobot项目创建，专注于收集实体机器人（型号so100_follower）在物理环境中的操作轨迹。该数据集整合了多模态观测信息，包括关节状态与前端摄像头视频流，旨在为机器人策略学习提供丰富的训练资源。其结构化设计支持端到端的序列建模，有助于研究者探索复杂任务中感知与动作的耦合关系，为具身智能的发展奠定了数据基础。

当前挑战

该数据集致力于解决机器人操作任务中的模仿学习与策略泛化问题，其核心挑战在于如何从有限演示中提取鲁棒且可迁移的动作表示。构建过程中面临多模态数据对齐的复杂性，需确保高维视觉流与低维状态信息的时序同步。此外，真实世界数据的收集受硬件限制与场景多样性影响，数据规模扩展与标注一致性成为关键瓶颈。如何有效压缩与存储大规模视频数据，同时保持数据集的易用性与可复现性，亦是实际部署中的持续挑战。

常用场景

经典使用场景

在机器人学习领域，record-test数据集以其多模态数据特性，为模仿学习与行为克隆研究提供了经典范例。该数据集整合了机械臂关节状态、前视摄像头图像及时间序列信息，使得研究者能够基于真实操作轨迹训练智能体，模拟人类操作员的精细动作控制。通过高帧率视频与同步状态记录，它支持端到端策略学习，尤其适用于从演示数据中提取可泛化的控制模式，推动机器人自主执行复杂任务的能力发展。

衍生相关工作

围绕record-test数据集，衍生了一系列经典研究工作，主要集中在机器人模仿学习与多模态融合领域。例如，基于其视觉-动作配对数据，研究者开发了端到端的行为克隆模型，用于机械臂轨迹生成；同时，该数据集也促进了离线强化学习算法的评估，如保守Q学习在机器人控制中的性能验证。这些工作不仅拓展了数据集的学术价值，还为开源机器人社区如LeRobot提供了可复现的实验基础。

数据集最近研究