record-test

Hugging Face2026-01-27 更新2026-01-28 收录

下载链接：

https://huggingface.co/datasets/joanfox/record-test

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的，主要用于机器人技术领域。数据集采用apache-2.0许可证，包含50个episodes，总计25468帧，涉及1个任务。数据以parquet文件格式存储，总数据文件大小为100MB，视频文件大小为200MB，帧率为30fps。数据集结构包括训练集（0:50）。数据文件路径为data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet，视频文件路径为videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4。数据集包含多个特征，如动作（action）、观察状态（observation.state）、前视图像（observation.images.front）、时间戳（timestamp）、帧索引（frame_index）、episode索引（episode_index）、索引（index）和任务索引（task_index）。每个特征都有详细的数据类型、形状和名称描述。前视图像特征还包括视频高度、宽度、通道数、编解码器、像素格式、是否为深度图、帧率和是否有音频等信息。

This dataset was developed using LeRobot and is primarily targeted for robotics research and applications. It is licensed under Apache-2.0, contains 50 episodes totaling 25,468 frames, and focuses on a single task. The data is stored in Parquet format, with the total size of the data files being 100 MB, while the total size of the video files is 200 MB, and the frame rate is 30 fps. The dataset structure includes the training split with episodes ranging from 0 to 50. The data file paths are data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet, and the video file paths are videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4. The dataset includes multiple features such as action, observation.state, observation.images.front, timestamp, frame_index, episode_index, index, and task_index. Each feature has detailed descriptions of its data type, shape, and name. The front-view image feature additionally includes information such as video height, width, channel count, codec, pixel format, whether it is a depth map, frame rate, and whether audio is included.

创建时间：

2026-01-26

原始信息汇总

数据集概述

基本信息

数据集名称: record-test
创建工具: LeRobot
许可证: Apache 2.0
任务类别: 机器人学
标签: LeRobot

数据集规模

总情节数: 50
总帧数: 25468
总任务数: 1
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 30 FPS

数据组织与结构

配置名称: default
数据文件模式: data/*/*.parquet
数据路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
分块大小: 1000
代码库版本: v3.0
机器人类型: so_follower
数据划分: 训练集 (0:50)

数据特征

动作

数据类型: float32
形状: [6]
特征名: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

观测状态

数据类型: float32
形状: [6]
特征名: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

观测图像（前视）

数据类型: video
形状: [480, 640, 3]
维度名: height, width, channels
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 是否包含音频: false

元数据

时间戳: 数据类型 float32，形状 [1]
帧索引: 数据类型 int64，形状 [1]
情节索引: 数据类型 int64，形状 [1]
索引: 数据类型 int64，形状 [1]
任务索引: 数据类型 int64，形状 [1]

引用信息

主页: 信息缺失
论文: 信息缺失
BibTeX 引用: 信息缺失

搜集汇总

数据集介绍

构建方式

在机器人学习领域，高质量的数据集对于算法训练与验证至关重要。record-test数据集依托LeRobot平台构建，通过实际机器人操作采集多模态交互数据。该数据集包含50个完整任务片段，总计25468帧数据，以每秒30帧的速率记录机器人关节状态与前端视觉信息。数据以分块形式存储于Parquet文件中，每块约1000帧，便于高效读取与处理，同时配套视频文件以MP4格式保存，确保视觉信息的完整性。

特点

该数据集在机器人模仿学习与状态估计研究中展现出显著特色。其核心特征在于同步记录了六自由度机械臂的关节位置动作与对应观测状态，涵盖肩部平移、肩部抬升、肘部弯曲、腕部弯曲、腕部旋转及夹爪位置等维度。前端摄像头以480x640分辨率采集RGB图像，提供丰富的环境视觉上下文。数据集结构清晰，每帧均附带时间戳、帧索引与任务索引，支持时序分析与任务导向的学习任务。

使用方法

为充分发挥该数据集在机器人控制研究中的价值，研究者可通过LeRobot工具链便捷加载数据。数据集已预分为训练集，涵盖全部50个任务片段，用户可直接读取Parquet文件获取动作、状态与图像特征。对于视觉信息处理，配套视频文件可按帧提取，结合时间戳实现多模态对齐。该数据集适用于行为克隆、强化学习及状态表示学习等任务，其标准化格式确保与主流机器人学习框架的兼容性。

背景与挑战

背景概述

在机器人学习领域，高质量的数据集对于推动模仿学习与强化学习算法的进步至关重要。record-test数据集由LeRobot项目团队构建，旨在为机器人操作任务提供多模态交互数据。该数据集聚焦于机械臂跟随任务，包含丰富的状态观测、动作指令及视觉信息，为研究者探索端到端控制策略提供了宝贵资源。其结构化设计支持高效的数据加载与处理，有助于加速机器人智能行为的研究与部署。

当前挑战

该数据集致力于解决机器人操作中的模仿学习挑战，即如何从人类演示数据中学习鲁棒且泛化的控制策略。具体挑战包括高维动作空间的精确建模、多模态观测信息的有效融合，以及从有限演示中泛化到未见场景的能力。在构建过程中，面临数据采集的同步性与一致性难题，需确保机械臂状态、视觉流与时间戳的精准对齐；同时，大规模视频数据的存储与高效访问亦构成技术瓶颈，需平衡数据质量与存储开销。

常用场景

经典使用场景

在机器人学习领域，record-test数据集以其丰富的多模态数据为机器人模仿学习提供了经典范例。该数据集整合了机械臂的关节状态、视觉图像及时间序列信息，常用于训练端到端的策略模型，使机器人能够通过观察人类演示或自主探索来学习复杂操作任务。其结构化数据格式便于直接应用于强化学习或行为克隆算法，为机器人动作生成与轨迹规划研究奠定了坚实基础。

衍生相关工作

围绕record-test数据集，学术界衍生出一系列经典研究工作。例如，基于其多模态特性开发的跨模态预训练模型，提升了机器人对视觉-动作关联的理解；结合深度强化学习算法，研究者构建了高效的行为克隆框架，实现了从演示到自主执行的迁移。这些工作不仅拓展了数据集的利用维度，也为机器人学习社区的算法创新提供了持续动力。

数据集最近研究