record-test

Hugging Face2026-02-27 更新2026-02-28 收录

下载链接：

https://huggingface.co/datasets/danielwp22/record-test

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由 LeRobot 创建，主要用于机器人相关任务。数据以 parquet 格式存储，包含动作、观测状态、图像、时间戳等字段。具体字段包括：动作（shoulder_pan.pos、shoulder_lift.pos、elbow_flex.pos、wrist_flex.pos、wrist_roll.pos、gripper.pos）、观测状态（与动作字段相同）、前端图像（1080x1920x3）、时间戳、帧索引、片段索引、索引和任务索引。数据规模包括文件大小（100MB 数据文件和 200MB 视频文件）、帧率（30fps）等。数据集适用于机器人控制、动作预测等任务。

创建时间：

2026-02-22

原始信息汇总

数据集概述

基本信息

数据集名称: record-test
发布者: danielwp22
托管平台: Hugging Face
许可证: Apache-2.0
任务类别: 机器人学
相关标签: LeRobot

数据集来源

该数据集使用 LeRobot 创建。

数据集规模与结构

总情节数: 1
总帧数: 826
总任务数: 1
数据块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 30 FPS
数据分割: 训练集 (100%，索引范围: 0:1)

数据文件与路径

数据文件格式: Parquet
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

数据集包含以下特征：

动作

数据类型: float32
形状: [6]
描述: 包含6个关节的位置信息：
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测状态

数据类型: float32
形状: [6]
描述: 包含6个关节的位置信息，与动作特征相同。

观测图像（前视）

数据类型: 视频
形状: [1080, 1920, 3] (高度，宽度，通道)
视频信息:
- 高度: 1080 像素
- 宽度: 1920 像素
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: 否
- 帧率: 30 FPS
- 通道数: 3
- 包含音频: 否

元数据

时间戳: 数据类型为 float32，形状为 [1]。
帧索引: 数据类型为 int64，形状为 [1]。
情节索引: 数据类型为 int64，形状为 [1]。
索引: 数据类型为 int64，形状为 [1]。
任务索引: 数据类型为 int64，形状为 [1]。

技术信息

代码库版本: v3.0
机器人类型: so_follower

引用信息

主页: 未提供
论文: 未提供
BibTeX 引用格式: 未提供

搜集汇总

数据集介绍

构建方式

在机器人学习领域，高质量的数据集对于算法训练与评估至关重要。record-test数据集依托LeRobot平台构建，通过采集真实机器人操作过程中的多模态数据，系统性地记录了机械臂执行任务时的状态与感知信息。数据以分块形式存储于Parquet文件中，每块包含特定数量的帧序列，并辅以对应的高清视频记录，确保了数据的完整性与可追溯性。

特点

该数据集在结构设计上体现了机器人操作任务的典型特征，其核心在于同步整合了机械臂的关节状态、动作指令以及前视摄像头的高清图像流。数据字段涵盖六自由度关节位置、时间戳、帧索引及任务标识，并以1080p分辨率、30帧率的视频形式提供丰富的视觉上下文。这种多模态对齐的架构为机器人模仿学习与行为克隆研究提供了细致入微的观测基础。

使用方法

研究人员可利用该数据集进行机器人策略学习与行为分析。数据按训练划分组织，用户可通过加载Parquet文件访问状态与动作序列，并关联相应视频片段以获取视觉反馈。典型应用包括端到端控制模型训练、多模态表征学习，或作为基准测试环境验证算法在真实机器人任务上的泛化能力。数据集遵循Apache 2.0许可，支持开源社区的广泛使用与二次开发。

背景与挑战

背景概述

在机器人学习领域，高质量、大规模的数据集对于推动机器人控制与决策算法的进步至关重要。record-test数据集由LeRobot项目团队创建，该项目依托于HuggingFace社区，致力于构建开源机器人学习平台。该数据集聚焦于机器人模仿学习与强化学习任务，通过记录真实机器人（如so_follower类型）在特定环境中的交互数据，包括关节状态、视觉观测与动作指令，旨在为机器人策略学习提供丰富的多模态训练资源。其核心研究问题在于如何利用真实世界交互数据提升机器人在复杂任务中的泛化能力与鲁棒性，对推动机器人自主操作技术的发展具有潜在影响力。

当前挑战

该数据集旨在解决机器人模仿学习与策略泛化中的关键挑战，即如何从有限且高维的观测-动作对中学习稳健的控制策略。具体而言，挑战包括处理高维视觉与状态空间的表征学习、应对真实环境中的传感器噪声与动态变化，以及实现跨任务与跨场景的策略迁移。在构建过程中，面临数据采集的规模化难题，如确保机器人操作的安全性与一致性，同时需高效处理与存储大规模视频与状态序列数据，并保证数据标注与时间同步的精确性，这些因素共同构成了数据集构建的技术瓶颈。

常用场景

经典使用场景

在机器人学习领域，record-test数据集以其多模态特性为机器人模仿学习提供了典型范例。该数据集整合了机械臂的关节状态、前视摄像头图像及时间戳信息，常用于训练端到端的视觉运动策略模型。研究者能够利用这些同步记录的动作与观测数据，模拟真实世界中的操作任务，从而在仿真环境中验证算法对复杂动态场景的适应能力。

实际应用

在实际机器人部署中，record-test数据集可直接用于服务型机械臂的技能编程。例如，在家庭或工业环境中，基于该数据训练的模型能够使机器人学会抓取、放置等精细操作，降低传统示教编程的复杂度。其视频与状态同步记录的特性，也支持了远程操作与自动故障诊断系统的开发，提升了机器人在非结构化场景中的自主性。

衍生相关工作

围绕record-test数据集，已衍生出一系列关于视觉运动表示学习的经典研究。这些工作通常聚焦于改进时空特征提取架构，或利用自监督学习从视频流中预训练策略模型。部分研究进一步探索了多任务学习框架，通过共享数据集中的状态与图像表征，实现在有限数据下对多种操作技能的快速适应与泛化。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集