record-test

Hugging Face2026-01-13 更新2026-01-14 收录

下载链接：

https://huggingface.co/datasets/satoshinji/record-test

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集使用LeRobot框架创建，与机器人技术相关。包含9个片段共4492帧，存储在parquet文件中。数据集包含来自两个摄像头的视频数据，具有特定的尺寸和编解码器。特征包括机器人关节位置的动作和观察数据，以及图像数据。

创建时间：

2026-01-11

原始信息汇总

数据集概述

基本信息

数据集名称: record-test
创建工具: LeRobot (https://github.com/huggingface/lerobot)
许可证: Apache-2.0
任务类别: 机器人学

数据集规模

总情节数: 9
总帧数: 4492
总任务数: 1
数据块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 30 FPS
数据划分: 训练集 (0:9)

数据结构

数据文件格式: Parquet
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作空间

特征名称: action
数据类型: float32
维度: [6]
关节位置:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测空间

状态观测

特征名称: observation.state
数据类型: float32
维度: [6]
关节位置:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

图像观测 - 相机1

特征名称: observation.images.camera1
数据类型: 视频
图像尺寸: 480×640×3
视频编码: AV1
像素格式: yuv420p
非深度图
帧率: 30 FPS
通道数: 3
无音频

图像观测 - 相机2

特征名称: observation.images.camera2
数据类型: 视频
图像尺寸: 720×1280×3
视频编码: AV1
像素格式: yuv420p
非深度图
帧率: 30 FPS
通道数: 3
无音频

元数据特征

时间戳: timestamp (float32, 维度[1])
帧索引: frame_index (int64, 维度[1])
情节索引: episode_index (int64, 维度[1])
索引: index (int64, 维度[1])
任务索引: task_index (int64, 维度[1])

技术信息

代码库版本: v3.0
机器人类型: so101_follower

引用信息

主页: 未提供
论文: 未提供
BibTeX引用: 未提供

搜集汇总

数据集介绍

构建方式

在机器人技术领域，数据集的构建往往依赖于真实的硬件交互与系统化采集流程。record-test数据集通过LeRobot平台生成，采用Apache 2.0开源协议，其数据来源于so101_follower型机器人的实际运行记录。整个数据集包含9个完整的情节，总计4492帧，以30帧每秒的速率采集，数据以分块形式存储于Parquet文件中，每块约1000帧，确保了高效的数据管理与读取。视频数据则分别以480x640和720x1280两种分辨率保存，采用AV1编码格式，兼顾了视觉信息的丰富性与存储效率。

特点

该数据集的特点体现在其多维度的数据表征与精细的结构化设计上。它整合了机器人的关节位置动作、状态观测以及双摄像头视觉信息，形成了动作、状态与图像的多模态对齐。特征字段明确标注了各数据的维度与类型，例如动作与状态均以6维浮点向量表示，而图像数据则附带详细的视频元信息，包括分辨率、编码格式与帧率。数据集采用分块存储策略，支持大规模序列数据的流畅加载，同时通过时间戳、帧索引与情节索引等字段，为时序分析与强化学习研究提供了精确的上下文关联。

使用方法

使用record-test数据集时，研究者可依据其结构化的数据路径进行灵活访问。数据文件按分块组织，可通过指定块索引与文件索引加载对应的Parquet数据，视频文件则遵循类似的目录结构。数据集适用于机器人模仿学习、行为克隆及视觉-动作映射等任务，用户能够提取关节动作序列、状态观测及同步的图像帧，以训练或评估控制策略。由于数据集已预设为训练集划分，且包含丰富的元数据，可直接用于模型训练，同时其标准化的数据格式便于与主流机器学习框架集成，加速实验迭代过程。

背景与挑战

背景概述

在机器人学习领域，高质量、大规模的真实世界交互数据对于推动模仿学习与强化学习算法的进步至关重要。record-test数据集由HuggingFace的LeRobot项目创建，旨在为机器人操作任务提供结构化的多模态演示数据。该数据集聚焦于机械臂控制，具体涉及so101_follower型号机器人，通过记录其关节位置、图像观测及时间序列信息，为研究者构建端到端的机器人策略模型提供了宝贵资源。尽管其创建时间与核心研究团队的具体信息在现有文档中尚未明确披露，但数据集本身体现了当前机器人学习社区对于可复现、标准化数据集的迫切需求，有望促进机器人技能迁移与泛化能力的研究。

当前挑战

record-test数据集所针对的核心挑战在于解决机器人模仿学习中从高维视觉观测到连续动作空间的映射难题。具体而言，数据集需支持模型理解双相机视角下的环境状态，并生成精确的六维关节控制指令，这对算法的感知与决策融合能力提出了较高要求。在构建过程中，数据采集面临诸多技术挑战，包括多传感器时序同步、大规模视频数据的高效压缩与存储，以及真实机器人操作中不可避免的噪声与偏差问题。此外，当前数据规模相对有限，仅包含9个 episodes 和 4492 帧，可能制约了复杂策略的学习与泛化性能的充分评估，扩展数据多样性与数量是未来发展的关键。

常用场景

经典使用场景

在机器人学习领域，record-test数据集以其多模态特性成为模仿学习研究的经典资源。该数据集整合了来自so101_follower机器人的关节状态、图像观测与动作指令，为算法提供了从感知到执行的完整交互轨迹。研究者通常利用这些序列化数据，训练模型学习人类演示中的策略映射，从而在无需复杂奖励设计的情况下，实现机器人行为的端到端优化。

衍生相关工作

围绕record-test数据集，已衍生出一系列专注于机器人模仿学习与离线强化学习的经典工作。这些研究通常利用其多模态轨迹数据，开发新型的行为克隆算法、逆强化学习模型或基于模型的策略优化方法。部分工作进一步探索了数据增强、跨任务迁移以及少样本适应等技术，推动了LeRobot等开源生态在机器人学习领域的工具链完善与算法基准建立。

数据集最近研究