record-test

Hugging Face2026-01-29 更新2026-01-30 收录

下载链接：

https://huggingface.co/datasets/3AZZI-KHAL/record-test

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的，主要用于机器人技术领域。数据集采用Apache-2.0许可证，包含5个episodes，总计4490帧，涉及1个任务。数据以parquet文件格式存储，总数据文件大小为100MB，视频文件大小为200MB，帧率为15fps。数据集结构包括训练集（0:5）。数据路径和视频路径分别指向parquet和mp4文件。数据集特征包括动作（6个浮点型关节位置）、观察状态（6个浮点型关节位置）、观察图像（前视，480x640x3的视频帧）、时间戳、帧索引、episode索引、索引和任务索引。每个特征都有详细的数据类型、形状和名称说明。数据集缺少主页、论文和引用信息。

创建时间：

2026-01-28

原始信息汇总

数据集概述

基本信息

数据集名称: record-test
创建工具: LeRobot
许可证: Apache-2.0
任务类别: 机器人学

数据集结构

总情节数: 5
总帧数: 4490
总任务数: 1
数据块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 15 FPS
数据分割: 训练集包含所有5个情节
代码库版本: v3.0
机器人类型: so101_follower

数据文件与路径

数据文件格式: Parquet
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作

数据类型: float32
维度: [6]
特征名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测状态

数据类型: float32
维度: [6]
特征名称: 与动作特征相同

观测图像（前视）

数据类型: 视频
图像尺寸: [480, 640, 3]
维度说明: [高度, 宽度, 通道数]
视频信息:
- 高度: 480 像素
- 宽度: 640 像素
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: 否
- 帧率: 15 FPS
- 通道数: 3
- 包含音频: 否

元数据

时间戳: float32 类型，维度 [1]
帧索引: int64 类型，维度 [1]
情节索引: int64 类型，维度 [1]
索引: int64 类型，维度 [1]
任务索引: int64 类型，维度 [1]

引用信息

主页: 未提供
论文: 未提供
BibTeX 引用格式: 未提供

搜集汇总

数据集介绍

构建方式

在机器人学领域，高质量的数据集对于推动算法创新至关重要。record-test数据集依托LeRobot平台构建，通过记录真实机器人操作任务生成多模态交互数据。该数据集采用分块存储策略，将数据组织为多个Parquet文件，每个文件包含1000帧的观测与动作序列，并同步保存对应的高清视频流。数据采集过程以15帧每秒的速率捕捉机器人关节状态与前端视觉信息，确保了时序连贯性与空间一致性，为后续的离线强化学习与行为克隆研究提供了结构化基础。

使用方法

研究人员可通过LeRobot工具链或兼容的数据加载器访问此数据集，利用其标准化的Parquet格式与元数据描述进行高效读取。数据集已预划分为训练集，涵盖全部5个完整任务片段，用户可依据帧索引或分块索引灵活提取特定时段的数据。在实际应用中，该数据集适用于训练端到端的机器人操作策略、验证模仿学习算法的泛化能力，或作为仿真环境的真实数据基准。其清晰的特征定义与存储布局，使得集成至主流机器学习框架的过程更为顺畅，加速了机器人智能算法的开发与评估周期。

背景与挑战

背景概述

在机器人学习领域，高质量、大规模的真实世界交互数据对于推动模仿学习与强化学习算法的进展至关重要。record-test数据集依托LeRobot开源框架构建，专注于机械臂操作任务的数据采集。该数据集由HuggingFace社区贡献者于近期创建，旨在为机器人控制策略的端到端训练提供多模态示范数据，其核心研究问题在于如何利用视觉与状态观测序列来学习精细的机械臂运动技能。尽管规模尚属初期，但其结构化设计为研究社区探索数据驱动的机器人学习方法提供了有价值的起点。

当前挑战

该数据集致力于解决机器人模仿学习中的挑战，即如何从有限的示范中泛化出鲁棒且精确的控制策略。具体而言，挑战包括高维连续动作空间的建模、视觉观测与低维状态信息的有效融合，以及在动态环境中确保策略的稳定执行。在构建过程中，面临数据采集一致性与真实性的平衡难题，需确保机械臂状态与前端图像在时间上的精确同步，同时处理大规模视频数据的高效存储与检索。此外，示范数据的多样性与任务覆盖范围有限，可能制约学习算法的泛化能力。

常用场景

经典使用场景

在机器人学习领域，record-test数据集为模仿学习与强化学习算法的开发提供了关键支持。该数据集通过记录机械臂（如so101_follower型）在真实环境中的操作序列，包含关节位置、图像观察及时间戳等多模态数据，使得研究人员能够基于离线数据训练策略模型，模拟机器人执行抓取或跟随任务的过程，从而降低实际机器人实验的成本与风险。

解决学术问题

该数据集有效解决了机器人控制中样本效率低下与安全探索的难题。通过提供结构化、高质量的示范数据，它支持离线强化学习与行为克隆等方法的验证，使研究者能够在无需实时交互的情况下评估算法性能。这促进了机器人策略的泛化能力研究，并为多模态感知与动作规划的联合优化提供了实证基础，推动了自主机器人系统的理论进展。

实际应用

在实际应用中，record-test数据集可用于开发工业自动化或服务机器人系统。例如，基于数据中的关节运动轨迹与前端视觉信息，工程师能够训练机器人执行重复性装配任务或环境导航，提升生产线的灵活性与效率。此外，该数据集支持机器人技能的迁移学习，有助于适应不同工作场景，为智能制造与家庭辅助等领域的部署提供数据驱动解决方案。

数据集最近研究