record-test

Hugging Face2026-02-11 更新2026-02-12 收录

下载链接：

https://huggingface.co/datasets/Geun/record-test

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的，专为机器人技术任务设计。数据集采用Apache-2.0许可，包含20个episodes，总计17,195帧，涉及1个任务。数据以parquet格式存储，总数据文件大小为100MB，视频文件大小为200MB，帧率为30fps。数据集结构包括训练集划分（0:20）。特征字段包括动作（6个浮点型关节位置）、观察状态（6个浮点型关节位置）、前端图像（480x640x3的视频帧）、时间戳、帧索引、episode索引、索引和任务索引。该数据集适用于机器人控制、行为模仿等研究。

创建时间：

2026-02-07

原始信息汇总

数据集概述

基本信息

数据集名称: record-test
创建工具: LeRobot (https://github.com/huggingface/lerobot)
许可证: Apache-2.0
任务类别: 机器人学

数据集规模与结构

总情节数: 20
总帧数: 17195
总任务数: 1
数据分块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 30 FPS
数据分割: 训练集 (0:20)
数据文件格式: Parquet
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
代码库版本: v3.0
机器人类型: so_follower

数据特征

数据集包含以下特征：

动作

数据类型: float32
形状: [6]
描述: 包含6个关节的位置信息。
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测状态

数据类型: float32
形状: [6]
描述: 包含6个关节的位置信息，与动作特征相同。
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测图像（前视）

数据类型: video
形状: [480, 640, 3] (高度, 宽度, 通道)
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 是否包含音频: false

元数据

时间戳: 数据类型为float32，形状为[1]。
帧索引: 数据类型为int64，形状为[1]。
情节索引: 数据类型为int64，形状为[1]。
索引: 数据类型为int64，形状为[1]。
任务索引: 数据类型为int64，形状为[1]。

引用信息

论文: 信息缺失
主页: 信息缺失
BibTeX引用: 信息缺失

搜集汇总

数据集介绍

构建方式

在机器人学习领域，高质量的数据集对于算法训练至关重要。record-test数据集依托LeRobot平台构建，采用结构化数据存储方式，将机器人交互过程以分块形式保存于Parquet文件中。数据采集涵盖20个完整任务片段，总计17195帧，以30帧每秒的速率记录机器人状态与视觉信息。每个数据块包含动作指令、关节位置、前端摄像头图像及时间戳等多维度特征，确保了数据的时序连贯性与完整性。

特点

该数据集在机器人控制与感知研究中展现出显著特色。其核心特征在于融合了六自由度机械臂的关节位置控制指令与同步视觉观测，前端摄像头提供480x640分辨率的RGB视频流，编码格式为AV1。数据结构设计精细，包含帧索引、任务索引与时间戳，支持高效的时间序列分析。数据以分块形式组织，每块约1000帧，兼顾存储效率与读取性能，适用于强化学习与模仿学习等算法验证。

使用方法

针对机器人行为克隆与策略学习任务，record-test数据集提供了便捷的使用途径。用户可通过LeRobot工具加载数据，直接访问Parquet文件中的动作、状态与图像字段。数据集已预设训练集划分，涵盖全部20个任务片段，支持帧级或片段级数据抽取。研究人员可结合关节位置数据与视觉观测，训练端到端控制模型，或利用时间戳信息进行轨迹分析。数据格式与常见机器学习框架兼容，便于集成至现有训练流程中。

背景与挑战

背景概述

在机器人学习领域，模仿学习与强化学习的发展亟需高质量、结构化的真实世界交互数据集作为支撑。record-test数据集应运而生，它由LeRobot项目团队构建，旨在为机器人控制策略的研究提供丰富的多模态演示数据。该数据集聚焦于机械臂操作任务，通过记录六自由度机械臂的关节状态、动作指令以及前置摄像头采集的视觉观测，构建了时序对齐的轨迹序列。其核心研究问题在于如何从人类演示中提取有效的策略表示，以推动机器人自主执行复杂操作任务的进展，对促进机器人泛化能力与样本效率的提升具有潜在影响力。

当前挑战

该数据集致力于解决机器人模仿学习中从演示到策略泛化的核心挑战，具体包括高维连续动作空间下的行为克隆稳定性、视觉观测与本体状态的跨模态对齐，以及有限演示样本下的策略迁移能力。在构建过程中，面临数据采集同步性、传感器噪声校准、大规模视频数据的高效压缩与存储，以及确保轨迹片段在时间维度上的连贯性与完整性等技术难题。这些挑战共同构成了利用该数据集进行前沿算法验证与模型训练的关键瓶颈。

常用场景

经典使用场景

在机器人学习领域，record-test数据集以其多模态特性，为模仿学习与强化学习算法提供了关键验证平台。该数据集整合了机械臂的关节状态、视觉图像及时间序列信息，典型应用于训练端到端的控制策略模型，使机器人能够从人类演示中学习复杂操作任务，如物体抓取与放置。通过模拟真实环境中的交互数据，它支持研究者评估算法在动态场景下的泛化能力与鲁棒性，成为推动自主机器人技能习得的重要资源。

实际应用

在实际机器人系统中，record-test数据集可直接用于服务机器人或工业自动化场景的技能编程。例如，基于该数据训练的模型能够引导机械臂完成精细装配、物流分拣或家庭辅助任务，降低传统编程的复杂度。其提供的真实世界交互记录，亦可用于增强仿真训练、优化机器人运动规划，并支持人机协作系统的安全性与适应性测试，推动智能机器人在医疗、制造等领域的落地应用。

衍生相关工作

围绕record-test数据集，已衍生出多项经典研究工作，主要集中在模仿学习框架的改进与多模态策略网络的设计上。例如，基于该数据集的视觉-动作映射模型，促进了时空特征提取架构的发展；同时，其时间序列结构支持了循环神经网络与Transformer在机器人控制中的创新应用。这些工作不仅提升了任务完成的准确性，还为后续大规模机器人数据集的构建与标准化提供了重要参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集