record-test
收藏Hugging Face2026-04-02 更新2026-04-03 收录
下载链接:
https://huggingface.co/datasets/Axo33/record-test
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由LeRobot创建,专为机器人学应用设计。数据集包含50个episodes,共计19420帧,数据以parquet文件格式存储,总大小为100MB,视频文件总大小为200MB。数据帧率为30fps,所有数据均用于训练。数据集包含多个字段,包括动作(6个关节位置)、观测状态(6个关节位置)、前端图像观测(480x640x3的视频帧)、时间戳、帧索引、episode索引和任务索引。图像数据采用av1编解码器,无音频。该数据集适用于机器人控制、行为克隆等任务。
创建时间:
2026-03-19
原始信息汇总
数据集概述
基本信息
- 数据集名称: record-test
- 发布者: Axo33
- 许可证: Apache-2.0
- 任务类别: 机器人学
- 相关标签: LeRobot
数据集描述
- 创建工具: 该数据集使用 LeRobot 创建。
- 主页: 信息缺失
- 论文: 信息缺失
数据集结构
总体统计
- 代码库版本: v3.0
- 机器人类型: so_follower
- 总情节数: 50
- 总帧数: 19420
- 总任务数: 1
- 数据块大小: 1000
- 数据文件总大小: 100 MB
- 视频文件总大小: 200 MB
- 帧率: 30 FPS
数据划分
- 训练集: 包含所有50个情节(索引范围:0:50)
文件路径格式
- 数据文件路径:
data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet - 视频文件路径:
videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
数据特征
数据集包含以下特征:
动作
- 数据类型: float32
- 形状: [6]
- 名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos
观测状态
- 数据类型: float32
- 形状: [6]
- 名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos
观测图像(前视)
- 数据类型: video
- 形状: [480, 640, 3] (高度,宽度,通道)
- 名称: height, width, channels
- 视频信息:
- 视频高度: 480
- 视频宽度: 640
- 视频编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 包含音频: false
其他特征
- 时间戳: 数据类型为 float32,形状为 [1]。
- 帧索引: 数据类型为 int64,形状为 [1]。
- 情节索引: 数据类型为 int64,形状为 [1]。
- 索引: 数据类型为 int64,形状为 [1]。
- 任务索引: 数据类型为 int64,形状为 [1]。
引用信息
- BibTeX: 信息缺失
搜集汇总
数据集介绍

构建方式
在机器人学习领域,高质量的数据集对于算法训练与评估至关重要。record-test数据集依托LeRobot开源框架构建,通过实际机器人平台采集了50个完整交互片段,涵盖19420帧时序数据。数据以分块存储的形式组织,每个块包含1000帧观测与动作记录,并以Parquet格式高效保存,确保了数据的结构化和可扩展性。视频流以MP4格式独立存储,帧率为30fps,分辨率达640x480,为视觉感知研究提供了丰富的原始输入。
特点
该数据集在机器人控制任务中展现出多模态融合的鲜明特色,同步记录了六自由度机械臂的关节位置动作与对应的状态观测,形成闭环反馈。视觉通道包含前置摄像头采集的RGB图像序列,编码为AV1格式以平衡质量与存储效率。时序索引字段如帧索引、片段索引和任务索引的引入,使得数据具备严格的时间对齐与上下文关联,便于序列建模与离线强化学习算法的应用。
使用方法
研究者可通过解析meta/info.json中的元数据快速了解数据集结构,并依据data_path与video_path字段定位具体数据文件。训练集涵盖全部50个交互片段,适用于端到端策略学习或行为克隆任务。数据加载时可利用Parquet格式的列式存储特性高效读取特定特征,如动作空间或观测状态,并结合视频流进行多模态输入建模。该数据集兼容主流机器人学习库,能够为模仿学习与强化学习算法提供标准化的评估基准。
背景与挑战
背景概述
在机器人学习领域,模仿学习与强化学习等方法的进步亟需高质量、大规模的真实世界交互数据集作为支撑。record-test数据集由LeRobot项目团队构建,旨在为机器人操作任务提供多模态交互轨迹数据。该数据集聚焦于机械臂控制任务,通过整合关节状态、视觉观测与动作指令,为端到端策略学习提供了结构化基准。其设计体现了对现实场景中连续决策与感知融合问题的深入探索,有望推动机器人自主操作能力的实质性突破。
当前挑战
该数据集致力于解决机器人模仿学习中从高维感知输入到连续动作输出的映射难题,其挑战在于如何有效融合视觉信息与关节状态以实现精确的任务泛化。在构建过程中,数据采集面临传感器同步、轨迹对齐与噪声抑制等技术障碍,同时需确保动作指令的平滑性与安全性。此外,多模态数据的存储与高效访问机制亦对数据集的结构设计提出了严峻考验。
常用场景
经典使用场景
在机器人学习领域,record-test数据集以其多模态特性,为模仿学习算法的开发提供了关键支持。该数据集整合了机械臂的关节位置状态、前视摄像头图像以及时间序列信息,使得研究者能够基于真实交互数据训练端到端的策略模型。通过模拟人类操作者的示范行为,算法得以学习从视觉感知到动作执行的映射关系,从而在无需复杂编程的情况下实现任务自动化。
实际应用
在实际机器人部署中,record-test数据集可直接用于训练服务型或工业机械臂的执行策略。例如,在物品抓取、放置或简单装配等任务中,通过学习数据集中记录的专家示范,机器人能够适应动态环境,实现精准操作。这种数据驱动的方案减少了传统手动编程的耗时,提升了机器人在非结构化场景中的适应性与鲁棒性。
衍生相关工作
围绕record-test数据集,已衍生出一系列专注于模仿学习与机器人控制的经典研究。这些工作通常利用其多模态序列数据,开发先进的深度神经网络架构,如时空注意力模型、视觉-动作变换器等,以提升策略的泛化能力。同时,该数据集也常被用作基准,用于评估不同算法在真实机器人任务上的样本效率与最终性能。
以上内容由遇见数据集搜集并总结生成



