record-test
收藏Hugging Face2026-01-26 更新2026-01-27 收录
下载链接:
https://huggingface.co/datasets/wemobile/record-test
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是使用LeRobot创建的,专为机器人技术领域设计,采用apache-2.0许可证。数据集包含5个完整的情节,总计5134帧,涉及1个任务。数据以parquet文件格式存储,总数据文件大小为100MB,视频文件大小为200MB,帧率为30FPS。数据集结构通过meta/info.json文件详细描述,包括机器人类型(so101_follower)、数据块大小(1000)、数据路径和视频路径格式。特征描述涵盖动作和观察状态(包括6个关节位置)、前视图像(480x640分辨率,3通道)、时间戳、帧索引、情节索引和任务索引等。适用于机器人控制、行为学习等任务。
创建时间:
2026-01-20
原始信息汇总
数据集概述
基本信息
- 数据集名称: record-test
- 托管平台: Hugging Face Datasets
- 创建工具: LeRobot (https://github.com/huggingface/lerobot)
- 许可证: Apache-2.0
- 任务类别: 机器人学
数据集规模与结构
- 总情节数: 5
- 总帧数: 5134
- 总任务数: 1
- 数据块大小: 1000
- 数据文件总大小: 100 MB
- 视频文件总大小: 200 MB
- 帧率: 30 FPS
- 数据分割: 全部数据(第0至第5个情节)用于训练
- 数据文件路径模式:
data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet - 视频文件路径模式:
videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
数据特征
数据集包含以下特征字段:
动作
- 数据类型: float32
- 形状: [6]
- 描述: 机械臂关节位置,包含以下6个维度:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos
观测状态
- 数据类型: float32
- 形状: [6]
- 描述: 机械臂关节位置观测,维度名称与动作特征相同。
观测图像(前视)
- 数据类型: video
- 形状: [480, 640, 3] (高度,宽度,通道)
- 视频信息:
- 高度: 480 像素
- 宽度: 640 像素
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 是否包含音频: false
元数据
- 时间戳: 数据类型为 float32,形状为 [1]。
- 帧索引: 数据类型为 int64,形状为 [1]。
- 情节索引: 数据类型为 int64,形状为 [1]。
- 索引: 数据类型为 int64,形状为 [1]。
- 任务索引: 数据类型为 int64,形状为 [1]。
技术细节
- 代码库版本: v3.0
- 机器人类型: so101_follower
补充信息
- 主页: 未提供
- 论文: 未提供
- 引用信息: 未提供
搜集汇总
数据集介绍

构建方式
在机器人学领域,高质量的数据集对于推动机器人控制与感知研究至关重要。record-test数据集依托LeRobot开源框架构建,通过采集真实机器人平台(so101_follower型)在特定任务中的交互数据而形成。数据以分块形式存储于Parquet文件中,每块包含1000帧,总计5个完整交互片段,涵盖关节位置、图像观测及时间戳等多模态信息,确保了数据的结构化与高效访问。
特点
该数据集的特点体现在其多模态融合与精细标注上。它不仅提供了六自由度机械臂的关节位置作为动作与状态观测,还同步记录了前置摄像头采集的RGB视频流,分辨率达640x480,帧率为30fps。数据中嵌入了帧索引、片段索引等元信息,支持按时间步或任务片段进行灵活检索,为机器人模仿学习与行为克隆研究提供了丰富的时空上下文。
使用方法
使用record-test数据集时,研究者可通过LeRobot工具链直接加载Parquet格式的数据文件,并利用内置的元数据信息快速访问不同模态的观测与动作序列。数据集已预分为训练集,涵盖全部5个交互片段,适用于端到端策略学习、状态估计或视觉-动作映射等任务。用户可结合视频文件与结构化数据,进行离线分析或在线仿真,以验证机器人控制算法的有效性。
背景与挑战
背景概述
在机器人学习领域,高质量、大规模的真实世界交互数据集对于推动模仿学习与强化学习算法的进步至关重要。record-test数据集由LeRobot项目团队创建,旨在为机器人操作任务提供多模态交互轨迹记录。该数据集聚焦于机械臂控制问题,通过整合关节状态、视觉观测与动作指令,为研究者构建端到端策略模型提供了宝贵资源。其设计体现了当前机器人学向数据驱动范式转型的趋势,有望加速具身智能在复杂环境中的泛化能力研究。
当前挑战
该数据集致力于解决机器人模仿学习中的多模态感知与动作生成挑战,要求模型从视觉与状态观测中推断出连续、精确的关节控制指令。在构建过程中,面临真实世界数据采集的稳定性与一致性难题,包括传感器同步、环境干扰处理以及长时序轨迹的完整记录。此外,数据规模有限与任务多样性不足可能制约模型的泛化性能评估,而多模态数据的高效存储与检索机制亦是工程实现上的关键挑战。
常用场景
经典使用场景
在机器人学领域,record-test数据集为模仿学习与行为克隆提供了宝贵的实验基础。该数据集通过记录机器人执行任务时的状态观测与动作序列,构建了从感知到决策的完整轨迹。研究人员能够利用这些多模态数据,包括关节位置、图像观测和时间戳,训练模型以理解并复现机器人的操作行为,从而推动自主控制策略的发展。
衍生相关工作
围绕该数据集,学术界已衍生出多项经典研究,主要集中在端到端模仿学习框架的优化与多任务策略迁移。部分工作利用其序列数据探索时序建模方法,如循环神经网络或Transformer架构,以提升长期动作预测的准确性。此外,也有研究基于该数据集进行仿真到实物的迁移学习,验证算法在真实机器人平台上的有效性。
数据集最近研究
最新研究方向
在机器人学习领域,record-test数据集作为LeRobot项目的一部分,聚焦于模仿学习与视觉运动控制的前沿探索。该数据集整合了机械臂关节状态与前端视觉观测,为研究多模态感知与动作生成的协同机制提供了关键资源。当前研究热点集中于利用此类时序数据训练端到端策略模型,以提升机器人在复杂环境中的泛化能力与操作精度。随着具身智能的兴起,这类高质量、结构化的真实世界交互数据正推动着从仿真到实际部署的范式转变,对促进机器人自主性发展具有深远意义。
以上内容由遇见数据集搜集并总结生成



