five

record-test

收藏
Hugging Face2025-11-04 更新2025-11-05 收录
下载链接:
https://huggingface.co/datasets/HojinJung/record-test
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个用于机器人学任务的数据集,包含30个剧集,共23219帧,以及1个任务。数据集以Parquet格式存储,并包含了相应的视频文件。每个文件包含了机器人的动作、状态、图像、时间戳、帧索引、剧集索引等信息。数据集的创建工具是LeRobot。
创建时间:
2025-11-03
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 机器人技术
  • 标签: LeRobot
  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)

数据集结构

  • 配置名称: default
  • 数据文件格式: Parquet
  • 数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据规模

  • 总回合数: 30
  • 总帧数: 23219
  • 总任务数: 1
  • 数据分块大小: 1000
  • 数据文件大小: 100 MB
  • 视频文件大小: 500 MB
  • 帧率: 25 FPS
  • 训练集划分: 0-30

特征结构

动作特征

  • 数据类型: float32
  • 维度: [6]
  • 关节名称:
    • shoulder_pan.pos
    • shoulder_lift.pos
    • elbow_flex.pos
    • wrist_flex.pos
    • wrist_roll.pos
    • gripper.pos

观测状态

  • 数据类型: float32
  • 维度: [6]
  • 关节名称:
    • shoulder_pan.pos
    • shoulder_lift.pos
    • elbow_flex.pos
    • wrist_flex.pos
    • wrist_roll.pos
    • gripper.pos

前视图像观测

  • 数据类型: 视频
  • 图像尺寸: [480, 640, 3]
  • 维度说明: [高度, 宽度, 通道数]
  • 视频信息:
    • 高度: 480
    • 宽度: 640
    • 编码格式: av1
    • 像素格式: yuv420p
    • 是否为深度图: false
    • 帧率: 25
    • 通道数: 3
    • 包含音频: false

元数据特征

  • 时间戳: float32 [1]
  • 帧索引: int64 [1]
  • 回合索引: int64 [1]
  • 索引: int64 [1]
  • 任务索引: int64 [1]

技术信息

  • 代码库版本: v3.0
  • 机器人类型: so101_follower
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人技术领域,record-test数据集通过LeRobot平台系统性地采集了30个完整任务片段,涵盖23219帧数据。该数据集采用分块存储机制,以Parquet格式组织数据文件,每个文件包含1000帧记录,并同步保存25fps的前置摄像头视频流。数据采集过程中精确记录了六自由度机械臂的关节位置状态与视觉观测信息,形成多模态时序数据序列。
特点
该数据集的核心特征体现在其多维度的机器人操作数据集成。不仅包含六轴机械臂的连续动作轨迹(肩部平移/抬升、肘部弯曲、腕部弯曲/旋转及夹爪开合),还同步采集480x640分辨率的三通道前视图像序列。数据集采用分层索引结构,通过帧索引、片段索引和任务索引实现精确数据定位,所有传感器数据均以时间戳进行严格对齐,为模仿学习研究提供高质量的时空对齐多模态样本。
使用方法
研究人员可通过解析Parquet数据文件直接访问结构化机器人数据,利用帧索引机制快速定位特定操作片段。数据集支持端到端的机器人策略学习,可同时调用关节状态观测值与视觉感知输入进行模型训练。视频数据采用AV1编码存储,配合25fps的时序一致性,便于重建完整任务执行过程。数据划分明确标注训练集涵盖全部30个任务片段,适合用于行为克隆、强化学习等机器人学习算法的开发与验证。
背景与挑战
背景概述
机器人学习领域近年来致力于构建能够适应复杂环境的智能体系统,record-test数据集作为LeRobot项目的重要组成部分,聚焦于机械臂操作任务的示范数据收集。该数据集通过记录六自由度机械臂的关节位置与视觉观测信息,为模仿学习与强化学习算法提供了真实世界的交互轨迹。其结构化存储的示范数据包含23219帧连续动作序列,涵盖了从状态感知到动作执行的完整闭环,对机器人技能迁移研究具有重要参考价值。
当前挑战
在机器人操作任务中,如何实现高维连续动作空间与多模态感知的精确对齐构成核心挑战。数据集构建过程中需克服机械臂轨迹数据的时序同步难题,确保25Hz采样频率下关节角度与视觉帧的严格对应。多传感器数据的异构性要求设计统一的特征表示框架,而示范数据的有限规模(仅30条轨迹)则对模型泛化能力提出更高要求。视频流与控制信号的并行存储架构进一步增加了数据管道的复杂度。
常用场景
经典使用场景
在机器人学习领域,record-test数据集以其丰富的多模态数据为特色,广泛应用于模仿学习算法的开发与验证。该数据集通过整合六自由度机械臂的关节位置控制指令与前端视觉观测信息,为研究者提供了完整的动作-状态序列记录。这类数据能够有效支撑端到端策略网络的训练过程,尤其在基于视觉的机器人操作任务中展现出重要价值。
实际应用
在工业自动化场景中,该数据集所蕴含的机械臂操作模式可直接应用于装配线分拣、物料搬运等实际任务。其记录的关节运动轨迹与视觉反馈的对应关系,为构建自适应抓取系统提供了关键参考。通过迁移学习技术,这些数据能够帮助新场景下的机器人快速掌握基本操作技能,显著降低现场调试的时间成本与技术要求。
衍生相关工作
基于该数据集的特性,学术界已衍生出多项重要研究工作。其中包括结合时空特征的视觉运动表征学习框架,以及针对连续控制任务的深度预测模型构建。这些工作通过挖掘数据集中隐含的状态转移规律,进一步发展了分层强化学习与元学习等先进方法,为机器人终身学习系统的实现提供了理论支撑与实践验证。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作