five

small_grid_final

收藏
Hugging Face2026-03-03 更新2026-03-04 收录
下载链接:
https://huggingface.co/datasets/kamus1018/small_grid_final
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是使用LeRobot创建的,适用于机器人技术领域,采用Apache 2.0许可证。数据集包含8个总片段,4081帧,1个总任务,数据文件大小为100MB,视频文件大小为200MB,帧率为30fps。数据以parquet格式存储,视频以mp4格式存储。数据集结构包括动作、观察状态、观察图像(侧面和手臂)、时间戳、帧索引、片段索引、索引和任务索引等字段。动作和观察状态字段包含6个浮点数值,分别对应机器人关节的位置。观察图像字段包含480x640x3的视频数据,采用AV1编解码器,无音频。数据集适用于机器人控制和学习任务。
创建时间:
2026-02-27
原始信息汇总

数据集概述

基本信息

  • 数据集名称: small_grid_final
  • 发布者: kamus1018
  • 许可证: Apache 2.0
  • 任务类别: 机器人学
  • 相关标签: LeRobot
  • 创建工具: 使用 LeRobot 创建

数据集规模

  • 总情节数: 8
  • 总帧数: 4081
  • 总任务数: 1
  • 数据文件总大小: 100 MB
  • 视频文件总大小: 200 MB
  • 帧率: 30 FPS
  • 数据分块大小: 1000
  • 代码库版本: v3.0

数据划分

  • 训练集: 包含全部8个情节(索引范围:0:8)

数据结构与特征

数据存储为Parquet文件,路径格式为:data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet。 视频存储为MP4文件,路径格式为:videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征字段说明

  1. 动作

    • 数据类型: float32
    • 形状: [6]
    • 描述: 包含6个关节的位置指令:
      • shoulder_pan.pos
      • shoulder_lift.pos
      • elbow_flex.pos
      • wrist_flex.pos
      • wrist_roll.pos
      • gripper.pos
  2. 观测状态

    • 数据类型: float32
    • 形状: [6]
    • 描述: 包含6个关节的当前位置状态,名称与动作字段相同。
  3. 侧视图像观测

    • 数据类型: 视频
    • 形状: [480, 640, 3] (高度, 宽度, 通道)
    • 视频信息:
      • 编码格式: av1
      • 像素格式: yuv420p
      • 非深度图
      • 帧率: 30 FPS
      • 通道数: 3
      • 无音频
  4. 机械臂图像观测

    • 数据类型: 视频
    • 形状: [480, 640, 3] (高度, 宽度, 通道)
    • 视频信息: 与侧视图像观测相同。
  5. 时间戳

    • 数据类型: float32
    • 形状: [1]
  6. 帧索引

    • 数据类型: int64
    • 形状: [1]
  7. 情节索引

    • 数据类型: int64
    • 形状: [1]
  8. 索引

    • 数据类型: int64
    • 形状: [1]
  9. 任务索引

    • 数据类型: int64
    • 形状: [1]

机器人平台

  • 机器人类型: so_follower

引用信息

  • 主页: [More Information Needed]
  • 论文: [More Information Needed]
  • BibTeX引用: [More Information Needed]
搜集汇总
数据集介绍
构建方式
在机器人学习领域,数据集的构建质量直接关系到模型训练的成效。small_grid_final数据集依托LeRobot平台精心构建,通过记录机器人执行任务的过程,系统采集了多模态数据。具体而言,数据集包含了8个完整的情节,总计4081帧数据,以30帧每秒的速率录制。数据以分块形式存储,每个数据块约1000帧,并保存为Parquet格式,确保了高效的数据读取与处理。同时,配套的视频文件以MP4格式独立存放,清晰记录了机器人侧视与臂部视角的视觉信息,为算法提供了丰富的时空上下文。
特点
该数据集在机器人控制与感知研究中展现出鲜明的特色。其核心在于提供了高维度的动作与状态观测数据,动作空间涵盖肩部平移、肩部抬升、肘部弯曲、腕部弯曲、腕部旋转及夹爪位置共六个自由度,状态观测则与之完全对应,形成了精确的闭环反馈。视觉观测方面,数据集同步提供了侧视与臂部两个视角的RGB视频流,分辨率均为640x480,编码采用AV1格式,保证了图像质量与压缩效率的平衡。此外,数据集还嵌入了时间戳、帧索引、情节索引等多重元数据,为时序分析与任务划分提供了坚实基础。
使用方法
对于致力于机器人模仿学习或强化学习的研究者而言,该数据集提供了清晰的使用路径。数据文件按块组织,用户可通过解析meta/info.json中的路径模板,动态加载指定的Parquet数据块。每个数据块内,动作、状态、图像及元数据字段结构分明,便于直接提取用于模型训练。视频文件则独立存储,研究者可根据需要对齐视觉帧与机器人状态。数据集默认将所有情节划分为训练集,适用于端到端的策略学习或行为克隆。在使用过程中,建议结合LeRobot代码库,以充分利用其数据加载与预处理工具,从而高效地开展算法实验与验证。
背景与挑战
背景概述
在机器人学习领域,高质量、多模态的数据集对于推动模仿学习与强化学习算法的进步至关重要。small_grid_final数据集由HuggingFace的LeRobot项目创建,该项目致力于构建开源机器人学习生态系统。该数据集聚焦于机器人操作任务,具体涉及so_follower型机器人,通过整合关节状态、视觉观测与动作指令等多维度时序数据,旨在为机器人策略学习提供真实且结构化的训练资源。其核心研究问题在于如何利用有限的示教数据,高效地训练机器人完成复杂操作任务,从而降低现实世界机器人技能获取的成本与门槛,对促进机器人自主性与适应性研究具有积极意义。
当前挑战
该数据集致力于解决机器人模仿学习中的挑战,即如何从包含视觉与状态信息的示教数据中,学习出鲁棒且泛化能力强的操作策略。具体挑战包括处理高维视觉输入与低维动作空间之间的复杂映射关系,以及应对现实环境中存在的传感器噪声、动作延迟与动态不确定性。在构建过程中,挑战主要集中于多模态数据的同步采集与高效存储,确保来自不同视角的视觉流与精确的关节状态数据在时序上严格对齐。同时,数据规模相对有限,仅包含8个完整任务片段,这对学习算法的样本效率提出了更高要求,且数据多样性可能不足以覆盖任务的全部状态空间,增加了策略泛化的难度。
常用场景
经典使用场景
在机器人学习领域,small_grid_final数据集为模仿学习与强化学习算法的验证提供了关键支持。该数据集通过记录六自由度机械臂在特定任务中的关节位置、视觉图像及时间戳信息,构建了多模态交互轨迹。研究者能够利用这些轨迹训练模型,模拟机械臂的抓取或操作行为,从而在仿真环境中评估算法的泛化能力与决策效率。
实际应用
在实际工业与科研场景中,small_grid_final数据集可用于机械臂抓取、装配或分拣任务的算法开发。基于其记录的视觉与状态信息,工程师能够优化控制策略,提升机器人在非结构化环境中的适应性与精确度。此外,数据集支持快速原型验证,加速了从仿真到实际部署的过渡,在自动化生产线或实验室机器人系统中具有广泛的应用前景。
衍生相关工作
围绕该数据集,衍生出多项经典研究工作,主要集中在视觉-动作映射模型与离线强化学习领域。例如,研究者利用其多模态轨迹开发了基于Transformer的序列预测架构,提升了长期任务规划的稳定性。同时,数据集也催生了针对稀疏奖励问题的改进算法,以及跨任务迁移学习框架,推动了机器人学习社区在数据驱动方法上的创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作