five

paper_return_first50

收藏
Hugging Face2025-10-27 更新2025-10-28 收录
下载链接:
https://huggingface.co/datasets/Hafnium49/paper_return_first50
下载链接
链接失效反馈
官方服务:
资源简介:
这个数据集包含了paper_return数据集的前50个episodes(episodes 0-49),用于对GR00T N1.5模型进行微调。这些数据遵循LeRobot v2.1数据格式,总共包含大约69051帧,跨越50个episodes。数据集的结构包括行动和状态数据、视频以及元数据文件。训练细节包括使用的模型、训练时间、迭代次数、批量大小和学习率。
创建时间:
2025-10-24
原始信息汇总

Paper Return - First 50 Episodes (GR00T N1.5 Training Data) 数据集概述

数据集简介

  • 本数据集包含来自paper_return数据集的前50个片段(片段0-49)
  • 该子集代表用于微调GR00T N1.5模型的精确训练数据

数据集内容

  • 片段数量: 50个(片段000000-000049)
  • 任务类型: 使用SO-101机器人的纸张归位操作任务
  • 数据格式: LeRobot v2.1数据集格式
  • 总帧数: 约69,051帧(跨50个片段)

文件结构

paper_return_first50/ ├── data/ │ └── chunk-000/ │ ├── episode_000000.parquet # 动作和状态数据 │ ├── ... │ └── episode_000049.parquet ├── videos/ │ └── chunk-000/ │ ├── observation.images.main/ │ │ ├── episode_000000.mp4 # 顶部视角摄像头 │ │ ├── ... │ │ └── episode_000049.mp4 │ └── observation.images.secondary_0/ │ ├── episode_000000.mp4 # 腕部摄像头 │ ├── ... │ └── episode_000049.mp4 └── meta/ ├── info.json # 数据集元数据 ├── stats.json # 归一化统计信息 ├── episodes.jsonl # 片段信息 └── tasks.jsonl # 任务定义

训练详情

  • 模型: GR00T N1.5(30亿参数)
  • 训练时间: 约3小时(使用A100/H100 GPU)
  • 训练轮数: 10轮
  • 批次大小: 49
  • 学习率: 0.0001
  • 训练平台: phosphobot

相关资源

  • 完整数据集: https://huggingface.co/datasets/Hafnium49/paper_return(206个片段)
  • 训练模型: https://huggingface.co/phospho-app/gr00t-paper_return-7w9itxzsox
  • 模型文档: 训练详情和使用示例

使用方法

使用LeRobot加载: python from lerobot.datasets.lerobot_dataset import LeRobotDataset

dataset = LeRobotDataset("Hafnium49/paper_return_first50") print(f"Episodes: {dataset.num_episodes}") print(f"Frames: {len(dataset)}")

引用说明

如需使用本数据集,请引用:

  • 原始数据集:Hafnium49/paper_return
  • GR00T模型:phospho-app/gr00t-paper_return-7w9itxzsox
  • GR00T基础模型:NVIDIA GR00T N1.5

许可信息

采用与原始paper_return数据集相同的许可证

数据集创建

从paper_return数据集的片段0-49创建,代表在phospho平台上进行的GR00T N1.5微调所使用的精确训练数据

搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作任务数据集的构建领域,paper_return_first50数据集源自原始paper_return数据集的前50个连续片段,精心筛选出编号000000至000049的完整交互记录。该数据集严格遵循LeRobot v2.1标准格式进行结构化组织,将动作状态数据与多视角视频流分别存储于Parquet文件及MP4视频中,并通过标准化元数据文件描述任务定义与统计特征,确保了数据的一致性与可复现性。
使用方法
研究者可通过LeRobot标准接口直接加载数据集,调用LeRobotDataset类并指定数据集名称即可访问全部片段与帧级数据。数据流自动对齐动作指令与对应的视觉观测序列,支持端到端的策略学习 pipeline。该设计显著简化了机器人操作模型的训练流程,用户可快速构建基于状态-动作映射的神经网络模型,或开展跨模态表示学习的实验探索。
背景与挑战
背景概述
机器人操作任务数据集作为强化学习研究的重要载体,paper_return_first50数据集源自Hafnium49团队构建的纸质物块操作任务数据子集。该数据集采用LeRobot v2.1标准化格式,收录了SO-101机器人执行纸张归位任务的前50个完整交互片段,共计约6.9万帧多视角视觉与动作数据。作为GR00T N1.5大模型微调的核心训练素材,其通过磷酸盐平台在A100/H100算力集群上完成了历时三小时的参数优化,标志着具身智能领域向精细化操作任务迈出的关键一步。
当前挑战
在机器人精细操作领域,纸质物块的空间定位与抓取策略始终面临动作精度与环境适应性的双重考验。数据集构建过程中需攻克多模态数据同步采集的技术壁垒,确保双视角视频流与关节状态数据的时序一致性。面对非刚性物体的形变特性,标注团队需解决动作轨迹的噪声过滤问题,同时维持约1.4万帧/小时的标注效率以支撑模型迭代。数据标准化环节还需平衡LeRobot格式转换中的维度对齐与信息保真度,这对后续模型的跨场景泛化能力产生深远影响。
常用场景
经典使用场景
在机器人操作研究领域,paper_return_first50数据集作为GR00T N1.5模型的训练基础,聚焦于纸张归位任务这一经典场景。该数据集通过SO-101机器人执行纸张放入方框的精细操作,完整记录了50个训练周期中机械臂运动轨迹与多视角视觉数据,为模仿学习算法提供了标准化实验环境。其包含的6.9万帧动作状态序列,构建了从视觉感知到运动控制的闭环验证体系,成为评估机器人灵巧操作能力的基准平台。
解决学术问题
该数据集有效解决了机器人模仿学习中的样本效率与泛化能力问题。通过提供结构化动作序列与多模态观测数据,研究者能够系统分析状态-动作映射关系在复杂操作任务中的表现。其精确标注的抓取姿态与运动轨迹,为深度强化学习算法提供了可复现的训练目标,显著降低了实体机器人实验的时间与经济成本。在跨场景迁移学习研究中,该数据集通过标准化任务定义推动了机器人操作知识的可转移性验证。
实际应用
在工业自动化与服务机器人领域,该数据集支撑的操作范式已延伸至物流分拣、医疗器材摆放等实际场景。基于数据驱动的控制策略能够适应不同材质、形状的物体操作需求,为柔性制造生产线提供了技术储备。在家庭服务机器人开发中,此类精细操作数据助力解决了日常物品整理中的抓取稳定性问题,通过迁移学习显著提升了机器人对未知物体的适应能力。
数据集最近研究
最新研究方向
在机器人操作学习领域,paper_return_first50数据集作为GR00T N1.5模型的关键训练样本,正推动基于视觉的精细物体操控研究迈向新阶段。该数据集聚焦纸张折叠任务,通过多视角视频与状态动作序列的同步记录,为模仿学习与强化学习算法提供了高保真实验环境。当前前沿研究主要探索跨模态表征的泛化能力,利用LeRobot框架实现从仿真到实物的无缝迁移,同时结合元学习策略提升模型在动态场景中的适应性。这一方向不仅加速了家庭服务机器人的实用化进程,更通过开源生态促进了人机协作标准的建立,为具身智能的发展注入了新动能。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作