paper_return_first50
收藏Paper Return - First 50 Episodes (GR00T N1.5 Training Data) 数据集概述
数据集简介
- 本数据集包含来自paper_return数据集的前50个片段(片段0-49)
- 该子集代表用于微调GR00T N1.5模型的精确训练数据
数据集内容
- 片段数量: 50个(片段000000-000049)
- 任务类型: 使用SO-101机器人的纸张归位操作任务
- 数据格式: LeRobot v2.1数据集格式
- 总帧数: 约69,051帧(跨50个片段)
文件结构
paper_return_first50/ ├── data/ │ └── chunk-000/ │ ├── episode_000000.parquet # 动作和状态数据 │ ├── ... │ └── episode_000049.parquet ├── videos/ │ └── chunk-000/ │ ├── observation.images.main/ │ │ ├── episode_000000.mp4 # 顶部视角摄像头 │ │ ├── ... │ │ └── episode_000049.mp4 │ └── observation.images.secondary_0/ │ ├── episode_000000.mp4 # 腕部摄像头 │ ├── ... │ └── episode_000049.mp4 └── meta/ ├── info.json # 数据集元数据 ├── stats.json # 归一化统计信息 ├── episodes.jsonl # 片段信息 └── tasks.jsonl # 任务定义
训练详情
- 模型: GR00T N1.5(30亿参数)
- 训练时间: 约3小时(使用A100/H100 GPU)
- 训练轮数: 10轮
- 批次大小: 49
- 学习率: 0.0001
- 训练平台: phosphobot
相关资源
- 完整数据集: https://huggingface.co/datasets/Hafnium49/paper_return(206个片段)
- 训练模型: https://huggingface.co/phospho-app/gr00t-paper_return-7w9itxzsox
- 模型文档: 训练详情和使用示例
使用方法
使用LeRobot加载: python from lerobot.datasets.lerobot_dataset import LeRobotDataset
dataset = LeRobotDataset("Hafnium49/paper_return_first50") print(f"Episodes: {dataset.num_episodes}") print(f"Frames: {len(dataset)}")
引用说明
如需使用本数据集,请引用:
- 原始数据集:Hafnium49/paper_return
- GR00T模型:phospho-app/gr00t-paper_return-7w9itxzsox
- GR00T基础模型:NVIDIA GR00T N1.5
许可信息
采用与原始paper_return数据集相同的许可证
数据集创建
从paper_return数据集的片段0-49创建,代表在phospho平台上进行的GR00T N1.5微调所使用的精确训练数据




