ramy-hty/task1-green
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/ramy-hty/task1-green
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由LeRobot创建,主要用于机器人领域。数据集包含11个episodes,4225帧数据,1个任务。数据以parquet格式存储,视频以mp4格式存储。特征包括动作(6个关节位置)、观察状态(6个关节位置)、前视图像(1080x1920分辨率,30fps)、时间戳、帧索引、episode索引等。数据总大小为100MB,视频总大小为200MB。
This dataset was created using LeRobot and is primarily used in the robotics field. It contains 11 episodes, 4225 frames, and 1 task. The data is stored in parquet format, and videos are stored in mp4 format. Features include actions (6 joint positions), observation states (6 joint positions), front-view images (1080x1920 resolution, 30fps), timestamps, frame indices, episode indices, etc. The total data size is 100MB, and the total video size is 200MB.
提供机构:
ramy-hty
搜集汇总
数据集介绍

构建方式
本数据集依托于LeRobot开源框架构建,专为机器人操作任务设计,聚焦于名为“task1-green”的单一任务场景。数据采集过程采用so_follower机器人平台,通过遥操作等方式获取高保真度演示数据。整个数据集包含11个完整演示片段,共计4225帧时序信息,以30帧每秒的速率记录,并按照训练集(0:11)进行划分。数据存储采用分块方式,动作序列与观测状态以Parquet格式保存,图像数据则压缩为H.264编码的MP4视频文件。
特点
该数据集具有鲜明的结构特征与实用性。它完整记录6维关节空间动作指令与对应观测状态,覆盖shoulder_pan、shoulder_lift等核心关节位置。视觉观测由前置高清摄像头以1080×1920分辨率捕获,提供丰富的场景信息。数据总量约300MB(含影像),分块大小设定为1000帧,便于高效加载与处理。每条数据附带时间戳、帧序号及片段索引等元信息,为模仿学习、行为克隆等算法提供对齐良好的训练素材。
使用方法
用户可通过LeRobot库便捷地加载本数据集。借助lerobot.common.datasets模块中的load_dataset函数,指定数据集路径为“ramy-hty/task1-green”,即可自动读取Parquet文件中的动作序列与状态序列,并同步解码MP4视频帧,构建统一的训练迭代器。该数据集支持多模态输入,适合用于训练机器人策略模型,如扩散策略(Diffusion Policy)或基于Transformer的逆动力学模型。推荐将全部11个片段作为训练集使用,以充分挖掘任务模式。
背景与挑战
背景概述
task1-green数据集由Hugging Face LeRobot团队创建,旨在为机器人操作任务提供标准化的训练与评估基准。该数据集专注于单任务模仿学习场景,记录了SO_follower型机械臂执行绿色物体操作任务的11个演示片段,总计4225帧数据。通过多模态信息整合,数据集涵盖了6自由度关节状态、高分辨率视觉图像(1080x1920,30fps)及对应动作序列,为机器人策略学习提供了丰富的感知-运动关联样本。作为LeRobot生态系统的一部分,该数据集遵循Apache-2.0开源协议,推动可复现的机器人学习研究,在具身智能与模仿学习领域具有重要参考价值。
当前挑战
当前数据集面临的核心挑战包括:1)机器人操作任务固有的维度灾难与泛化难题,11个演示片段与4225帧数据的规模难以覆盖多样化操作场景,模型易陷入对特定轨迹的过拟合;2)高维度视觉-运动关联建模需求,1080p图像与6维关节状态构成的异构数据流对时空特征融合提出严苛要求;3)数据采集与标注的物理壁垒,SO_follower机械臂的物理特性与演示人类示范的变异性导致数据一致性难以保证,且apache-2.0协议虽保障了商用友好性,但任务单一性限制了其在复杂操作任务中的迁移能力。
常用场景
经典使用场景
在机器人学习领域,数据驱动的策略学习已成为突破传统程序化控制瓶颈的关键路径。task1-green数据集专为模仿学习与行为克隆算法设计,记录了11个完整操作回合、共4225帧的机器人动态执行数据。每个回合均包含6维关节空间动作序列、对应状态观测以及高分辨率视觉图像(1080×1920@30fps),为端到端策略网络提供了精细的输入-输出对齐样本。研究者可借此训练从视觉观测直接映射到关节级动作的神经网络,尤其适用于基于Transformer或扩散模型的决策架构,推动机器人泛化能力的提升。
衍生相关工作
该数据集催生了一系列值得关注的延伸性工作。在算法层面,研究者围绕其30FPS时序结构与高维视觉输入,开发了基于时序卷积网络的实时策略推理方法,以及融合扩散模型的多模态动作预测框架。在系统工具方面,由于数据集采用LeRobot标准格式,它自然地与HuggingFace可视化管线、Parquet高效存储以及MP4视频码流兼容,促使社区构建了离线评测基线库。此外,将正面对准视角的RGB图像与关节状态联合建模的范式,衍生出针对位姿估计误差的对策研究,形成了一类以视觉伺服为核心的机器人控制新课题。
数据集最近研究
最新研究方向
该数据集聚焦于机器人模仿学习与遥操作领域的前沿探索,特别是针对so_follower机械臂的精细化操控任务。借助LeRobot框架构建的11个演示片段和4225帧高保真数据,结合30帧/秒的1080p视觉流与六自由度关节状态信息,为研究基于视觉-运动耦合的少样本技能迁移提供了稀缺资源。当前热点方向包括利用此类小型高质量数据集验证离线强化学习算法在真实机器人上的泛化能力,以及探索多模态融合(如深度图与RGB图像)对复杂装配任务效率的提升。此数据集的意义在于推动机器人从预设编程向数据驱动自主决策的范式转变,为具身智能体在非结构化环境中的可扩展学习奠定实证基础。
以上内容由遇见数据集搜集并总结生成



