sghosts/noisy-libero-task7-3pairs

Name: sghosts/noisy-libero-task7-3pairs
Creator: sghosts
Published: 2026-04-30 08:51:02
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/sghosts/noisy-libero-task7-3pairs

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，包含机器人操作相关的数据。数据集总共有3个片段，840帧，1个任务。数据包括观测图像（分辨率为360x360，3通道）、机器人状态（8维浮点数）、动作（7维浮点数）等特征。数据以parquet格式存储，总数据文件大小为100MB，视频文件大小为200MB，帧率为30fps。数据集采用apache-2.0许可证。

This dataset was created using LeRobot and contains robotics operation-related data. The dataset consists of 3 episodes, 840 frames, and 1 task. It includes features such as observation images (resolution 360x360, 3 channels), robot state (8-dimensional float), and actions (7-dimensional float). The data is stored in parquet format, with a total data file size of 100MB, video file size of 200MB, and a frame rate of 30fps. The dataset is licensed under apache-2.0.

提供机构：

sghosts

搜集汇总

数据集介绍

构建方式

在机器人学习领域中，数据集的构建是推动智能体从感知到动作闭环演进的关键基石。该数据集基于LeRobot框架创建，专为Libero机器人平台设计，以提供高质量的演示轨迹。数据集的构建围绕单一任务展开，共计收录了3条完整演示片段，涵盖840帧时序数据。每个片段以30帧/秒的采样率采集，并采用Parquet格式进行高效存储。数据被组织为单个数据集分片，便于加载与处理，同时仅包含训练分割，确保数据纯净且集中。此外，数据集并未提供明确的视频存储路径，而是以图像观测（双视角360×360 RGB图像）和机器人状态（末端执行器位置、姿态及夹爪状态）的形式记录观测信息，充分反映机器人操作的细粒度时序演变。

特点

该数据集的鲜明特色在于其专注于单一任务下的多视角观测与精细动作建模。其观测空间包含两个分辨率为360×360的RGB图像通道，模拟真实场景中的多摄像头设置，为视觉策略学习提供丰富空间信息。同时，八维状态向量精准刻画末端执行器位置（x, y, z）、轴角姿态及夹爪状态，实现状态空间的完整表达。动作空间则包含七维连续动作（平移、旋转与夹爪控制），支持对机器人操作进行低层级连续控制。另一个核心特点是数据量虽小但结构严谨，仅3个片段与840帧的设置，适合用于鲁棒性测试、噪声评估或小样本学习场景。此外，“is_bad_sequence”布尔标记可辅助过滤低质量演示，强化数据筛选的灵活性。

使用方法

该数据集通过LeRobot库实现便捷加载与使用。开发者首先需要安装LeRobot及相关依赖，随后可通过统一的体验器进行可视化浏览，以直观理解每帧的观测与动作对应关系。在程序化使用中，可利用LeRobot提供的DataLoader接口读取Parquet格式的时序块，并支持按批次组织数据进行模型训练。由于数据集仅包含训练集合，用户无需划分验证或测试集，可直接用于模仿学习或强化学习策略的训练流程。尤其适用于结合双视角图像输入与连续动作输出进行端到端策略建模的场景。对该数据集的实验通常需指定机器人类型为'libero'，并设定适当的时间窗口（chunks_size=1000）以确保训练过程的时序连贯性。

背景与挑战

背景概述

该数据集由 huggingface 社区用户 sghosts 基于 LeRobot 框架创建，聚焦于机器人操控领域，具体围绕 LIBERO 仿真环境中的任务7展开。数据集创建于当前阶段，旨在为机器人学习中的模仿学习与行为克隆提供精细化的多模态训练样本。该数据集包含3条演示轨迹、共计840帧样本，采集了双视角 RGB 图像（360×360分辨率）、机器人末端执行器8维状态信息以及7维动作指令，数据频率为30帧/秒。其核心研究问题在于探索如何在有限示范数据下，提升机器人对复杂操作任务的泛化能力与鲁棒性，为后续稳健的机器人策略学习奠定基础。

当前挑战

当前数据集面临的核心挑战包括：一是解决领域问题层面的困难，即如何在仅凭少量示范（3条轨迹）且存在噪声标注的情况下，训练出能高效完成 LIBERO 任务7的机器人策略，这要求算法具备较强的数据效率与抗噪能力。二是构建过程中的挑战，由于数据集标注过程中可能引入的噪声（如`is_bad_sequence`标志位），如何自动甄别并剔除低质量轨迹以保障数据质量成为难点。此外，数据采集仅有单任务配置，缺乏任务多样性，限制了策略的跨任务迁移能力，亟需设计有效的噪声建模与数据增强方法来应对稀疏与噪声并存的学习困境。

常用场景

经典使用场景

在机器人学习领域，该数据集专为模仿学习与行为克隆任务设计，尤其聚焦于基于视觉的灵巧操作技能获取。其包含的高保真360度立体图像对与8维状态向量（涵盖末端执行器位姿与夹爪开度），为训练端到端策略网络提供了标准化的多模态输入。经典用法是构建视觉-动作映射模型，通过处理连续帧的视觉观测与对应的7维动作指令，使机器人学会从图像中直接推导出精确的运动轨迹。

解决学术问题

该数据集旨在解决机器人操作任务中数据稀缺性与噪声鲁棒性两大核心难题。通过仅包含3个示范轨迹的小样本设置，它迫使研究者探索高效利用有限数据的学习范式，例如数据增强、元学习或先验知识迁移。同时，其名称中‘noisy’标识暗示了引入的传感器噪声或执行误差，使学术界能够系统研究策略在非完美数据下的泛化能力，这对推动从受控实验室环境向真实世界部署的过渡具有关键意义。

衍生相关工作

基于该数据集衍生的工作主要围绕小样本模仿学习与噪声鲁棒控制展开。代表性方向包括：利用扩散策略（Diffusion Policy）从噪声示范中生成平滑动作序列，或通过对比学习增强视觉表征对光照、遮挡的稳定性。也有研究借鉴Transformer架构对多视角图像进行跨模态融合，提升策略对缺失或损坏观测的恢复能力。此外，该数据与LIBERO基准的兼容性催生了针对任务泛化的元学习方法，推动了通用操作智能体的探索。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集