sghosts/noisygain-libero-task0123456789-3pairs_v2

Name: sghosts/noisygain-libero-task0123456789-3pairs_v2
Creator: sghosts
Published: 2026-04-30 16:22:30
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/sghosts/noisygain-libero-task0123456789-3pairs_v2

下载链接

链接失效反馈

官方服务：

资源简介：

--- license: apache-2.0 task_categories: - robotics tags: - LeRobot configs: - config_name: default data_files: data/*/*.parquet --- This dataset was created using [LeRobot](https://github.com/huggingface/lerobot). <a class="flex" href="https://huggingface.co/spaces/lerobot/visualize_dataset?path=sghosts/noisygain-libero-task0123456789-3pairs_v2"> <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl.svg"/> <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl-dark.svg"/> </a> ## Dataset Description - **Homepage:** [More Information Needed] - **Paper:** [More Information Needed] - **License:** apache-2.0 ## Dataset Structure [meta/info.json](meta/info.json): ```json { "codebase_version": "v3.0", "robot_type": "libero", "total_episodes": 30, "total_frames": 5260, "total_tasks": 10, "chunks_size": 1000, "data_files_size_in_mb": 100, "video_files_size_in_mb": 200, "fps": 30, "splits": { "train": "0:30" }, "data_path": "data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet", "video_path": null, "features": { "observation.images.image": { "dtype": "image", "shape": [ 3, 360, 360 ], "names": [ "channel", "height", "width" ] }, "observation.images.image2": { "dtype": "image", "shape": [ 3, 360, 360 ], "names": [ "channel", "height", "width" ] }, "observation.state": { "dtype": "float32", "shape": [ 8 ], "names": [ "eef_pos_x", "eef_pos_y", "eef_pos_z", "eef_axisangle_x", "eef_axisangle_y", "eef_axisangle_z", "gripper_qpos_0", "gripper_qpos_1" ] }, "action": { "dtype": "float32", "shape": [ 7 ], "names": [ "x", "y", "z", "rot_x", "rot_y", "rot_z", "gripper" ] }, "is_bad_sequence": { "dtype": "bool", "shape": [ 1 ], "names": null }, "timestamp": { "dtype": "float32", "shape": [ 1 ], "names": null }, "frame_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "episode_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "task_index": { "dtype": "int64", "shape": [ 1 ], "names": null } } } ``` ## Citation **BibTeX:** ```bibtex [More Information Needed] ```

This dataset was created using LeRobot and is primarily used in the field of robotics. It contains a total of 30 episodes, 5260 frames, and 10 tasks, with data files in parquet format. The dataset includes various features such as images (3 channels, 360x360 resolution), state (8 floats), action (7 floats), etc. The dataset is licensed under apache-2.0.

提供机构：

sghosts

搜集汇总

数据集介绍

构建方式

本数据集名为noisygain-libero-task0123456789-3pairs_v2，基于LeRobot框架构建，专注于机器人操作任务的模拟与学习。数据集通过采集Libero机器人执行10种不同任务时的状态与动作信息，共包含30个完整回合（episodes），总计5260帧数据。每条样本记录包含两个视角的360x360像素RGB图像、8维机器人末端执行器状态向量（包括位置、姿态与夹爪开度）、7维动作指令（涵盖笛卡尔坐标位置、旋转角度与夹爪控制信号），以及任务索引、时间戳、帧序号等元信息。数据以Parquet格式分块存储，总容量约为300MB，其中视频部分占200MB。所有回合均归属训练集，未划分验证或测试子集。

使用方法

用户可通过LeRobot官方API加载本数据集，使用Hugging Face Datasets库进行高效访问。具体操作时，只需指定数据集路径'sghosts/noisygain-libero-task0123456789-3pairs_v2'，即可自动下载并解析Parquet文件，返回包含图像、状态、动作及元信息的字典结构。图像数据可重塑为（3, 360, 360）张量供模型直接输入，状态与动作向量则可作为模仿学习或强化学习策略网络的输入输出。数据集分块机制（chunk_size=1000）支持流式读取，适应内存受限场景。建议使用PyTorch或TensorFlow构建数据加载器，结合random_shuffle与batch处理提升训练效率。对于异常序列，利用is_bad_sequence字段可便捷过滤，优化策略学习质量。

背景与挑战

背景概述

在机器人学习领域，模仿学习与行为克隆方法依赖于高质量、多任务的演示数据集，以驱动机器人泛化能力的提升。noisygain-libero-task0123456789-3pairs_v2数据集由研究者基于LeRobot框架构建，发布于HuggingFace平台，专注于Libero机器人平台的多任务操作学习。该数据集包含30个演示片段、共计5260帧、覆盖10个不同的操作任务，每个任务对应特定的状态与动作序列。数据集采用标准化特征结构，包括双视角视觉观测（360×360像素三通道图像）、8维状态信息（末端执行器位置与姿态、夹爪状态）以及7维动作指令，为机器人从感知到控制的端到端学习提供了结构化资源。作为开放数据集，其采用Apache-2.0许可协议，降低了研究门槛，推动了机器人操作学习领域的可复现研究与基准测试发展。

当前挑战

该数据集直接应对了机器人多任务模仿学习中数据集规模与任务多样性不足的挑战。Libero平台的操作任务涉及高维连续动作空间和复杂物体交互，要求模型学习精细的夹爪控制与运动规划，单任务数据难以支撑泛化能力。此外，数据构建过程中面临采集一致性挑战：来自不同演示片段的动作轨迹与视觉观测需保持时空对齐，而每片段仅平均约175帧的短序列对时序建模提出更高要求。同时，数据标注需处理状态异常（如失败序列标记‘is_bad_sequence’）和传感器噪声，如何在有限数据量（总帧数5260）下避免过拟合并提升策略鲁棒性，是后续研究中的关键难点。

常用场景

经典使用场景

在机器人学习与操控领域，该数据集为多任务模仿学习提供了高质量的基准资源。其核心设计聚焦于LIBERO仿真环境中的十项典型操作任务，涵盖抓取、放置、推拉等基础动作，并通过对每项任务采集三十条完整轨迹，构建了包含五千余帧高分辨率观测图像与状态动作对的精细数据结构。研究者可依托该数据集开展行为克隆、隐式策略学习等经典范式训练，尤其适用于验证模型在有限样本下对多任务指令的泛化能力与动作预测精度。

解决学术问题

该数据集直面机器人学习中数据稀缺与任务多样性难以兼顾的核心矛盾，通过标准化采集流程与结构化标注（如末端执行器位姿、夹爪状态及任务索引），为探索跨任务知识迁移、多模态感知融合及长时域动作规划等学术议题提供了可复现的验证平台。其引入的“坏序列”标记机制更可助力研究数据噪声对策略鲁棒性的影响，推动领域从单一任务拟合向复杂场景下通用操控智能的范式跃迁。

实际应用

面向智能制造与家庭服务等实际部署需求，该数据集支撑的技能学习模型可直接迁移至LIBERO仿真环境中的台面操作任务，例如餐具整理、物品分拣或工具使用。基于LeRobot框架构建的标准化数据管线，使得开发者能够便捷地将训练完成的策略权重部署至真实机器人平台，在成本可控的前提下验证算法从仿真到真机场景的零样本泛化能力，缩短机器人技能习得的工程迭代周期。

数据集最近研究