five

globcy/libero_subtask_lerobot_v2_subset

收藏
Hugging Face2026-04-10 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/globcy/libero_subtask_lerobot_v2_subset
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: apache-2.0 task_categories: - robotics tags: - LeRobot - libero - panda - rlds configs: - config_name: default data_files: data/*/*.parquet --- This dataset was created using [LeRobot](https://github.com/huggingface/lerobot). <a class="flex" href="https://huggingface.co/spaces/lerobot/visualize_dataset?path=globcy/libero_subtask_lerobot_v2_subset"> <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl.svg"/> <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl-dark.svg"/> </a> ## Dataset Description - **Homepage:** [More Information Needed] - **Paper:** [More Information Needed] - **License:** apache-2.0 ## Dataset Structure [meta/info.json](meta/info.json): ```json { "codebase_version": "v3.0", "robot_type": "panda", "total_episodes": 281, "total_frames": 47682, "total_tasks": 8, "chunks_size": 1000, "data_files_size_in_mb": 100, "video_files_size_in_mb": 200, "fps": 10, "splits": { "train": "0:281" }, "data_path": "data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet", "video_path": "videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4", "features": { "observation.images.image": { "dtype": "image", "shape": [ 224, 224, 3 ], "names": [ "height", "width", "channel" ] }, "observation.images.image2": { "dtype": "image", "shape": [ 224, 224, 3 ], "names": [ "height", "width", "channel" ] }, "observation.state": { "dtype": "float32", "shape": [ 8 ], "names": [ "state" ] }, "action": { "dtype": "float32", "shape": [ 7 ], "names": [ "actions" ] }, "subtask_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "timestamp": { "dtype": "float32", "shape": [ 1 ], "names": null }, "frame_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "episode_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "task_index": { "dtype": "int64", "shape": [ 1 ], "names": null } } } ``` ## Citation **BibTeX:** ```bibtex [More Information Needed] ```
提供机构:
globcy
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自LeRobot框架,专注于机器人操作任务的模仿学习研究。构建过程中,使用Panda机械臂在仿真环境中完成8种不同的子任务,共计281个轨迹片段,涵盖47682帧时间序列数据。每个轨迹均以10帧每秒的采样率记录,并划分为训练集(全部281个轨迹)。数据以Parquet格式存储观察图像(224×224像素的双摄像头视角)、机器人8维状态向量及7维动作指令,同时附加子任务索引、时间戳等元信息,形成结构化的经验池。
特点
数据集的核心特色在于其精细的子任务标注与多模态感知融合。每个轨迹均包含明确的子任务索引,便于细粒度行为分析与层次化策略学习。双摄像头视觉输入提供了丰富的场景上下文,而低维状态与动作空间保持了对真实机器人控制的兼容性。281个轨迹虽规模适中,但覆盖8类典型操作任务,配合完整的视频记录(MP4格式),为行为克隆与离线强化学习提供了高质量的标准基准。
使用方法
使用者可通过LeRobot库直接加载数据集,其兼容HuggingFace Datasets接口,支持按轨迹或帧随机访问。训练时,可提取'observation.images'双视角图像经CNN编码,与'observation.state'拼接后输入策略网络,以回归方式预测7维连续动作。由于已预设训练集划分(索引0至280),建议采用批处理方式迭代,结合数据增强(如随机裁剪)提升泛化性。验证时可通过可视化工具观察机械臂执行结果与子任务对齐情况。
背景与挑战
背景概述
在机器人学习领域,复杂任务的长时序操作与子任务分解一直是研究难点。libero_subtask_lerobot_v2_subset 数据集由 Hugging Face 的 LeRobot 社区于近期创建,依托 Franka Emika Panda 机械臂平台,旨在为基于视觉的机器人子任务学习提供标准化基准。该数据集包含 281 个完整演示片段、47682 帧图像及 8 种不同任务,通过双视角 224×224 RGB 图像、8 维状态向量与 7 维动作空间,精确记录机器人在桌面操作中的子任务级行为。数据集以 Apache-2.0 协议开源,并集成于 LeRobot 生态,支持即插即用的可视化和模型训练,显著降低了机器人学习研究的入门门槛。其子任务标注机制为细粒度技能学习、任务规划及模仿学习提供了关键数据支撑,推动了具身智能研究中动作分解与泛化能力的发展。
当前挑战
该数据集所解决的领域挑战在于:机器人操作任务通常具有高度连续性和多模态特性,传统端到端方法难以捕捉子任务间的时序依赖与语义边界,而该数据集通过子任务索引显式标注了任务片段,助力模型学习层次化决策结构。在构建过程中,面临的核心挑战包括:1)机械臂演示采集的精确性——需确保 10 FPS 帧率下双视角图像与状态、动作的同步,避免因传感器延迟导致子任务对齐错误;2)数据规模与多样性的平衡——281 个片段、8 种任务虽提供了可控实验环境,但较少的样本量对从有限演示中泛化跨场景技能提出了更高要求;3)子任务标注的一致性——手动或自动划分子任务边界时,需避免歧义,以保证后续算法评测的可靠性。
常用场景
经典使用场景
在机器人学习领域,libero_subtask_lerobot_v2_subset数据集为基于视觉的运动策略训练提供了坚实的数据基础。该数据集采集自Panda机械臂,包含281个演示片段、共计47682帧图像与状态信息,覆盖8个不同子任务场景。研究者常利用此数据集进行模仿学习中的动作预测建模,通过将双视角RGB图像(224×224像素)与8维机器人状态向量作为输入,训练模型输出7维关节动作指令。其标准化的parquet格式与LeRobot框架的无缝集成,使得数据加载与预处理流程高度统一,为多任务学习、行为克隆及离线强化学习等经典范式提供了可复现的基准测试平台。
实际应用
在实际工业与科研场景中,libero_subtask_lerobot_v2_subset直接服务于可重复编程的柔性装配任务。基于该数据集训练的视觉运动策略,可引导Panda机械臂在桌面环境下执行如“抓取并放置”、“开抽屉”等精细操作,无需人工逐帧编程。其采用了Apache-2.0开源协议,降低了企业研发门槛,加速了从实验室仿真到真实产线部署的转化进程。此外,数据集内嵌的LeRobot可视化工具链,使得工程师能够直观检查演示质量与策略执行效果,为机器人操作系统的快速原型验证提供了高效支撑。
衍生相关工作
该数据集的问世催生了一系列具有影响力的衍生研究工作。在算法层面,基于其子任务分割特性,研究者发展了分层模仿学习架构,将整体操作分解为可独立训练的原子技能模块。同时,利用其多视角图像信息,推动了视觉预训练模型(如R3M、RT-1)在具体机械臂操作中的微调技术演进。部分工作还借鉴其数据格式标准化经验,构建了跨机器人平台的通用操作数据集(如Open X-Embodiment),进一步放大了该数据集在机器人社区中的基准价值。这些衍生工作共同构成了从数据收集到策略部署的完整闭环生态。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作