five

UR7e_CaP_MultiTask_300epi_10fps

收藏
Hugging Face2026-05-12 更新2026-05-12 收录
下载链接:
https://huggingface.co/datasets/CoRL2026-CSI/UR7e_CaP_MultiTask_300epi_10fps
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个公共的LeRobot v3.0多任务数据集,专为UR7e机器人基于代码策略(Code-as-Policies)的操作任务设计。数据集合并了三个原始数据集,每个包含100集10fps的视频,形成一个包含300集(共152,926帧)的训练语料库,同时保留了原始的数值观测数据、动作指令和任务标签。最终上传的数据集将所有视频统一为10fps H.264 MP4格式。数据集包含两个摄像头视角(顶视图和腕部视图)的RGB图像,分辨率为480x640,动作数据为UR7e机器人的7维关节/夹爪绝对目标。语言标签包括任务指令(存储在meta/tasks.parquet中)和每帧的技能文本(skill.natural_language)。具体任务包括:1) 将红、绿、蓝色积木沿紫色线从左到右排列;2) 在蓝色盘子上堆叠积木,底部为红色,中间为绿色,顶部为蓝色;3) 拾取红色积木并放置到蓝色盘子上。数据集通过SCRAPE-IsaacLab的LeRobot聚合包装器从三个源数据集合并而来,并进行了视频编码统一和帧率标准化处理。

This is a public LeRobot v3.0 multi-task dataset designed for UR7e robot operation tasks based on Code-as-Policies. The dataset merges three original datasets, each containing 100 episodes of 10fps videos, forming a training corpus of 300 episodes (totaling 152,926 frames), while preserving the original numerical observation data, action instructions, and task labels. The final uploaded dataset standardizes all videos to 10fps H.264 MP4 format. It includes RGB images from two camera perspectives (top view and wrist view) with a resolution of 480x640, and action data as 7-dimensional joint/gripper absolute targets for the UR7e robot. Language labels consist of task instructions (stored in meta/tasks.parquet) and per-frame skill text (skill.natural_language). Specific tasks include: 1) arranging red, green, and blue building blocks along a purple line from left to right; 2) stacking building blocks on a blue plate, with red at the bottom, green in the middle, and blue on top; 3) picking up a red building block and placing it on a blue plate. The dataset is merged from three source datasets via the SCRAPE-IsaacLab LeRobot aggregation wrapper, with unified video encoding and frame rate standardization applied.
提供机构:
CoRL2026-CSI
创建时间:
2026-05-12
原始信息汇总

数据集概述

  • 数据集名称: UR7e CaP MultiTask 300epi 10fps
  • 许可协议: Apache-2.0
  • 任务类别: 机器人学(robotics)
  • 标签: LeRobot、UR7e、多任务、Code-as-Policies、操作等
  • 配置: 默认配置,数据文件为 data/*/*.parquet

数据集格式与规模

  • 机器人型号: UR7e
  • 数据集格式: LeRobot v3.0
  • 帧率: 10 FPS
  • 总片段数: 300
  • 总帧数: 152,926
  • 相机:
    • 仰视视角 RealSense 摄像头(observation.images.realsense_topview
    • 腕部 RealSense 摄像头(observation.images.realsense_wrist
    • 图像尺寸:480×640 RGB,编码为 H.264
  • 动作空间: 7维 UR7e 关节/夹爪绝对目标(存储于 action
  • 语言标签: 任务指令存储在 meta/tasks.parquet 中;每帧技能文本存储在 skill.natural_language

任务组成

该数据集由三个各包含100个片段的子数据集合并而成,覆盖三种操作任务:

任务 来源数据集 片段数 帧数 任务指令
排列方块 (arrange block) CoRL2026-CSI/UR7e-CaP_arrange_block_100epi_10fps 100 47,116 将红色、绿色、蓝色方块沿紫色线从左到右排列。
堆叠方块 (stack block) CoRL2026-CSI/UR7e-CaP-Stack_Block-100epi_10fps 100 69,932 在蓝色碟子上堆叠,红色方块在底,绿色方块在中间,蓝色方块在顶。
抓取与放置 (pick and place) CoRL2026-CSI/UR7e_CaP_PickandPlace_100epi_10fps 100 35,878 捡起红色方块并放置在蓝色碟子上。

数据来源与处理

  • 合并方式: 使用 SCRAPE-IsaacLab 的 LeRobot 聚合包装器从三个源数据集合并而成。
  • 帧率标准化: 原始“排列方块”数据集的视频元数据中 video.fps=30,在合并时统一标准化为 video.fps=10,以满足 LeRobot 严格的特征模式检查。
  • 视频编码统一: 将“排列方块”数据集中的 AV1 编码 MP4 文件转码为 H.264,确保整个数据集使用一致的视频编码。
  • 详细信息: 可在 meta/scrape_multitask_manifest.json 中查看源版本、片段/帧范围及本地标准化细节。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作