ur-task4-0

Hugging Face2025-11-28 更新2025-11-29 收录

下载链接：

https://huggingface.co/datasets/F-Fer/ur-task4-0

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个关于机器人（ur5e型号）操作的数据集，包含165个剧集，共计274298帧。数据集分为一个任务，每个任务包含多个数据块，每块1000条数据。数据以Parquet格式存储，视频文件为MP4格式。数据集的帧率是60fps，训练集分割为所有数据。数据集的特征包括动作、观察状态、四个相机图像（两个ZED2i相机和两个ZEDM相机）、时间戳、帧索引、剧集索引、索引和任务索引。

创建时间：

2025-11-27

原始信息汇总

数据集概述

基本信息

许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot
创建工具: LeRobot (https://github.com/huggingface/lerobot)

数据集规模

总任务数: 1
总片段数: 165
总帧数: 274,298
帧率: 60 FPS
数据文件大小: 100 MB
视频文件大小: 500 MB
块大小: 1000

数据结构

数据分割

训练集: 全部165个片段

数据特征

动作特征

数据类型: float32
维度: 7
关节名称: joint_0, joint_1, joint_2, joint_3, joint_4, joint_5, gripper

观测特征

状态观测:

数据类型: float32
维度: 7
关节名称: joint_0, joint_1, joint_2, joint_3, joint_4, joint_5, gripper

图像观测:

zed2i_left: 视频格式，分辨率376×672×3，AV1编码
zed2i_right: 视频格式，分辨率376×672×3，AV1编码
zedm_left: 视频格式，分辨率376×672×3，AV1编码
zedm_right: 视频格式，分辨率376×672×3，AV1编码

索引特征

时间戳: float32，维度1
帧索引: int64，维度1
片段索引: int64，维度1
索引: int64，维度1
任务索引: int64，维度1

文件路径格式

数据文件: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

技术规格

机器人类型: ur5e
代码库版本: v3.0
视频格式: yuv420p
音频: 无

搜集汇总

数据集介绍

构建方式

在机器人技术领域，ur-task4-0数据集通过LeRobot平台精心构建，采用UR5e机器人执行单一任务，采集了165个完整交互片段，总计274298帧数据。数据以分块形式存储于Parquet文件中，每块包含1000帧，确保了高效的数据组织与访问。采集过程中，机器人关节动作与状态信息以浮点数值记录，同时通过多个摄像头捕捉高帧率视觉数据，构建了多模态的机器人交互记录。

特点

该数据集展现了丰富的多模态特性，不仅包含7维关节动作与状态向量，还整合了四路立体视觉视频流，每路视频分辨率为376x672像素，帧率高达60fps，提供了细腻的环境感知信息。数据结构严谨，具备完整的时间戳、帧索引与任务索引，支持精确的时序分析与任务关联研究。数据集规模适中，总数据量约600MB，平衡了存储效率与信息密度，适用于机器人学习算法的开发与验证。

使用方法

研究人员可通过加载Parquet格式的数据文件，直接访问机器人的动作序列、关节状态及多视角视频流。数据集已预设训练集划分，涵盖全部165个交互片段，支持端到端的机器人策略学习任务。利用LeRobot提供的工具链，用户可便捷地提取时空特征，进行行为克隆、强化学习等算法实验，视频数据采用AV1编码压缩，在保证质量的同时优化了存储与传输效率。

背景与挑战

背景概述

在机器人技术迅猛发展的背景下，ur-task4-0数据集作为LeRobot项目的重要组成部分，专注于机械臂控制与感知研究。该数据集由HuggingFace社区基于UR5e机器人平台构建，收录了165个完整任务片段，涵盖27万余帧高频率传感器数据。其核心目标在于解决机器人操作任务中的状态感知与动作规划问题，通过整合多视角视觉输入与关节控制指令，为强化学习与模仿学习算法提供标准化训练资源，显著推动了机器人自主决策能力的发展。

当前挑战

该数据集致力于应对机器人操作任务中动态环境适应性与动作泛化能力的核心难题。构建过程中面临多模态数据同步的技术挑战，需确保60Hz高频视频流与关节状态数据的精确对齐；同时，大规模感知数据的存储与处理要求高效压缩算法，以平衡数据质量与存储成本。此外，真实场景下机械臂操作存在的物理约束与传感器噪声，进一步增加了数据标注与质量控制的复杂性。

常用场景

经典使用场景

在机器人学习领域，ur-task4-0数据集通过记录UR5e机械臂的关节控制与多视角视觉数据，为模仿学习算法提供了丰富的训练素材。该数据集包含165个完整任务序列，涵盖七自由度机械臂动作轨迹与立体视觉观测，常被用于构建端到端的机器人策略网络，实现从视觉输入到关节控制的直接映射。

解决学术问题

该数据集有效解决了机器人领域样本效率低下的核心难题，通过高帧率同步记录机械臂状态与多摄像头视觉流，为研究视觉-动作对应关系提供了标准化基准。其结构化数据支撑了从动态系统建模到强化学习泛化能力的研究，显著推进了基于视觉的机器人控制算法在真实场景中的适应性研究。

衍生相关工作

该数据集催生了多项机器人学习领域的创新研究，包括基于时空注意力的行为克隆架构、多模态表征融合网络等。相关成果已延伸至跨任务迁移学习、动态环境适应等方向，为后续构建大规模机器人操作数据集建立了数据规范与评估标准。

以上内容由遇见数据集搜集并总结生成