human_mug_0718
收藏Hugging Face2025-07-19 更新2025-07-20 收录
下载链接:
https://huggingface.co/datasets/sriramsk/human_mug_0718
下载链接
链接失效反馈官方服务:
资源简介:
这是一个使用LeRobot工具创建的机器人任务数据集,包含30个剧集,共37780帧,分为1个任务。数据集以Parquet格式存储,并提供相应的视频文件。数据集特征包括动作、状态、末端执行器位姿等信息。
创建时间:
2025-07-19
原始信息汇总
数据集概述
基本信息
- 许可证: apache-2.0
- 任务类别: robotics
- 标签: LeRobot
- 配置:
- 默认配置数据文件路径:
data/*/*.parquet
- 默认配置数据文件路径:
数据集描述
- 创建工具: LeRobot
- 主页: [More Information Needed]
- 论文: [More Information Needed]
数据集结构
- 代码库版本: v2.1
- 机器人类型: aloha
- 总集数: 30
- 总帧数: 37780
- 总任务数: 1
- 总视频数: 60
- 总块数: 1
- 块大小: 1000
- 帧率: 60 fps
- 分割:
- 训练集: 0:30
数据路径
- 数据路径:
data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet - 视频路径:
videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
特征
- action:
- 数据类型: float32
- 形状: [18]
- 名称: 包含左右机械臂各关节名称
- observation.state:
- 数据类型: float32
- 形状: [18]
- 名称: 与action相同
- observation.right_eef_pose:
- 数据类型: float32
- 形状: [10]
- 名称: 包含6D旋转、平移和夹爪关节信息
- action.right_eef_pose:
- 数据类型: float32
- 形状: [10]
- 名称: 与observation.right_eef_pose相同
- observation.images.cam_azure_kinect.transformed_depth:
- 数据类型: video
- 形状: [720, 1280, 1]
- 信息: 对齐到彩色图像的深度图像
- observation.images.cam_azure_kinect.color:
- 数据类型: video
- 形状: [720, 1280, 3]
- 信息: 原始彩色图像
- timestamp:
- 数据类型: float32
- 形状: [1]
- frame_index:
- 数据类型: int64
- 形状: [1]
- episode_index:
- 数据类型: int64
- 形状: [1]
- index:
- 数据类型: int64
- 形状: [1]
- task_index:
- 数据类型: int64
- 形状: [1]
引用
- BibTeX: [More Information Needed]
搜集汇总
数据集介绍

构建方式
在机器人操作任务的数据采集领域,human_mug_0718数据集依托LeRobot框架构建,通过双机械臂系统(ALOHA机器人)记录30个完整操作序列,共计37780帧数据。数据以60Hz频率采集,涵盖机器人关节状态、末端执行器位姿及多模态传感器信息,并以标准化Parquet格式分块存储,确保数据的高效访问与完整性。
特点
该数据集的核心特征体现在其多模态异构数据结构,包含18维关节动作与状态向量、10维末端执行器位姿描述符,以及720p分辨率彩色与深度视觉流。所有数据均具有精确的时间戳对齐与帧索引机制,支持机器人学习研究中动作-观测的精确映射,特别是双臂协调操作任务的算法验证与模型训练。
使用方法
研究者可通过HuggingFace数据加载工具直接读取Parquet格式的分块数据,按帧索引提取多模态观测与对应动作标签。数据集默认划分为训练集(30个任务序列),适用于模仿学习、强化学习等范式,支持端到端策略训练或行为克隆实验,同时提供视频流用于可视化验证与定性分析。
背景与挑战
背景概述
机器人操作数据集human_mug_0718由HuggingFace的LeRobot项目团队于2024年构建,专注于双机械臂系统的精细操作任务研究。该数据集采用ALOHA机器人平台采集,包含30个完整操作序列和37780帧高精度时空数据,涵盖关节状态、末端执行器位姿及多模态视觉信息。其核心价值在于为模仿学习与行为克隆算法提供真实世界的人类演示数据,推动机器人自主操作能力的发展,对家庭服务与工业自动化领域具有重要研究意义。
当前挑战
该数据集致力于解决机器人精细操作中的动作映射与环境感知难题,其构建面临多维度挑战:需同步采集18自由度双机械臂的关节控制信号与末端执行器10维位姿数据,保持60Hz高频采样下的时序一致性;深度相机与彩色相机的多模态视觉数据对齐要求精确的空间标定;真实操作环境中光照变化与物体遮挡增加了视觉感知的复杂性。这些挑战对数据采集系统的精度与鲁棒性提出了极高要求。
常用场景
经典使用场景
在机器人操作学习领域,human_mug_0718数据集通过记录双机械臂执行抓取任务的全流程数据,为模仿学习算法提供了丰富的训练素材。其包含的高精度关节状态、末端执行器位姿及多模态传感器数据,能够有效支撑从示教到策略生成的完整研究链条。
衍生相关工作
该数据集催生了多项关于多模态表征学习的创新研究,包括基于时空注意力的动作预测模型、跨模态对齐算法等。这些工作通过挖掘数据集中视觉-动作的对应关系,推动了机器人感知与控制一体化框架的发展,为后续大规模操作数据集的构建提供了重要范式。
数据集最近研究
最新研究方向
在机器人操作学习领域,human_mug_0718数据集作为LeRobot生态系统的重要组成部分,正推动双臂协作操作任务的前沿研究。该数据集通过高精度动作捕捉与多模态感知数据,为模仿学习与强化学习算法提供了丰富的训练素材。当前研究热点集中于跨模态表征学习,旨在融合视觉观测与关节动作数据,提升机器人对复杂操作任务的泛化能力。随着具身智能研究的兴起,该数据集在推动机器人理解人类操作意图、实现精细物体操控方面展现出重要价值,为家庭服务机器人与工业自动化应用提供了关键数据支撑。
以上内容由遇见数据集搜集并总结生成



