five

example_data_fastumi_pro_raw

收藏
Hugging Face2025-11-28 更新2025-11-29 收录
下载链接:
https://huggingface.co/datasets/FastUMIPro/example_data_fastumi_pro_raw
下载链接
链接失效反馈
官方服务:
资源简介:
FastUMI(快速通用操作接口)是一个用于通用机器人操作任务的数据集和接口框架,旨在支持硬件无关、可扩展且高效的数据收集和模型训练。该数据集包含约15万条真实世界的操作轨迹,可用于大规模视觉-语言-动作(VLA)模型的训练,并展示了多任务泛化能力。数据集提供了多种类型的数据,包括多视角RGB图像、SLAM位姿轨迹、Vive跟踪系统位姿、时间飞行点云数据、夹具传感器读数和融合轨迹数据。
创建时间:
2025-11-24
原始信息汇总

FastUMI Pro 数据集概述

数据集基本信息

  • 名称:FastUMI Pro Dataset
  • 类型:机器人操作数据集
  • 语言:英语、中文
  • 标签:机器人技术、操作、VLA、轨迹数据、多模态、视觉-语言-动作
  • 许可证:其他
  • 任务类别:机器人技术、强化学习
  • 模态:视觉+语言+动作

核心特性

FastUMI Pro增强功能

  • 更高精度的轨迹数据
  • 多样化体现支持,实现真正的"一脑多形态"
  • 企业级就绪的流水线和全链路数据处理

FastUMI-150K

  • 约150,000条真实世界操作轨迹
  • 被研究合作伙伴用于大规模VLA模型训练
  • 展现出显著的多任务泛化能力

数据特征

数据结构

  • rgb_images:多视角RGB图像
  • slam_poses:SLAM姿态轨迹
  • vive_poses:Vive追踪系统姿态
  • point_clouds:飞行时间点云数据
  • clamp_data:夹具传感器读数
  • merged_trajectory:融合轨迹数据

数据规范

数据类型与格式

数据类型 路径 形状 类型 描述
RGB图像 session_XXX/RGB_Images/Video.MP4 (frames, 1080, 1920, 3) uint8 相机视频数据,60 FPS
SLAM姿态 session_XXX/SLAM_Poses/slam_raw.txt (timestamps, 7) float UMI末端执行器姿态
Vive姿态 session_XXX/Vive_Poses/vive_data_tum.txt (timestamps, 7) float Vive基站姿态
ToF点云 session_XXX/PointClouds/pointcloud_...pcd pcd格式 pcd 飞行时间点云数据
夹具数据 session_XXX/Clamp_Data/clamp_data_tum.txt (timestamps, 1) float 夹具间距(mm)
融合轨迹 session_XXX/Merged_Trajectory/merged_trajectory.txt (timestamps, 7) float 融合轨迹(基于速度的Vive/UMI)

姿态数据格式

所有姿态数据(SLAM、Vive、融合)遵循相同格式:

  • 时间戳:轨迹数据的Unix时间戳
  • 位置X:X坐标(米)
  • 位置Y:Y坐标(米)
  • 位置Z:Z坐标(米)
  • Q_X:方向四元数X分量
  • Q_Y:方向四元数Y分量
  • Q_Z:方向四元数Z分量
  • Q_W:方向四元数W分量

工具链

开发工具

  • 单臂演示回放:单臂数据回放代码
  • 双臂演示回放:双臂数据回放代码
  • 硬件SDK:FastUMI硬件开发工具包
  • 监控工具:实时设备监控
  • 数据收集:数据收集实用工具

数据下载

示例数据集下载命令

bash

直接下载

huggingface-cli download FastUMIPro/example_data_fastumi_pro_raw --repo-type dataset --local-dir ~/fastumi_data/

镜像下载(推荐)

export HF_ENDPOINT=https://hf-mirror.com huggingface-cli download --repo-type dataset --resume-download FastUMIPro/example_data_fastumi_pro_raw --local-dir ~/fastumi_data/

协作与联系

  • 数据集可用性:可用于研究协作
  • 完整数据集:FastUMI-150K已提供给合作伙伴研究团队进行大规模模型训练
  • 联系人:Ding Yan
  • 邮箱:dingyan@lumosbot.tech
  • 微信:Duke_dingyan
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作研究领域,FastUMI Pro数据集通过多模态传感器融合技术构建而成。数据采集过程采用标准化硬件原型系统,同步记录多视角RGB图像、SLAM位姿轨迹、Vive追踪系统数据、飞行时间点云以及夹具传感器读数。每个操作会话构成独立的交互片段,通过精密的时间戳对齐机制确保多源数据的时空一致性。融合轨迹数据基于速度特征智能选择最优追踪源,形成完整操作序列。
使用方法
研究者可通过HuggingFace平台直接下载数据集,或利用镜像服务获取数据资源。数据按会话层级组织,每个会话包含独立的观察数据与动作序列。配套工具链提供单臂与双臂演示回放代码、硬件开发套件及实时监控工具。数据集适用于视觉-语言-动作模型训练,支持大规模多任务泛化研究,可通过标准化数据格式与现有机器人学习框架无缝集成。
背景与挑战
背景概述
机器人操作领域长期面临数据稀缺与系统异构性难题,FastUMI Pro数据集由LumosBot技术团队于2024年推出,旨在构建通用操作接口框架。该数据集聚焦多模态感知与动作轨迹的协同学习,通过整合视觉、语言与动作数据,推动机器人实现跨任务泛化能力。其包含的15万条真实世界操作轨迹,为视觉-语言-动作模型训练提供了规模化基础,显著提升了工业场景下的操作精度与适应性。
当前挑战
在机器人操作任务中,多模态数据的时间同步与空间标定构成核心挑战,需解决视觉图像、SLAM位姿与点云数据的精确对齐问题。数据集构建过程中面临传感器异构性整合难题,包括Vive追踪系统与UMI末端执行器的坐标系统一,以及高帧率RGB视频与低频轨迹数据的插值融合。此外,企业级应用要求数据管道具备实时处理能力,这对多源传感数据的并行采集与存储架构提出了严苛要求。
常用场景
经典使用场景
在机器人操作研究领域,FastUMI Pro数据集作为通用操作接口框架的核心资源,其最经典的应用场景在于训练视觉-语言-动作多模态模型。该数据集通过15万条真实世界操作轨迹,为机器人学习复杂操作技能提供了丰富样本,涵盖多视角RGB图像、高精度轨迹数据和点云信息等多维感知输入,有效支撑了从感知到动作的端到端学习范式。
解决学术问题
该数据集主要解决了机器人操作研究中硬件依赖性强、数据标准化不足等关键问题。通过提供硬件无关的标准化数据格式,显著降低了跨平台算法验证的难度;其融合SLAM与Vive系统的轨迹数据为运动规划研究提供了精准基准,而多任务泛化能力的验证则推动了通用操作智能体的理论发展,对具身智能领域的算法创新具有重要奠基意义。
实际应用
在工业自动化场景中,该数据集支撑的VLA模型已应用于智能装配线中的灵巧操作任务。基于多模态数据训练的机器人能够理解自然语言指令,完成精密零部件抓取与装配;物流分拣系统则利用其轨迹学习能力实现动态环境下的自适应抓取。这些应用显著提升了生产流程的智能化水平,为制造业数字化转型提供了技术支撑。
数据集最近研究
最新研究方向
在机器人操作领域,FastUMI Pro数据集正推动通用操作界面的前沿探索。其融合视觉-语言-动作的多模态特性,为大规模VLA模型训练提供了真实世界轨迹数据支撑,助力实现跨硬件平台的统一控制范式。当前研究聚焦于多任务泛化能力的提升,通过高精度轨迹数据与多样化本体支持,构建具备环境感知与自主决策能力的智能操作系统,为工业自动化与服务机器人发展奠定数据基石。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作