example_data_fastumi_pro_raw

Hugging Face2025-11-28 更新2025-11-29 收录

下载链接：

https://huggingface.co/datasets/FastUMIPro/example_data_fastumi_pro_raw

下载链接

链接失效反馈

官方服务：

资源简介：

FastUMI（快速通用操作接口）是一个用于通用机器人操作任务的数据集和接口框架，旨在支持硬件无关、可扩展且高效的数据收集和模型训练。该数据集包含约15万条真实世界的操作轨迹，可用于大规模视觉-语言-动作（VLA）模型的训练，并展示了多任务泛化能力。数据集提供了多种类型的数据，包括多视角RGB图像、SLAM位姿轨迹、Vive跟踪系统位姿、时间飞行点云数据、夹具传感器读数和融合轨迹数据。

创建时间：

2025-11-24

原始信息汇总

FastUMI Pro 数据集概述

数据集基本信息

名称：FastUMI Pro Dataset
类型：机器人操作数据集
语言：英语、中文
标签：机器人技术、操作、VLA、轨迹数据、多模态、视觉-语言-动作
许可证：其他
任务类别：机器人技术、强化学习
模态：视觉+语言+动作

核心特性

FastUMI Pro增强功能

更高精度的轨迹数据
多样化体现支持，实现真正的"一脑多形态"
企业级就绪的流水线和全链路数据处理

FastUMI-150K

约150,000条真实世界操作轨迹
被研究合作伙伴用于大规模VLA模型训练
展现出显著的多任务泛化能力

数据特征

数据结构

rgb_images：多视角RGB图像
slam_poses：SLAM姿态轨迹
vive_poses：Vive追踪系统姿态
point_clouds：飞行时间点云数据
clamp_data：夹具传感器读数
merged_trajectory：融合轨迹数据

数据规范

数据类型与格式

数据类型	路径	形状	类型	描述
RGB图像	`session_XXX/RGB_Images/Video.MP4`	`(frames, 1080, 1920, 3)`	`uint8`	相机视频数据，60 FPS
SLAM姿态	`session_XXX/SLAM_Poses/slam_raw.txt`	`(timestamps, 7)`	`float`	UMI末端执行器姿态
Vive姿态	`session_XXX/Vive_Poses/vive_data_tum.txt`	`(timestamps, 7)`	`float`	Vive基站姿态
ToF点云	`session_XXX/PointClouds/pointcloud_...pcd`	pcd格式	pcd	飞行时间点云数据
夹具数据	`session_XXX/Clamp_Data/clamp_data_tum.txt`	`(timestamps, 1)`	`float`	夹具间距(mm)
融合轨迹	`session_XXX/Merged_Trajectory/merged_trajectory.txt`	`(timestamps, 7)`	`float`	融合轨迹(基于速度的Vive/UMI)

姿态数据格式

所有姿态数据(SLAM、Vive、融合)遵循相同格式：

时间戳：轨迹数据的Unix时间戳
位置X：X坐标(米)
位置Y：Y坐标(米)
位置Z：Z坐标(米)
Q_X：方向四元数X分量
Q_Y：方向四元数Y分量
Q_Z：方向四元数Z分量
Q_W：方向四元数W分量

工具链

开发工具

单臂演示回放：单臂数据回放代码
双臂演示回放：双臂数据回放代码
硬件SDK：FastUMI硬件开发工具包
监控工具：实时设备监控
数据收集：数据收集实用工具

数据下载

示例数据集下载命令

bash

直接下载

huggingface-cli download FastUMIPro/example_data_fastumi_pro_raw --repo-type dataset --local-dir ~/fastumi_data/

镜像下载(推荐)

export HF_ENDPOINT=https://hf-mirror.com huggingface-cli download --repo-type dataset --resume-download FastUMIPro/example_data_fastumi_pro_raw --local-dir ~/fastumi_data/

协作与联系

数据集可用性：可用于研究协作
完整数据集：FastUMI-150K已提供给合作伙伴研究团队进行大规模模型训练
联系人：Ding Yan
邮箱：dingyan@lumosbot.tech
微信：Duke_dingyan

搜集汇总

数据集介绍

构建方式

在机器人操作研究领域，FastUMI Pro数据集通过多模态传感器融合技术构建而成。数据采集过程采用标准化硬件原型系统，同步记录多视角RGB图像、SLAM位姿轨迹、Vive追踪系统数据、飞行时间点云以及夹具传感器读数。每个操作会话构成独立的交互片段，通过精密的时间戳对齐机制确保多源数据的时空一致性。融合轨迹数据基于速度特征智能选择最优追踪源，形成完整操作序列。

使用方法

研究者可通过HuggingFace平台直接下载数据集，或利用镜像服务获取数据资源。数据按会话层级组织，每个会话包含独立的观察数据与动作序列。配套工具链提供单臂与双臂演示回放代码、硬件开发套件及实时监控工具。数据集适用于视觉-语言-动作模型训练，支持大规模多任务泛化研究，可通过标准化数据格式与现有机器人学习框架无缝集成。

背景与挑战

背景概述

机器人操作领域长期面临数据稀缺与系统异构性难题，FastUMI Pro数据集由LumosBot技术团队于2024年推出，旨在构建通用操作接口框架。该数据集聚焦多模态感知与动作轨迹的协同学习，通过整合视觉、语言与动作数据，推动机器人实现跨任务泛化能力。其包含的15万条真实世界操作轨迹，为视觉-语言-动作模型训练提供了规模化基础，显著提升了工业场景下的操作精度与适应性。

当前挑战

在机器人操作任务中，多模态数据的时间同步与空间标定构成核心挑战，需解决视觉图像、SLAM位姿与点云数据的精确对齐问题。数据集构建过程中面临传感器异构性整合难题，包括Vive追踪系统与UMI末端执行器的坐标系统一，以及高帧率RGB视频与低频轨迹数据的插值融合。此外，企业级应用要求数据管道具备实时处理能力，这对多源传感数据的并行采集与存储架构提出了严苛要求。

常用场景

经典使用场景

在机器人操作研究领域，FastUMI Pro数据集作为通用操作接口框架的核心资源，其最经典的应用场景在于训练视觉-语言-动作多模态模型。该数据集通过15万条真实世界操作轨迹，为机器人学习复杂操作技能提供了丰富样本，涵盖多视角RGB图像、高精度轨迹数据和点云信息等多维感知输入，有效支撑了从感知到动作的端到端学习范式。

解决学术问题

该数据集主要解决了机器人操作研究中硬件依赖性强、数据标准化不足等关键问题。通过提供硬件无关的标准化数据格式，显著降低了跨平台算法验证的难度；其融合SLAM与Vive系统的轨迹数据为运动规划研究提供了精准基准，而多任务泛化能力的验证则推动了通用操作智能体的理论发展，对具身智能领域的算法创新具有重要奠基意义。

实际应用

在工业自动化场景中，该数据集支撑的VLA模型已应用于智能装配线中的灵巧操作任务。基于多模态数据训练的机器人能够理解自然语言指令，完成精密零部件抓取与装配；物流分拣系统则利用其轨迹学习能力实现动态环境下的自适应抓取。这些应用显著提升了生产流程的智能化水平，为制造业数字化转型提供了技术支撑。

数据集最近研究