five

factorynet

收藏
Hugging Face2026-05-08 更新2026-05-09 收录
下载链接:
https://huggingface.co/datasets/factorynet/factorynet
下载链接
链接失效反馈
官方服务:
资源简介:
FactoryNet 是一个大规模、统一的数据集,旨在推动机器人制造领域的工业时间序列基础模型的发展。该数据集提供了高度标准化的高频遥测数据,涵盖不同的机器人形态(UR3、KUKA)、专用末端执行器(螺丝刀、夹持器)以及数万次模拟反事实数据。FactoryNet 是序列建模、异常检测和仿真到现实差距分析的严格基准。数据集采用统一的 Setpoint-Effort-Feedback-Context (S-E-F-C) 主模式,将所有遥测数据映射到标准化的表示形式,包括设定点(命令状态)、努力(硬件物理输出)、反馈(测量的物理状态)和上下文(元数据和离散状态)。此外,数据集还提供了专门用于 UR3 拾取和放置任务的 Sim2Real 差距分析工具包,包括配对的实际和模拟执行数据、配置文件和差距分析报告。

FactoryNet is a large-scale, unified dataset designed to advance industrial time-series foundation models in robotics manufacturing. It provides highly standardized high-frequency telemetry data covering different robot morphologies (UR3, KUKA), specialized end-effectors (screwdrivers, grippers), and tens of thousands of simulated counterfactual data. FactoryNet serves as a rigorous benchmark for sequence modeling, anomaly detection, and sim-to-real gap analysis. The dataset employs a unified Setpoint-Effort-Feedback-Context (S-E-F-C) schema, mapping all telemetry data to standardized representations including setpoint (commanded state), effort (hardware physical output), feedback (measured physical state), and context (metadata and discrete states). Additionally, the dataset provides a Sim2Real gap analysis toolkit specifically for UR3 pick-and-place tasks, including paired real and simulated execution data, configuration files, and gap analysis reports.
创建时间:
2026-05-02
原始信息汇总

FactoryNet 数据集概述

数据集简介

FactoryNet 是一个大规模、统一的数据集,旨在推动工业时间序列基础模型在机器人制造领域的发展。该数据集提供了高度标准化、高频的遥测数据,涵盖不同机器人形态(UR3、KUKA)、专用末端执行器(螺丝刀、夹爪)以及数万个模拟反事实数据,可作为序列建模、异常检测和模拟到现实差距分析的严格基准。


数据集结构

数据集主要包含两个组成部分:

1. 数据文件(data/ 目录)

包含大规模、分块的 Parquet 文件,遵循 S-E-F-C 模式:

  • aursad_.parquet、cnc_.parquet、voraus_*.parquet:已有的结构化数据集
  • factorywave_*.parquet:真实的 UR3 和 KUKA 遥测数据(包含专用螺丝刀扭矩数据和任务元数据)
  • simulations_baseline_*.parquet:在 Isaac Sim 4.5.0 中生成的 10,000 个以上基础拾取放置任务片段
  • simulations_counterfactual_*.parquet:用于因果和异常建模的匹配反事实任务片段

2. 人工制品文件(artifacts/ 目录)

包含针对模拟到现实差距的基准测试工具包:

  • real_csv/ & sim_csv/:配对的任务片段 CSV 文件,匹配真实执行与 Isaac Sim 等效执行
  • pick_configs/:每个任务片段的 JSON 配置文件,驱动仿真参数
  • gap_reports/ & summary/:聚合的差距分析、清单和每个任务片段的 Markdown 报告

S-E-F-C 主模式

为了支持跨异构硬件的模型训练,所有遥测数据均映射到统一的 Setpoint-Effort-Feedback-Context (S-E-F-C) 模式:

  • Setpoint(setpoint_*):指令状态(位置、速度、加速度、目标扭矩)
  • Effort(effort_*):硬件的物理输出(电流、电压、力、扭矩)
  • Feedback(feedback_*):测量的物理状态(实际位置、速度)
  • Context(ctx_*):元数据和离散状态(异常标签、任务阶段、硬件模式、执行时间)

注:专用螺丝刀遥测数据(如拧紧状态、测量柄部扭矩)已完全集成到工具特定的 effort 和 context 列中。


模拟到现实差距分析(UR3 拾取放置)

任务配对与时间顺序

artifacts/ 文件夹中的真实和模拟任务片段严格按照文件名配对(如 real_csv/<uuid>.csv 对应 sim_csv/<uuid>.csv)。

时间顺序载荷桶使用边界任务片段进行动态对齐验证:

  • 0.6 kg:起始 → 0ab540a6-7210-4531-b2ed-6a04c7b90ff1
  • 0.3 kg:之后 → 29312353-3555-4eba-b2fb-3e2495e89782
  • 1.2 kg:之后 → 640c65a7-2aee-4b58-94de-334f37832e14

差距指标

每个配对片段报告跟踪以下指标:

  • 关节 RMSE(度):各关节的误差
  • TCP 位置 RMSE(毫米)/ EE L2 RMS(毫米):合并和逐步的欧几里得位置误差
  • TCP 旋转向量 RMSE(毫弧度):旋转方向差距
  • W1 effort(安培):关节电流的 Wasserstein-1 距离,代理衡量 effort 对齐程度

(对齐方法:按时间排序、按任务阶段分割、线性重采样时间帧至 [0, 1],然后计算距离)

范围与限制

模拟到现实人工制品严格设计用于支持运动学一致性分析effort 代理比较,明确不涉及:接触精确动力学验证、视觉域真实性或相同执行器扭矩物理特性的声明。

搜集汇总
数据集介绍
main_image_url
构建方式
FactoryNet数据集源自对工业机器人制造场景中大规模、高频遥测数据的系统化采集与整合。其构建过程融合了多种异构硬件平台,包括UR3与KUKA两类机器人构型,以及螺丝刀和夹爪等专用末端执行器,全面覆盖了真实世界执行数据与基于Isaac Sim 4.5.0生成的数以万计仿真反事实样本。所有数据均被映射至统一的Setpoint-Effort-Feedback-Context(S-E-F-C)主模式架构,摒弃了供应商特定的标签体系,并采用分块Parquet格式存储于data目录下,为时序基础模型的训练奠定了高度标准化的基础。
特点
FactoryNet具备多项鲜明特色。其一,巨量规模与异构融合特性,囊括多类机器人形态与末端工具的真实遥测数据及大量仿真数据,为模型提供宽广的分布覆盖。其二,通过严格配对的真实与仿真episode文件(artifacts目录)以及计算关节RMSE、TCP位置误差、Wasserstein距离等指标,构建了定向的Sim2Real差距分析基准,助力评估模拟与现实间的动力学与任务执行偏差。其三,数据遵循S-E-F-C统一模式,显著提升了跨硬件平台的模型泛化能力与序列建模、异常检测等下游任务的迁移适用性。
使用方法
FactoryNet的使用围绕两大核心路径展开。对于基础模型预训练,研究者可直接从data目录加载Parquet文件,利用统一S-E-F-C模式字段进行序列建模、状态预测或异常检测等任务,数据已按任务类型(如factorywave、simulations)分块,便于按需调用。对于Sim2Real差距评估,使用artifacts内的配对CSV与JSON配置,依据文件名映射真实与仿真episode,并结合预生成差距报告,可系统分析关节与末端执行器的运动学对齐及代理力效差异。数据加载与指标计算可借助标准数据处理库(如Pandas)及时间序列重采样方法实现高效集成。
背景与挑战
背景概述
FactoryNet是由匿名研究团队在近期构建的大规模、统一化工业时序数据集,旨在为机器人制造领域的基础时序模型提供强有力的支撑。该数据集涵盖UR3与KUKA两种不同机械臂形态、专用末端执行器(如螺丝刀和夹爪)的高频遥测数据,并包含上万次模拟反事实生成。通过标准化S-E-F-C主模式(设定点-努力-反馈-上下文),FactoryNet解决了异构硬件环境下数据异构性问题,成为序列建模、异常检测及Sim2Real差距分析的权威基准。其发布对工业时间序列基础模型的发展具有重要推动作用,为未来智能制造中的数据驱动决策奠定了坚实基础。
当前挑战
FactoryNet所面对的领域挑战在于,工业制造中的时序数据通常高度异构、缺乏标准化,且难以跨不同硬件平台泛化,这严重阻碍了基础模型在机器人操作中的应用。构建过程中,团队需克服多源真实数据(如UR3、KUKA)与NVIDIA Isaac Sim模拟环境之间的Sim2Real差距,包括关节运动学、TCP位置误差及力矩一致性对齐等问题。此外,实现大规模、高保真反事实模拟以支持因果与异常建模,以及设计统一的S-E-F-C模式以整合专业化遥测(如螺丝刀扭矩数据),均是构建中的关键难题。最终提供的Sim2Real评估套件严格限定于运动学与努力代理比较,避免了对接触动力学或视觉域真实性的过度声明,体现了对模型泛化边界与数据局限性的审慎认识。
常用场景
经典使用场景
FactoryNet数据集最经典的使用场景在于为工业时间序列基础模型提供大规模、统一化的训练与评估基准。通过整合多种机器人形态(如UR3、KUKA)和专用末端执行器(如螺丝刀、夹爪)的高频遥测数据,并遵循统一的设定点-力-反馈-上下文(S-E-F-C)模式,该数据集能够高效支持序列建模任务。研究者可利用其标准化表示,训练出能够适应异构硬件的通用模型,从而大幅减少跨平台应用中的数据适配工作。此外,FactoryNet涵盖的数万个模拟反事实样本,为因果推断和异常检测提供了丰富而严苛的测试环境,成为衔接仿真与现实的关键桥梁。
实际应用
在实际工业场景中,FactoryNet可直接用于预测性维护、过程监控和机器人操作优化。例如,基于该数据集训练的异常检测模型,能够实时识别焊接或装配任务中的过早磨损或碰撞故障,降低非计划停机风险。其模拟反事实数据则支持安全策略的虚拟验证,允许工程师在没有物理风险的前提下测试极端工况响应。此外,跨形态的遥测基准可加速新产线中机器人(如从UR3迁移至KUKA)的部署调试,通过预训练模型快速适配不同机械臂的控制参数,显著缩短工程周期。汽车制造、电子装配等对精度要求苛刻的行业,正逐步将此类数据驱动方案纳入日常运维体系。
衍生相关工作
FactoryNet的推出已催生了一系列衍生研究工作,尤其在基础模型预训练策略与仿真校准领域。基于其统一模式,学界发展了多种多任务学习框架,例如联合优化预测与对比损失的时序编码器,以提取更具泛化能力的特征。在仿真到现实(Sim2Real)方向,研究者利用其配对数据验证了动态时间规整和对抗性域适应对齐的有效性,其中基于Wasserstein距离的力类比度量方法成为评估仿真保真度的新标准。此外,反事实样本的引入推动了因果结构学习在制造领域的应用,诞生了首个可解释的异常根因定位工作。这些成果共同塑造了工业时序基础模型的研究范式,为智能制造的标准化和可重复性树立了重要里程碑。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作