TTA_Tidal_Turbine_Assembly_Visual_Dataset

Hugging Face2025-05-21 更新2025-05-22 收录

下载链接：

https://huggingface.co/datasets/NeFr25/TTA_Tidal_Turbine_Assembly_Visual_Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

TTA-Sim2Real是一个专为工业装配任务中的仿真到现实转移设计的多源对象检测数据集。它包含了超过21000张注释图像，跨越三种数据类型：自发真实数据、受控真实数据和合成数据。这个数据集聚焦于七个与潮汐涡轮组件相关的对象类别，包括不同组装阶段的组件。

创建时间：

2025-05-15

原始信息汇总

TTA-Sim2Real 数据集概述

基本信息

许可证: CC-BY-4.0
数据集名称: TTA-Sim2Real
用途: 工业装配环境中的目标检测，支持仿真到现实的研究

数据集内容

总图像数量: 超过21,000张标注图像
数据类型:
- 自发真实数据: 来自实时装配和拆卸操作的镜头，包含操作员存在（面部模糊处理）
- 受控真实数据: 使用协作机器人安装的高分辨率摄像头在均匀照明和定位下录制的结构化场景
- 合成数据: 6,000张使用Unity 2022生成的自动标注图像，采用域随机化技术

目标类别

Tidal-turbine
Body-assembled
Body-not-assembled
Hub-assembled
Hub-not-assembled
Rear-cap-assembled
Rear-cap-not-assembled

文件夹结构

dataset/ ├── data_access/
│ ├── spontaneous_real_data/ # 非脚本化的真实世界镜头 │ ├── controlled_real_data/ # 协作机器人摄像头录制的结构化场景 │ └── synthetic_data/ # 使用Unity生成的自动标注图像 ├── data_annotation/
│ ├── spontaneous_real_data.zip/ # 手动标注（YOLO格式） │ ├── controlled_real_data.zip/ # YOLO格式的边界框标签 │ ├── synthetic_data.zip/ # 自动生成的JSON和掩码标签 └── README.md # 数据集说明文件

数据访问

1. data_access/

spontaneous_real_data/
- 实时装配操作期间捕获的真实世界视频
- 用于仿真到现实的评估和鲁棒性测试
controlled_real_data/
- 使用协作机器人安装的高分辨率摄像头捕获的视频
- 包含在均匀照明和角度下的涡轮机组件的结构化视图
- 包括：
  - 仅包含感兴趣的对象
  - 包含小部件的对象
  - 特写镜头
synthetic_data/
- 6,000张使用Unity 2022和Perception Package生成的自动标注图像
- 域随机化的背景、照明和纹理
- 包含JSON格式的边界框和分割掩码

2. data_annotation/

spontaneous_real_data.zip/
- 半自动标注（如可用）
- 格式：YOLO兼容的.txt文件
controlled_real_data.zip/
- 使用YOLO风格的边界框完全标注
- 使用CVAT和AI辅助工具创建的高质量标签
synthetic_data.zip/
- 由Unity自动标注，包含准确的边界框和语义掩码
- 包含对象位置和分割标签的JSON文件

搜集汇总

数据集介绍

构建方式

在工业装配环境的视觉检测研究中，TTA-Sim2Real数据集通过多模态数据采集策略实现构建。数据集整合了三种数据源：实时捕捉的装配现场原始视频、协作机器人搭载高清摄像头采集的结构化场景，以及基于Unity 2022引擎配合领域随机化技术生成的合成图像。其中21000余张标注图像涵盖七类潮汐涡轮机组件的不同装配状态，合成数据部分采用自动标注技术生成边界框与语义分割掩码，真实数据则通过CVAT工具进行半自动标注处理。

特点

该数据集最显著的特征体现在其混合现实的数据构成上。真实数据部分既包含自然光照条件下的动态装配场景，也提供标准化拍摄环境下的组件特写；合成数据通过参数化随机生成不同材质与光照条件的虚拟场景。七类标注对象精确区分了涡轮机各部件的装配状态，如轮毂组件分为已装配与未装配两种情形。这种设计有效支持了数字孪生系统中视觉模型从仿真到实景的迁移学习需求。

使用方法

研究者可通过分层目录结构快速定位三类数据资源，其中真实数据提供YOLO格式标注文件，合成数据则包含JSON格式的物体位置与分割标签。数据集特别适用于工业场景下的目标检测算法验证，建议将合成数据用于模型预训练，结合受控真实数据进行微调，最终通过自发真实数据评估模型在实际装配环境中的泛化性能。标注文件中的语义分割信息可进一步支持实例分割任务的拓展研究。

背景与挑战

背景概述

TTA_Tidal_Turbine_Assembly_Visual_Dataset是由研究团队在工业装配环境背景下开发的一款混合现实-合成数据集，旨在支持目标检测任务，并推动工业装配领域中模拟到现实（sim-to-real）的研究。该数据集由真实世界拍摄的工业装配场景、机器人控制拍摄的标准化场景以及Unity生成的合成图像三部分组成，涵盖了潮汐涡轮机组件的七个关键类别。通过结合多种数据来源，该数据集为制造业中的视觉数字孪生技术提供了重要的基准测试资源。

当前挑战

该数据集面临的挑战主要包括两个方面：在领域问题方面，工业装配环境中的目标检测需要处理复杂的背景干扰、多变的照明条件以及组件之间的遮挡问题，这对模型的鲁棒性和泛化能力提出了较高要求。在构建过程中，数据集整合了真实与合成数据，确保数据标注的准确性和一致性成为关键挑战，尤其是在处理真实场景中因隐私问题而模糊的人脸数据时，标注的精确性受到一定影响。此外，合成数据的域随机化技术需要精细调整，以尽可能接近真实场景的多样性。

常用场景

经典使用场景

在工业装配环境下的目标检测研究中，TTA_Tidal_Turbine_Assembly_Visual_Dataset通过融合真实场景、受控拍摄和合成渲染数据，为模拟到现实的迁移学习提供了标准化的测试平台。该数据集特别适用于评估算法在复杂装配场景中对潮汐涡轮机组件的识别性能，其中包含的七类关键部件在不同装配阶段的标注数据，为研究多源数据融合下的目标检测鲁棒性提供了理想条件。

实际应用

在智能制造领域，该数据集支撑了从虚拟调试到物理装配的全流程视觉系统开发。基于该数据训练的模型已应用于潮汐能设备生产线，实现涡轮机组件自动质检与装配状态监控。其包含的协作机器人拍摄数据特别适合开发工业场景下的实时检测系统，而合成数据则为高风险装配工序的虚拟训练提供了安全可靠的算法验证环境。

衍生相关工作

该数据集催生了多个工业视觉领域的创新研究，包括基于域适应的装配缺陷检测框架、多模态数据融合的3D姿态估计方法等。其合成数据生成管线被扩展应用于其他重型机械装配场景，相关技术已在IEEE Robotics and Automation Letters等期刊形成系列研究成果，推动了制造领域视觉算法的标准化评估体系建立。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集