five

TiO2-SEM

收藏
arXiv2025-05-24 更新2025-05-27 收录
下载链接:
https://github.com/BAMresearch/automatic-sem-image-segmentation
下载链接
链接失效反馈
官方服务:
资源简介:
TiO2-SEM数据集包含二氧化钛颗粒的电子显微图像及其相应的分割掩模,用于定义纳米颗粒的边界。该数据集由印度理工学院卡哈拉格普尔分校的研究团队提供,旨在解决纳米材料研究中缺乏高质量标注数据集的问题,以促进纳米颗粒图像的生成和分割模型的训练。数据集来源于电子显微图像,包括扫描电子显微图像和透射扫描电子显微图像,以及它们的手动标注分割和分类掩模。通过使用F-ANcGAN模型,该数据集被扩展并提升了数据质量,从而提高了下游分割模型的泛化能力和准确性。

The TiO2-SEM Dataset contains electron microscopic images of titanium dioxide particles and their corresponding segmentation masks, which are used to define the boundaries of the nanoparticles. This dataset was provided by a research team from the Indian Institute of Technology Kharagpur, aiming to address the shortage of high-quality annotated datasets in nanomaterial research and facilitate the training of nanoparticle image generation and segmentation models. The dataset is sourced from electron microscopic images, including scanning electron microscopy (SEM) and scanning transmission electron microscopy (STEM) images, along with their manually annotated segmentation and classification masks. By employing the F-ANcGAN model, this dataset has been expanded and its data quality enhanced, thereby improving the generalization capability and accuracy of downstream segmentation models.
提供机构:
印度理工学院卡哈拉格普尔分校
创建时间:
2025-05-24
原始信息汇总

Automatic SEM Image Segmentation 数据集概述

数据集基本信息

数据集内容

主要文件夹结构

  1. Archive

    • Automatic_SEM_Image_Segmentation: 原始出版物中使用的Python代码版本
    • Other Scripts: 出版物中讨论的各种指标计算脚本
    • Trained Neural Network Models: 完整训练的神经网络模型(包括SEM图像分割和分类网络)
  2. Datasets

    • Electron Microscopy Image Masks: 手动标注的SEM图像分割和分类掩码
    • Electron Microscopy Images: 原始未处理的SEM/TSEM图像
  3. ImageJ Plugin

    • 提供beta版ImageJ插件,支持直接使用训练好的神经网络进行推理
  4. Other Scripts

    • 包含Python和Jupyter Notebook示例文件,演示如何使用训练模型进行SEM图像分割和分类
  5. Releases

    • 包含工作流实现的不同版本(1.0.0至1.2.0)

使用说明

  1. 训练自定义网络

    • 下载Releases文件夹中的Python脚本
    • 创建Input_ImagesInput_Masks子目录
    • 安装依赖包(pip install -r requirements.txt
    • 配置StartProcess.py参数并运行
  2. 版本特性

    • 1.2.0: 支持Keras v3,兼容TensorFlow/PyTorch后端
    • 1.1.1: 新增TEM图像处理功能,修复多个bug
    • 1.1.0: 完全重构代码,支持更多现代Python版本
    • 1.0.x: 初始发布版本

示例应用

  • 包含多种材料(Au/TiO2/BaSO4/SiO2/FeOx)的粒子图像
  • 支持不同成像技术(SEM/eSEM/TEM)的自动分割

许可信息

  1. 出版物: CC BY 4.0
  2. 训练数据: CC BY-NC-ND 4.0
  3. ImageJ插件: MIT License
  4. 代码:
    • 1.0.x版本: GPL v3.0
    • 1.1.x/1.2.x版本: MIT License
搜集汇总
数据集介绍
main_image_url
构建方式
TiO2-SEM数据集的构建采用了先进的生成对抗网络(GAN)技术,具体为F-ANcGAN架构,通过结合Style U-Net生成器和U-Net分割网络的自注意力机制,实现了从分割掩码直接生成高保真的扫描电子显微镜(SEM)图像。该架构利用循环一致性损失和风格解码路径,确保了生成图像的结构准确性和纹理多样性。数据预处理包括图像缩放、归一化以及多种增强技术,如水平垂直翻转和随机裁剪,以提升模型的鲁棒性。
特点
TiO2-SEM数据集的特点在于其高保真度和多样性,能够模拟真实SEM图像中的纳米颗粒形态、聚集模式和成像伪影。数据集通过F-ANcGAN生成的图像在FID评分上达到了17.65,经过后处理优化后进一步降至10.39,显示出极高的视觉真实感。此外,数据集还包含人工合成的不同密度纳米颗粒图像,扩展了其在多种实际场景中的应用潜力。
使用方法
TiO2-SEM数据集主要用于训练和评估纳米颗粒分割模型。研究人员可以通过加载预生成的图像和对应的分割掩码,直接用于模型训练。此外,数据集还支持生成新的合成图像,用户只需提供自定义的分割掩码,即可通过预训练的F-ANcGAN模型生成对应的SEM图像。数据集的划分包括训练集(70%)、验证集(20%)和测试集(10%),便于进行模型性能的全面评估。
背景与挑战
背景概述
TiO2-SEM数据集由德国联邦材料研究与测试研究所(BAM)的研究团队于2021年创建,旨在解决纳米材料表征领域的关键瓶颈问题。该数据集包含二氧化钛(TiO2)纳米颗粒的扫描电子显微镜(SEM)图像及其对应的分割掩膜,为纳米颗粒的形态学分析提供了重要基准。随着深度学习在纳米材料表征中的广泛应用,TiO2-SEM数据集成为训练和评估纳米颗粒分割模型的基础资源,显著推动了纳米科学领域的高通量分析方法发展。
当前挑战
TiO2-SEM数据集面临的核心挑战体现在两个维度:在领域问题层面,纳米颗粒的不规则形貌、聚集效应及成像伪影导致传统分割算法难以准确识别颗粒边界;在构建过程层面,高精度标注需要材料学专家参与,而纳米尺度成像的噪声干扰和低对比度特性使得标注一致性难以保证。此外,数据稀缺性(仅包含有限样本量)限制了深度学习模型的泛化能力,促使研究者开发基于生成对抗网络的合成数据增强方法以突破这一瓶颈。
常用场景
经典使用场景
TiO2-SEM数据集在纳米材料研究中扮演着关键角色,特别是在纳米粒子拓扑结构的精确分析方面。该数据集通过提供高质量的扫描电子显微镜(SEM)图像及其对应的分割掩膜,为深度学习模型的训练和验证提供了可靠的基础。其经典使用场景包括纳米粒子的自动分割、形态学分析以及生成对抗网络(GANs)的训练,这些应用显著提升了纳米材料表征的准确性和效率。
解决学术问题
TiO2-SEM数据集有效解决了纳米材料研究中数据稀缺和标注困难的核心问题。通过提供高质量的图像-掩膜对,该数据集支持了基于深度学习的纳米粒子分割模型的开发,显著提升了模型在复杂背景和噪声条件下的鲁棒性。此外,数据集还推动了生成模型如F-ANcGAN的发展,这些模型能够从有限的数据中生成高保真的合成图像,进一步缓解了数据不足的瓶颈。
衍生相关工作
TiO2-SEM数据集催生了一系列重要的衍生工作,包括基于注意力机制的生成对抗网络(如F-ANcGAN)和半自动合成数据管道。这些工作不仅扩展了数据集的应用范围,还推动了纳米材料图像分析技术的进步。例如,Mill等人提出的合成图像渲染方法,以及Liang等人结合合成与真实数据的分割策略,均在该数据集的基础上取得了显著成果。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作