合成STEM图像数据集
收藏arXiv2025-04-03 更新2025-04-07 收录
下载链接:
https://github.com/HeasonLee/SFIN
下载链接
链接失效反馈官方服务:
资源简介:
本研究构建了一个包含规则和随机原子排列、HAADF和BF模式图像的合成STEM图像数据集。数据集通过校准真实STEM图像中的噪声来合成更真实的图像,包含了1000组训练数据和100组测试数据,旨在用于STEM图像增强任务,解决原子级别图像增强的现实性和通用性问题。
This study develops a synthetic STEM image dataset containing both regularly and randomly arranged atomic configurations, alongside images acquired under HAADF and BF imaging modes. The dataset is generated by calibrating the noise inherent in real-world STEM images to produce more authentic samples, and it includes 1000 training samples and 100 test samples. This dataset is designed for STEM image enhancement tasks, aiming to address the realism and generalizability challenges in atomic-scale image enhancement.
提供机构:
北京理工大学
创建时间:
2025-04-03
搜集汇总
数据集介绍

构建方式
合成STEM图像数据集的构建采用了先进的噪声校准与数据合成技术。研究团队首先通过统计分析真实STEM图像中的原子排列,拟合出背景噪声、扫描噪声和点状噪声的参数分布。基于这些参数,采用二维正态分布模拟原子柱的亮度分布,并利用Perlin噪声生成背景噪声,通过一维高斯滤波分离扫描噪声,最后采用Tukey's lambda分布模拟点状噪声。该过程不仅涵盖了HAADF和BF两种成像模式,还引入了原子缺陷、离子嵌入和界面结构等随机排列,显著提升了数据集的真实性与泛化能力。
特点
该数据集的核心特点体现在其高度逼真的噪声模拟与多样化的原子结构覆盖。通过精确校准的噪声参数,合成的STEM图像在梯度相关扫描噪声、非均匀背景噪声等方面与真实图像具有统计一致性。数据集创新性地包含了13种规则材料结构和3类随机排列模式(缺陷、嵌入、界面),同时覆盖了适用于重原子观测的HAADF模式和轻原子观测的BF模式。实验表明,其噪声分布与真实数据的Kullback-Leibler散度较现有数据集降低50%以上,R²拟合优度达到0.95,在原子定位精度上较TEMImageNet提升1.2埃。
使用方法
该数据集适用于STEM图像增强、原子检测和超分辨率重建等多类任务。使用时需将噪声图像作为输入,对应的干净图像作为监督信号,通过端到端训练空间-频率交互网络实现图像增强。对于特定任务如原子检测,可提取增强后图像的原子中心坐标;超分辨率任务则需配合下采样协议生成低分辨率-高分辨率图像对。数据集已按1000组训练数据和100组测试数据划分,支持PyTorch框架直接加载,训练推荐采用L1损失函数和Adam优化器(初始学习率2×10⁻⁴),在NVIDIA 3090 GPU上单卡batch size设置为8可获得最优效果。
背景与挑战
背景概述
合成STEM图像数据集由北京理工大学和杭州电子科技大学的研究团队于2025年创建,旨在解决扫描透射电子显微镜(STEM)图像增强中的关键问题。该数据集通过噪声校准技术,首次实现了对背景噪声、扫描噪声和点噪声的精确建模,并涵盖了HAADF和BF两种成像模式。其创新性在于引入了随机原子排列(如缺陷、嵌入和界面)来增强数据集的泛化能力,弥补了传统模拟数据缺乏真实性和多样性的缺陷。该数据集为材料科学领域的原子级结构分析提供了重要支持,推动了基于深度学习的STEM图像处理技术的发展。
当前挑战
该数据集主要面临三方面挑战:在领域问题层面,STEM图像存在独特的扫描噪声与图像梯度相关,传统基于均匀校准帧的方法无法适用,导致现有数据集噪声参数与真实情况不一致;在构建过程层面,原子排列的周期性和随机性共存增加了数据合成的复杂度,需要平衡规则晶体结构和缺陷/界面等非规则结构的模拟;此外,多模式成像(HAADF和BF)的参数校准与合成需要建立不同的物理模型,增加了数据一致性维护的难度。这些挑战通过统计分析和线性拟合真实STEM图像的噪声分布参数得到有效解决。
常用场景
经典使用场景
合成STEM图像数据集在材料科学和电子显微镜领域具有广泛的应用价值。该数据集通过噪声校准和数据合成方法,生成了高度逼真的STEM图像,为原子级材料结构分析提供了重要支持。研究人员可以利用该数据集进行图像增强算法的训练和验证,从而在噪声干扰严重的实际观测条件下,获得更清晰的原子排列图像。
实际应用
在实际应用中,该数据集为新型材料研发提供了强有力的技术支持。特别是在半导体材料、新能源材料和功能材料的研究中,研究人员可以利用该数据集训练的图像增强算法,从噪声干扰严重的原始STEM图像中提取清晰的原子结构信息。这大大加速了材料表征过程,为材料性能优化和新型材料设计提供了原子尺度的观察手段。
衍生相关工作
该数据集衍生了一系列重要的相关研究工作。基于该数据集的空间-频域交互网络(SFIN)在STEM图像增强任务中表现出色;在原子检测和原子超分辨率任务中,该数据集训练的网络模型也取得了显著优于传统方法的效果。此外,该数据集还为后续研究提供了噪声校准、数据合成和频域处理的新范式,推动了电子显微镜图像处理领域的发展。
以上内容由遇见数据集搜集并总结生成



