five

Benchmark Dataset for Locating Atoms in STEM images

收藏
arXiv2022-07-21 更新2024-06-21 收录
下载链接:
https://petreldata.net/mdf/detail/foundry_wei_atom_locating_benchmark_v1.1
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集名为‘Benchmark Dataset for Locating Atoms in STEM images’,由威斯康星大学麦迪逊分校材料科学与工程系的研究团队创建。数据集包含300张模拟和实验的扫描透射电子显微镜(STEM)图像,所有图像均标注了原子列位置。该数据集旨在通过一系列图像质量指标,评估不同晶格中原子定位模型的性能。数据集内容涵盖多种晶格类型、缺陷和界面,适用于研究原子级分辨率图像中的缺陷、固态反应动态、相变等问题。数据集通过Foundry服务提供,支持快速、便捷的模型测试和数据再利用。

This benchmark dataset, named *Benchmark Dataset for Locating Atoms in STEM images*, was developed by a research team from the Department of Materials Science and Engineering, University of Wisconsin-Madison. The dataset consists of 300 simulated and experimental scanning transmission electron microscopy (STEM) images, all of which are annotated with atomic column positions. This dataset is designed to evaluate the performance of atomic localization models across diverse lattices using a series of image quality metrics. It covers a wide range of lattice types, defects and interfaces, making it applicable to research on defects in atomic-resolution images, dynamics of solid-state reactions, phase transitions and other related topics. The dataset is available via the Foundry service, enabling fast and convenient model testing and data reuse.
提供机构:
威斯康星大学麦迪逊分校材料科学与工程系
创建时间:
2022-07-21
搜集汇总
数据集介绍
main_image_url
构建方式
在原子分辨率扫描透射电子显微镜(STEM)图像分析领域,精准定位原子柱位置是提取材料微观结构信息的关键步骤。该基准数据集的构建采用了系统化设计,包含300幅模拟与实验图像,涵盖SrTiO3 [100]和WS2 [0001]两种主要晶格,以及46幅其他晶格、缺陷和界面的实验图像。模拟图像通过GPU加速的Prismatic软件包生成,并基于像素尺寸、分辨率、对比度、泊松噪声、扫描回扫误差和随机漂移等六项质量指标进行系列化调整;实验图像则通过改变显微镜放大倍数、高斯模糊、增益与黑电平以及电子剂量等四项指标来构建。所有图像均以HDF5格式存储,包含原始图像数组、原子柱坐标像素位置及元数据,确保数据的可查询性与可重用性。
特点
该数据集的核心特点在于其系统性与多样性,旨在全面评估原子定位深度学习模型的性能。数据集通过模拟与实验图像的结合,覆盖了从理想无噪声条件到实际复杂环境的广泛图像质量范围,包括不同晶格类型、缺陷结构和异质界面。图像质量指标的系列化设计使得研究者能够定量分析模型在不同信噪比、对比度及分辨率下的表现。此外,数据集提供了精确的原子柱位置标注,模拟图像的标注基于已知的晶体结构,实验图像则通过手动标注与二维高斯拟合相结合的方式获得近似真实值,确保了评估基准的可靠性。
使用方法
该数据集的使用旨在为原子定位深度学习模型提供标准化的性能测试平台。研究者可通过Foundry服务平台访问数据集,利用其Python API快速检索特定质量指标或晶格类型的图像子集。评估流程包括使用数据集提供的图像与标注,计算模型的ID召回率、ID精确度和位置偏差等指标,以量化模型在不同图像条件下的表现。数据集还支持模型训练与验证,用户可基于提供的图像系列训练定制化模型,或利用AtomAI框架构建针对特定晶格的新模型。通过Foundry的容器化环境,模型可被直接调用与执行,简化了复现与比较过程,促进了方法的公平比较与持续优化。
背景与挑战
背景概述
在原子分辨率扫描透射电子显微镜(STEM)成像领域,精确识别原子柱位置是解析材料微观结构、缺陷动力学及物理场推断等核心问题的关键。传统方法如二维高斯拟合虽能达到皮米级精度,但依赖手动参数调整与大量计算资源,效率受限。为应对这一挑战,威斯康星大学麦迪逊分校等机构的研究团队于近年开发了“Benchmark Dataset for Locating Atoms in STEM images”数据集,旨在系统评估深度学习模型在原子定位任务中的性能。该数据集包含模拟与实验图像,涵盖多种晶体结构与图像质量参数,通过Foundry平台实现数据与模型的高效共享,推动了STEM图像分析方法的标准化与可重复性研究。
当前挑战
该数据集致力于解决原子尺度图像分割中模型泛化能力不足的挑战。具体而言,现有深度学习模型在训练数据分布外的图像(如背景强度剧烈变化的界面、低信噪比区域或原子柱重叠结构)上表现显著下降,难以保证高精度定位。在构建过程中,研究团队面临实验图像真值标注的复杂性,需结合手动标记与高斯拟合以逼近真实原子位置;同时,数据集需系统覆盖像素尺寸、对比度、分辨率等多维质量指标,以量化模型性能边界,这要求精细的图像模拟与实验设计,确保数据多样性与评估严谨性。
常用场景
经典使用场景
在原子分辨率扫描透射电子显微镜(STEM)成像领域,该数据集作为基准测试工具,被广泛用于评估深度学习模型在原子柱定位任务中的性能。通过系统性地模拟和收集不同图像质量参数(如像素尺寸、对比度、噪声水平)的STEM图像,研究者能够量化模型在多样化实验条件下的鲁棒性与准确性。这一经典应用场景不仅推动了原子尺度图像分割算法的标准化比较,还为优化神经网络架构提供了实证基础,促进了材料科学中自动化分析方法的演进。
解决学术问题
该数据集有效解决了原子尺度图像分析中长期存在的若干学术难题。传统方法如二维高斯拟合虽能实现皮米级精度,但依赖手动调参、计算冗余且效率低下。本数据集通过提供标注精确的模拟与实验图像,支持深度学习模型(如全卷积网络)的基准测试,显著提升了原子定位的自动化程度与处理速度。其意义在于为材料缺陷研究、相变动力学分析以及物理场推断等前沿课题提供了可靠的数据基础,推动了跨学科研究中高精度、高通量图像处理范式的发展。
衍生相关工作
该数据集衍生了一系列经典研究工作,深刻影响了原子尺度机器学习的发展方向。以Lin等人开发的AtomSegNet系列模型和Ziatdinov团队提出的AtomNet为代表,这些工作基于数据集优化了U-Net与残差网络架构,实现了对复杂晶格与低质量图像的高精度分割。后续研究如AtomAI框架进一步扩展了数据集的用途,支持用户针对特定材料体系训练定制化模型。这些衍生工作不仅丰富了STEM图像分析的算法生态,还促进了FAIR(可查找、可访问、可互操作、可重用)原则在科学数据管理中的实践,为跨平台模型比较与协作创新奠定了基石。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作