Segmented high-resolution transmission electron microscopy images of nanoparticles
收藏arXiv2023-06-21 更新2024-06-21 收录
下载链接:
https://doi.org/10.7941/D1SP93
下载链接
链接失效反馈官方服务:
资源简介:
本数据集名为‘Segmented high-resolution transmission electron microscopy images of nanoparticles’,由劳伦斯伯克利国家实验室分子铸造厂创建。数据集包含211个经过手动标注的高分辨率透射电子显微镜(HRTEM)图像,主要用于纳米粒子分割任务。数据集的创建涉及从大型HRTEM图像中选择和预处理图像,包括去除X射线、平场校正、图像值重新调整和分割成小块。该数据集主要应用于纳米材料的高通量分析,旨在解决机器学习模型在处理与训练数据分布不同的图像时的泛化问题。
This dataset, titled 'Segmented high-resolution transmission electron microscopy images of nanoparticles', was developed by the Molecular Foundry at Lawrence Berkeley National Laboratory. It comprises 211 manually annotated high-resolution transmission electron microscopy (HRTEM) images, primarily intended for nanoparticle segmentation tasks. The dataset construction process involved selecting and preprocessing images from large-scale HRTEM image sets, including X-ray artifact removal, flat-field correction, image intensity rescaling, and cropping into smaller patches. This dataset is primarily used for high-throughput analysis of nanomaterials, with the goal of addressing the generalization gap of machine learning models when handling images with distributions differing from those of the training dataset.
提供机构:
劳伦斯伯克利国家实验室分子铸造厂
创建时间:
2023-06-21
搜集汇总
数据集介绍

构建方式
在纳米材料表征领域,高分辨率透射电子显微镜(HRTEM)图像为原子尺度结构分析提供了关键数据。该数据集的构建基于实验采集的HRTEM图像,通过严格控制的成像参数(如放大倍数、电子剂量)和样品参数(如纳米颗粒直径、材料)进行系统筛选。原始图像经人工标注分割标签后,经过多步骤预处理:包括移除X射线噪声、平场校正以消除不均匀照明、像素值重缩放(标准化处理)以及分割为512×512像素的图块以优化GPU内存使用。这一流程确保了数据的一致性与机器学习模型的训练效率,同时公开了原始相机数据以支持预处理方法的可复现性研究。
特点
该数据集的核心特点在于其系统性与元数据的完整性。所有图像均附带详细的实验参数记录,涵盖显微镜条件(如放大倍数、电子剂量)和纳米颗粒属性(如尺寸、材料),为研究机器学习模型在分布外数据上的泛化能力提供了基准。图像经过精细预处理,包括平场校正和标准化重缩放,有效减少了会话间变异,提升了数据的可比性。此外,数据集聚焦于原子级分辨的晶体纳米颗粒分割任务,背景为无定形基底,这为评估模型在复杂对比度与噪声环境下的鲁棒性提供了挑战性场景。
使用方法
该数据集主要用于训练和评估卷积神经网络在HRTEM图像中的纳米颗粒分割性能。研究人员可利用其进行交叉验证实验,通过控制训练集与测试集的参数差异(如改变放大倍数或材料),系统探究模型对显微镜与样品参数的泛化行为。数据集支持标准机器学习流程,包括图像分块、数据增强(如旋转与噪声添加)以及基于残差UNet架构的模型训练。此外,其提供的原始相机数据允许用户自定义预处理流程,以研究数据转换对算法鲁棒性的影响,推动可靠自动化分析工具的发展。
背景与挑战
背景概述
在纳米材料科学领域,高分辨率透射电子显微镜(HRTEM)成像技术为原子尺度下的材料结构可视化提供了关键手段,推动了纳米颗粒合成与行为的原位研究。随着探测器速度提升与自动化显微镜系统的普及,HRTEM图像数据量急剧增长,亟需高效、准确的自动化分析方法。卷积神经网络(CNN)凭借其卓越的空间特征提取能力,已成为HRTEM图像分析中最具前景的工具之一,尤其在纳米颗粒分割任务中展现出显著优势。该数据集由劳伦斯伯克利国家实验室分子铸造厂的Katherine Sytwu等人于2023年创建,旨在系统探究训练数据集特征对神经网络泛化性能的影响,核心研究问题聚焦于不同实验参数(如放大倍数、电子剂量、纳米颗粒尺寸与材料)下CNN模型的稳健性。该数据集的发布为HRTEM图像分析算法的标准化评估提供了重要基准,推动了数据驱动方法在显微学领域的可靠应用。
当前挑战
该数据集所针对的纳米颗粒分割任务面临两大核心挑战:其一,在领域问题层面,HRTEM图像中纳米颗粒与背景的对比度受多种实验参数影响,如电子剂量变化导致的信噪比波动、放大倍数调整引起的特征尺度差异,以及纳米颗粒材料与尺寸不同带来的对比度与晶格条纹变化,这些因素使得模型在跨参数泛化时易出现性能下降,尤其对分布外数据的适应性不足。其二,在数据集构建过程中,挑战主要体现在数据预处理环节:原始相机数据需经过降噪、平场校正、像素值重缩放等复杂转换,而不同预处理策略(如归一化、标准化或基于直方图的缩放)会显著影响图像统计分布,进而左右模型的泛化能力;同时,人工标注过程中存在边缘判定偏差与主观误差,加之实验会话间的照明差异等非受控因素,进一步增加了构建高质量、一致性标注数据的难度。
常用场景
经典使用场景
在纳米材料表征领域,高分辨率透射电子显微镜(HRTEM)图像的分析常面临高通量处理的挑战。该数据集通过提供经过分割标注的纳米颗粒HRTEM图像,为机器学习模型在纳米颗粒分割任务中的训练与验证提供了基准。其经典使用场景在于评估卷积神经网络在原子尺度图像中的泛化能力,特别是在不同显微镜参数(如放大倍数和电子剂量)与样品参数(如纳米颗粒尺寸和材料)下的性能表现。数据集的设计使得研究者能够系统探究训练数据分布对模型鲁棒性的影响,为优化图像分析算法提供了实验基础。
衍生相关工作
该数据集衍生了一系列经典研究工作,主要集中在HRTEM图像分析的算法优化与泛化探究。例如,基于残差UNet架构的分割模型被用于评估不同预处理方法(如标准化与直方图缩放)对性能的影响。后续研究进一步探索了合成噪声增强(如高斯噪声添加)作为提升模型鲁棒性的策略,以应对低剂量成像中的信噪比挑战。此外,数据集促进了跨参数泛化基准的建立,为后续研究如低剂量图像去噪、多材料纳米颗粒识别以及自动化显微镜工作流的开发提供了数据基础与验证框架。
数据集最近研究
最新研究方向
在纳米材料高分辨率透射电子显微镜(HRTEM)图像分析领域,随着自动化显微镜和高速探测器技术的进步,海量数据的涌现催生了基于卷积神经网络的高通量分析方法。然而,神经网络在分布外数据上的泛化能力不足,成为制约其实际部署的关键瓶颈。近期研究聚焦于探究训练数据集中元数据特征(如放大倍数、电子剂量、纳米颗粒直径和材料)对神经网络分割性能的影响,揭示了数据预处理(如像素值重缩放和平面场校正)对模型泛化性的决定性作用。热点方向包括开发跨实验参数的鲁棒算法,以支持原位研究和自动化显微镜应用,同时强调共享原始相机数据以促进预处理标准化,从而推动数据驱动方法在动态成像条件下的可靠应用。
相关研究论文
- 1Generalization Across Experimental Parameters in Machine Learning Analysis of High Resolution Transmission Electron Microscopy Datasets劳伦斯伯克利国家实验室分子铸造厂 · 2023年
以上内容由遇见数据集搜集并总结生成



