EBSD Patterns of 5,148 Different Cubic Phases
收藏arXiv2025-04-30 更新2025-05-13 收录
下载链接:
http://arxiv.org/abs/2504.21331v1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含5,148种不同立方相的EBSD模式,通过基于物理的动力学模拟创建。数据集用于训练神经网络模型,以预测背景校正的EBSD模式的空间群类型,并通过无监督深度学习领域适应方法,使模型能够对实验EBSD模式进行预测。
This dataset contains 5,148 EBSD patterns of distinct cubic phases, which were generated via physics-based dynamical simulations. It is utilized to train neural network models for predicting the space group types of background-corrected EBSD patterns, and enables the trained models to perform predictions on experimental EBSD patterns through unsupervised deep learning domain adaptation approaches.
提供机构:
西北大学材料科学与工程系, 西北大学电气与计算机工程系, 德国联邦材料研究与测试研究所
创建时间:
2025-04-30
搜集汇总
数据集介绍

构建方式
该数据集通过物理基础的动态模拟构建,包含5,148种不同立方相的电子背散射衍射(EBSD)模式。研究团队从Materials Project数据库中筛选晶体结构,并利用EMsoft软件进行高吞吐量的动态模拟。模拟过程中,优化了计算效率,针对不同空间群类型选择晶格参数最小的晶体结构,并考虑了原子位置无序化对衍射模式的影响。通过调整模拟参数如加速电压、探测距离和像素大小,确保模拟数据与实验条件尽可能接近。
特点
该数据集的特点在于其全面性和高质量。它涵盖了立方晶系中的多种空间群类型(如Pm-3m, Fm-3m, Ia-3d等),并通过动态模拟捕捉了Kikuchi带的精细细节。数据集还特别关注了原子位置无序化对衍射模式的影响,通过重新标记空间群类型提高了分类准确性。此外,数据集包含了不同B因子(模拟热振动效应)的衍射模式,增强了模型的泛化能力。
使用方法
该数据集主要用于训练深度学习模型进行空间群分类。研究人员首先在模拟数据上训练卷积神经网络(如ResNet18),并通过交叉验证评估模型性能。随后,采用无监督域适应技术(如最大分类器差异,MCD)将模型迁移到实验数据上。数据集的使用还包括背景校正、图像质量筛选以及多模型集成投票,以提高分类准确性。此外,数据集支持研究晶体对称性对材料性能的影响,为高通量材料发现提供了重要工具。
背景与挑战
背景概述
EBSD Patterns of 5,148 Different Cubic Phases数据集由美国西北大学材料科学与工程系、电气与计算机工程系以及德国联邦材料研究与测试研究所等机构的研究团队于近年创建。该数据集旨在解决材料科学领域中高通量纳米材料发现过程中晶体结构表征的瓶颈问题,特别关注立方晶系空间群的快速确定。研究团队通过物理基础的动力学模拟生成了5,148种不同立方相的电子背散射衍射(EBSD)图案,为利用深度学习技术进行晶体对称性分类提供了重要基础。该数据集对推动材料基因组计划、加速新型功能材料的开发具有显著意义,尤其在光子学、电子学和催化等领域的晶体材料研究中展现出重要价值。
当前挑战
该数据集面临的主要挑战体现在两个方面:在解决领域问题方面,晶体对称性确定存在伪对称性干扰、轻元素散射信号弱以及超结构反射检测困难等难题;在构建过程方面,面临高吞吐量动力学模拟的计算资源需求大、实验与模拟图案之间的域适应问题,以及位置无序结构重标记带来的分类复杂性。特别是当不同元素的原子散射因子差异过小或过大时,深度学习模型容易产生误分类,这要求开发新的重标记方案和域适应方法来提升分类准确性。
常用场景
经典使用场景
在材料科学领域,EBSD Patterns of 5,148 Different Cubic Phases数据集被广泛用于研究立方晶系材料的晶体对称性。通过高分辨率的电子背散射衍射(EBSD)技术,该数据集为研究人员提供了大量模拟和实验数据,用于分析晶体结构的空间群对称性。其经典使用场景包括晶体对称性分类、材料相变研究以及高吞吐量材料发现中的快速表征。
解决学术问题
该数据集解决了材料科学中晶体对称性快速分类的难题。通过结合深度学习和高通量动力学模拟,研究人员能够高效地确定未知样品的空间群对称性,从而加速新材料的发现和表征。此外,该数据集还解决了传统方法在分析大量未知样品时的效率低下问题,为结构-性能关系的研究提供了重要支持。
衍生相关工作
该数据集衍生了一系列经典研究工作,包括基于深度学习的晶体对称性分类算法开发、高通量材料发现流程的优化以及电子衍射模式分析的自动化工具。例如,Kaufmann等人的研究利用该数据集开发了空间群分类模型,显著提高了分类准确率。此外,该数据集还推动了材料基因组计划(Materials Project)中晶体结构数据库的扩展和应用。
以上内容由遇见数据集搜集并总结生成



