five

MPT模型

收藏
arXiv2025-08-09 更新2025-08-12 收录
下载链接:
https://github.com/sai-mat-group/predicting-migration-barriers
下载链接
链接失效反馈
官方服务:
资源简介:
本文提出了一种基于图神经网络(GNN)的架构,通过迁移学习原理,有效地预测了固体中离子迁移势垒(Em)。该模型(标记为MPT)在七个不同的整体属性上进行预训练,并引入了修改,以在结构中的不同迁移路径上建立归纳偏差,然后在一个包含619个Em数据点的手动整理的文献衍生数据集上进行了微调(FT)。数据集包含619个独特的迁移路径,涵盖58个不同的空间群和多样化的化学成分。该数据集涵盖了电池中作为电极或固态电解质材料的各种离子化合物的Em,这些Em是通过密度泛函理论(DFT)计算得出的。数据集涵盖了放电状态(71.4%)、充电状态(23.6%)和中间成分(5%),涵盖了58个不同的空间群,包括尖晶石、层状、橄榄石、黄玉、磷酸盐、韦伯石和NaSICONs等结构。数据集的生成、数据点的分布以及对每个数据点的全面描述可在Ref.53中找到。

This work proposes a graph neural network (GNN)-based architecture that effectively predicts the ion migration barrier (Em) in solids via transfer learning principles. The proposed model, denoted as MPT, is pre-trained on seven distinct bulk properties, and modifications are introduced to establish inductive biases across different migration pathways in structures, followed by fine-tuning (FT) on a manually curated literature-derived dataset containing 619 Em data points. The dataset encompasses 619 unique migration pathways, covering 58 distinct space groups and diverse chemical compositions. This dataset includes Em values of various ionic compounds used as electrode or solid-state electrolyte materials in batteries, where the Em values are calculated via density functional theory (DFT). The dataset covers discharge states (71.4%), charged states (23.6%), and intermediate compositions (5%), and includes structures such as spinels, layered phases, olivines, topazes, phosphates, weberites, and NaSICONs across the 58 distinct space groups. The generation of the dataset, the distribution of its data points, and the comprehensive description of each individual data point can be found in Ref. 53.
提供机构:
印度科学学院材料工程系,英国伦敦大学学院化学系
创建时间:
2025-08-09
原始信息汇总

Predicting Migration Barriers 数据集概述

数据集来源

  • 基于论文《Leveraging transfer learning for accurate estimation of ionic migration barriers in solids》(预印本发布于arXiv
  • 原始数据来自Migration Barrier Dataset

模型架构

  • 采用改进的多属性训练(MPT)模型架构(原始MPT模型见repository
  • 目录结构对应论文中的命名规范

文件结构

  • SCRATCH模型训练文件路径:train_files/SCRATCH/
  • 原始训练和测试数据文件路径:DATA-FILES/

使用说明

引用要求

  • 使用模型需引用论文arXiv
  • 使用迁移障碍数据集需额外引用arXiv
搜集汇总
数据集介绍
main_image_url
构建方式
MPT模型数据集基于迁移学习策略构建,通过预训练在多体性质上的图神经网络架构,针对固体材料中的离子迁移能垒(Em)进行精确预测。研究团队首先在七种不同的体材料性质上对模型进行预训练,随后引入结构迁移路径的归纳偏置,并通过密度泛函理论(DFT)计算的619个手工筛选的Em数据点进行微调。数据集涵盖了58种空间群和27种结构类型,包括尖晶石、层状结构、橄榄石等常见电池材料体系,确保了数据的多样性和代表性。
特点
该数据集的核心特点在于其多尺度建模能力与跨体系泛化性。首先,数据覆盖了0.03-8.77 eV的宽能垒范围,包含放电态(71.4%)、充电态(23.6%)及中间组分(5%)的电极材料。其次,88.12%的Em值采用广义梯度近似(GGA)计算,同时整合了GGA+U、SCAN等不同交换关联泛函的结果,反映了计算方法的多样性。值得注意的是,数据集通过线性插值生成迁移路径的中间图像,使模型能区分同一结构内不同迁移通道的能垒差异,这一特性在层状LiCoO2等具有多路径迁移的材料中尤为重要。
使用方法
该数据集支持三种典型应用场景:1)迁移路径区分,通过输入初始/最终构型或插值能带预测特定路径的Em;2)组分泛化,利用充电/放电态数据的相关性预测未知组分材料的离子电导率;3)化学体系扩展,基于已见化学环境的局部结构特征推断新材料的迁移能垒。最佳性能模型(MODEL-3)在测试集上达到0.703的R²分数和0.261 eV的平均绝对误差,作为分类器时对'优良'离子导体(Em≤0.65 eV)的识别准确率达80%。使用时需注意数据标准化处理,建议采用训练集的统计量(最小值、最大值、均值、标准差)进行归一化。
背景与挑战
背景概述
MPT模型数据集由Reshma Devi、Keith T. Butler和Gopalakrishnan Sai Gautam等研究人员于2025年提出,旨在解决固体中离子迁移能垒(Em)的精确预测问题。该数据集基于密度泛函理论(DFT)计算的619个离子迁移能垒数据点,涵盖58种不同的空间群和多种化学组成。MPT模型通过图神经网络和迁移学习技术,显著提高了离子迁移能垒的预测准确性,为电池材料、燃料电池和电化学传感器等领域的高通量筛选提供了重要工具。该数据集的建立填补了离子迁移能垒预测模型的空白,推动了材料科学中数据驱动方法的发展。
当前挑战
MPT模型数据集面临的挑战主要包括两方面:1) 领域问题挑战:离子迁移能垒的预测需要处理复杂的结构-性质关系,尤其是在多路径迁移和局部结构变化的情况下,传统模型难以准确捕捉这些细微差异;2) 构建过程挑战:数据集的构建依赖于高精度的DFT计算,计算成本高昂且耗时。此外,数据集中不同材料的离子迁移能垒范围较广(0.03-8.77 eV),且数据点分布不均,导致模型训练和泛化难度较大。同时,如何有效整合迁移学习策略以解决数据稀缺问题,也是构建过程中的关键挑战。
常用场景
经典使用场景
MPT模型在材料科学领域中被广泛应用于预测固体材料中的离子迁移势垒(Em),特别是在电池材料、燃料电池和电化学传感器的研究中。该模型通过图神经网络架构和迁移学习策略,能够高效且准确地预测多种材料中的离子迁移势垒,为材料设计和筛选提供了强有力的工具。其经典使用场景包括预测锂离子电池电极材料中的锂离子迁移势垒,以及评估固态电解质中的离子导电性能。
实际应用
在实际应用中,MPT模型被用于加速新型电池材料的开发。例如,在锂离子电池领域,该模型可以快速筛选出具有低迁移势垒的电极材料,从而提升电池的倍率性能。此外,MPT模型还可用于固态电解质的设计,通过预测离子迁移势垒来优化材料的离子电导率。其高效预测能力显著降低了材料研发的试错成本和时间。
衍生相关工作
MPT模型衍生了一系列相关研究工作。例如,基于其架构改进的MODEL-3在预测离子迁移势垒方面表现出色,被广泛应用于材料筛选和分类任务。此外,该模型的迁移学习策略启发了其他材料性质预测模型的发展,如表面吸附能和点缺陷形成能的预测。MPT模型的成功也推动了图神经网络在材料科学中的进一步应用,如多体相互作用和高级描述符的引入。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作