迁移势垒数据集
收藏arXiv2025-08-09 更新2025-08-12 收录
下载链接:
https://github.com/sai-mat-group/migration-barrier-dataset
下载链接
链接失效反馈官方服务:
资源简介:
迁移势垒数据集是一个包含619个不同文献报告的迁移势垒值的综合数据集,这些值是通过基于密度泛函理论的推搡弹性带计算得到的。该数据集涵盖了443种不同的化学成分和27种不同的结构组,包括作为电极或固体电解质在电池中探索的各种化合物。数据集包括对应于电极材料的完全充电和/或放电状态的成分,并在某些情况下纳入了中间成分。对于每个化合物,数据集提供了结构信息,包括迁移离子的初始和最终位置及其相应的迁移势垒,这些信息以易于使用的.xlsx和JSON格式提供。
The Migration Barrier Dataset is a comprehensive dataset containing 619 migration barrier values reported in various literatures. These values were calculated using the Nudged Elastic Band (NEB) method based on density functional theory (DFT). This dataset covers 443 distinct chemical compositions and 27 different structural groups, including various compounds explored as electrodes or solid electrolytes in batteries. The dataset includes compositions corresponding to the fully charged and/or discharged states of electrode materials, and incorporates intermediate compositions in some cases. For each compound, the dataset provides structural information including the initial and final positions of the migrating ions and their corresponding migration barriers, which is available in user-friendly .xlsx and JSON formats.
提供机构:
印度科学研究所材料工程系,印度浦那印度科学教育与研究学院,英国伦敦大学学院化学系
创建时间:
2025-08-09
原始信息汇总
迁移势垒数据集概述
数据集来源
- 该数据集是研究工作《A literature-derived dataset of migration barriers for quantifying ionic transport in battery materials》的组成部分,作者为Reshma Devi, Avaneesh Balasubramanian, Keith Butler和Gopalakrishnan Sai Gautam,目前正在审稿中。
- 预印本可在arXiv获取。
数据集内容
- 包含广泛电极和固体电解质材料的计算迁移势垒数据,应用于电池研究。
- 数据以JSON格式存储,每个条目包含10个关键词。
数据字段说明
| 序号 | 标签 | 描述 |
|---|---|---|
| 1 | jid | 唯一JSON ID |
| 2 | structure_ini | 迁移路径的初始构型 |
| 3 | structure_fin | 迁移路径的最终构型 |
| 4 | target | 报告的迁移势垒Eₘ |
| 5 | formula | 化学组成 |
| 6 | crystal_class | 晶体类别 |
| 7 | sys_name | 唯一系统名称 |
| 8 | space_group | 空间群 |
| 9 | XC | 文献中NEB计算使用的XC泛函 |
| 10 | bibtex | 研究文章的bibtex格式引用 |
使用说明
- 使用该数据集时,请引用预印本arXiv。
搜集汇总
数据集介绍

构建方式
迁移势垒数据集通过系统性地收集文献中报道的密度泛函理论(DFT)结合弹性带(NEB)方法计算的迁移势垒(Em)值构建而成。研究团队对过去二十年发表的电池研究论文进行了全面的人工审查,筛选出符合特定标准的文献数据,包括使用一致的交换关联泛函(如GGA或GGA+U)、明确的迁移路径描述以及完整的结构信息。此外,数据集还通过结构优化和路径初始化确保了数据的准确性和一致性,涵盖了443种化学组成和27种结构类型。
特点
该数据集包含了619个独特的迁移势垒值,覆盖了锂、钠、钾及多价离子电池系统中的电极和固态电解质材料。其显著特点包括提供了每个化合物的结构信息,如迁移离子的初始和最终位置,以及对应的能量势垒。数据以.xlsx和JSON格式提供,便于直接提取和使用。此外,数据集还涵盖了完全充放电状态及部分中间状态的电极材料,为机器学习模型的构建和验证提供了丰富的数据支持。
使用方法
迁移势垒数据集可用于构建和验证预测迁移势垒的机器学习模型,适用于基于结构或成分的输入。研究人员可以利用该数据集进行迁移学习,优化预训练模型,或评估通用机器学习原子间势(MLIPs)在预测迁移势垒方面的性能。数据集中的结构信息兼容pymatgen和ASE等工具,便于转换为其他结构表示形式。此外,数据集还提供了详细的文献引用和计算方法,确保数据的可追溯性和可重复性。
背景与挑战
背景概述
迁移势垒数据集由印度科学研究所和伦敦大学学院的研究团队于2025年创建,旨在解决电池材料中离子迁移势垒(Em)的量化问题。该数据集包含619个通过密度泛函理论计算的迁移势垒值,涵盖443种不同化学成分和27种结构组别,为开发精确的机器学习模型提供了重要基础。这一数据集的建立显著推动了电池材料中离子传输机制的研究,并为新型电极和固体电解质的设计提供了关键支持。
当前挑战
迁移势垒数据集面临的主要挑战包括:1) 在实验和计算上准确量化离子迁移势垒的困难,尤其是在不同材料和结构中的广泛适用性;2) 数据收集过程中需要确保计算方法和结构信息的一致性,这对数据集的构建提出了严格要求。此外,数据集需要涵盖多样化的化学和结构范围,以支持通用机器学习模型的开发和验证。
常用场景
经典使用场景
迁移势垒数据集在电池材料研究中扮演着关键角色,特别是在锂离子、钠离子和多价离子电池的电极和固态电解质开发中。研究人员利用该数据集中的迁移势垒(Em)值,通过密度泛函理论(DFT)和机器学习(ML)模型,快速筛选和优化具有高离子电导率的材料。数据集中的结构信息和能量壁垒为理解离子迁移机制提供了重要依据,尤其是在设计新型电池材料时,能够显著减少实验和计算的资源消耗。
解决学术问题
该数据集解决了电池材料研究中离子迁移势垒难以准确预测的学术难题。传统实验方法如核磁共振(NMR)和电化学阻抗谱(EIS)不仅耗时且成本高昂,而计算模拟方法如DFT-NEB虽然精确,但计算复杂度高。通过提供619个经过验证的Em值,该数据集为开发高效的机器学习模型奠定了基础,使得研究人员能够快速预测材料的离子迁移性能,从而加速高性能电池材料的发现和优化。
衍生相关工作
该数据集衍生了一系列经典研究工作,特别是在机器学习与材料科学的交叉领域。例如,研究人员利用该数据集开发了基于图神经网络的迁移势垒预测模型,显著提高了预测精度和效率。此外,该数据集还被用于验证和优化通用机器学习原子间势(MLIPs),为多价离子电池材料的模拟提供了可靠基准。相关成果已发表在《Nature Computational Science》和《Chemistry of Materials》等顶级期刊上。
以上内容由遇见数据集搜集并总结生成



