DAC@NG Dataset
收藏arXiv2025-03-25 更新2025-03-28 收录
下载链接:
https://www.localenergy.science./
下载链接
链接失效反馈官方服务:
资源简介:
DAC@NG数据集是由清华大学化学系构建的一个全面的数据集,包含611,648个基于氮掺杂石墨烯的双原子催化剂(DAC@NG)候选结构。这些结构涵盖了六种不同的石墨烯四空位模式和38种金属元素的所有可能组合,以及变化的碳氮配位环境。该数据集旨在用于训练和评估LOCAL框架,该框架能够高效预测DAC@NG结构的稳定性能量,加速高性能催化剂的发现和优化。
The DAC@NG dataset is a comprehensive collection constructed by the Department of Chemistry, Tsinghua University, containing 611,648 candidate structures of nitrogen-doped graphene-based dual-atom catalysts (DAC@NG). These structures cover all possible combinations of six distinct graphene tetra-vacancy modes and 38 metallic elements, alongside varied carbon-nitrogen coordination environments. This dataset is designed for training and evaluating the LOCAL framework, which can efficiently predict the stabilization energy of DAC@NG structures, accelerating the discovery and optimization of high-performance catalysts.
提供机构:
清华大学化学系
创建时间:
2025-03-25
搜集汇总
数据集介绍

构建方式
DAC@NG数据集的构建基于氮掺杂石墨烯(NG)支撑的双原子催化剂(DAC)系统研究。研究团队通过引入四种空位到石墨烯结构中,创建了六种不同的结构模式(QV1至QV6),并结合38种金属元素及变化的碳/氮配位环境,生成了611,648种独特的候选结构。数据集通过密度泛函理论(DFT)计算稳定性能量,并利用集成晶体轨道哈密顿布居(ICOHP)值量化键强度,从而在不进行昂贵计算的情况下预测结构稳定性。
使用方法
DAC@NG数据集的使用方法主要依赖于LOCAL框架,该框架结合了两种图卷积网络(GCN)模型:POS2COHP和Graph2E。用户可以通过输入初始DAC@NG结构图,利用POS2COHP预测ICOHP值,再通过Graph2E预测稳定性能量。数据集和LOCAL框架已公开,用户可通过访问www.localenergy.science获取数据,并利用提供的代码和模型进行催化材料的快速评估和设计。
背景与挑战
背景概述
DAC@NG数据集由清华大学化学系的研究团队于2025年创建,主要研究人员包括尹越、何江山和肖海。该数据集专注于双原子催化剂(DAC)在氮掺杂石墨烯(NG)载体上的稳定性分析,旨在解决催化材料设计中原子尺度结构稳定性预测的难题。数据集包含611,648种DAC@NG结构,涵盖38种金属元素、6种石墨烯四空位模式以及多样的碳/氮配位环境,为催化材料的计算模拟与实验验证提供了重要基础。其创新性在于通过图卷积网络(GCN)模型LOCAL框架,实现了从初始结构直接预测稳定性能量,验证平均绝对误差仅为0.145 eV,显著提升了催化剂设计的效率与精度。
当前挑战
DAC@NG数据集面临的挑战主要体现在两方面:其一,在领域问题层面,双原子催化剂的稳定性受金属元素组合、配位环境及载体缺陷模式的复杂交互影响,传统密度泛函理论(DFT)计算难以高效覆盖庞大的组合空间;其二,在数据构建过程中,需解决四空位石墨烯结构的能量基准统一性问题,并通过主动学习策略优化模型对局部结构变化的敏感性。此外,数据集中非对称空位模式(如QV4)的金属排列异构体、高氧化态金属的电子结构描述,以及轻/重金属原子尺寸差异导致的应变效应,均为模型泛化性带来显著挑战。
常用场景
经典使用场景
DAC@NG数据集在催化材料研究中扮演了关键角色,尤其适用于双原子催化剂(DAC)的稳定性预测与结构优化。该数据集通过涵盖38种金属元素、六种石墨烯四空位模式及多样化的碳/氮配位环境,为研究人员提供了全面的结构-能量关系基准。其经典应用场景包括利用图卷积网络(GCN)模型快速预测催化剂的结合能与稳定性,显著加速了高性能催化剂的筛选过程。例如,LOCAL框架通过该数据集生成的相图与实验验证的Co-Ni、Fe-Ni等双金属系统高度吻合,验证了数据集的可靠性。
解决学术问题
DAC@NG数据集有效解决了双原子催化剂领域的两大核心难题:一是传统密度泛函理论(DFT)计算在评估大规模结构组合时的高计算成本问题,通过提供611,648种预计算结构及其稳定性数据,实现了高效的数据驱动预测;二是克服了实验手段(如EXAFS、XANES)在原子级结构解析中的精度限制,为理解金属-载体相互作用机制提供了理论依据。数据集衍生的LOCAL框架将稳定性预测误差降至0.145 eV,为催化材料的理性设计建立了新范式。
实际应用
该数据集的实际应用已延伸至清洁能源与化工生产领域。例如,在燃料电池阴极氧还原反应(ORR)中,基于数据集筛选的Fe-Ni双原子催化剂表现出优异的活性和稳定性;在CO₂电还原体系中,Ag-Ni等组合的相图为选择性调控提供了理论指导。此外,数据集支持的LOCAL框架可集成至高通量计算平台,助力工业界快速开发低成本、高效率的催化材料,推动绿色化学工艺的规模化应用。
数据集最近研究
最新研究方向
近年来,DAC@NG数据集在催化材料领域的研究方向主要集中在利用机器学习和图神经网络技术预测双原子催化剂的结构稳定性。氮掺杂石墨烯支撑的双原子催化剂(DAC@NG)因其独特的电子相互作用和丰富的配位环境,展现出超越单原子催化剂的潜力。然而,其结构多样性和稳定性预测一直是计算化学领域的难点。最新的LOCAL框架通过整合POS2COHP和Graph2E两个图卷积网络模型,直接从初始结构预测键合强度和稳定性能量,显著提升了预测效率和准确性。该框架在包含611,648种结构的庞大数据集上实现了0.145 eV的验证平均绝对误差,为催化剂的快速筛选和优化提供了有力工具。此外,该数据集还推动了双金属系统相图的研究,如Co-Ni、Fe-Ni等体系的相图与实验数据高度吻合,为催化材料的设计提供了理论指导。这一进展不仅加速了高性能催化剂的发现,也为其他催化材料的研究提供了可扩展的方法框架。
相关研究论文
- 1LOCAL: A Graph-Based Active Learning Approach for Stability Analysis of DAC@NG Catalysts清华大学化学系 · 2025年
以上内容由遇见数据集搜集并总结生成



