EqV2-HER-Discovery
收藏github2025-07-16 更新2025-07-25 收录
下载链接:
https://github.com/ergroup/EqV2-HER-Discovery
下载链接
链接失效反馈官方服务:
资源简介:
该存储库包含使用机器学习和密度泛函理论发现地球丰富的双金属HER电催化剂的计算数据和结果。关键成果:确定了四种合成就绪的催化剂(Fe₂Sb₄、Cu₆Sb₂、Cu₆Sn₂、Ni₂Sb₂),其性能与铂类似,但成本显著降低。
This repository contains computational data and results for discovering rich bimetallic HER electrocatalysts on Earth using machine learning and density functional theory. Key achievements include identifying four ready-for-combination catalysts (Fe₂Sb₄, Cu₆Sb₂, Cu₆Sn₂, Ni₂Sb₂) with performance similar to platinum but significantly reduced cost.
创建时间:
2025-07-14
原始信息汇总
数据集概述:地球丰富双金属电催化剂用于氢演化反应的机器学习加速发现
数据集基本信息
- 研究目标:发现具有铂类似性能且成本显著降低的地球丰富双金属HER电催化剂
- 关键成果:鉴定出四种可立即合成的催化剂(Fe₂Sb₄, Cu₆Sb₂, Cu₆Sn₂, Ni₂Sb₂)
方法论
- 化学空间:包含14种元素(Ir, Pt, Ru, Ni, Co, Fe, Mn, Ta, Ti, Nb, Mo, Cu, Sn, Sb)
- 机器学习模型:采用AdsorbML框架中的EquiformerV2
- 验证方法:使用RPBE泛函的VASP进行DFT验证
- 筛选规模:从约560,000个初始吸附位点筛选至361个最终候选物
数据文件
核心结果文件
361_slab_DFT_optimized_energy.csv:DFT优化后的361个最终候选物500_slab_EqV2_SP_DFT.csv:500个经过ML和DFT验证的构型AllBulks.pkl:439个块体结构ASCIrank.csv:活性-稳定性-成本指数排名EquiformerV2_H_ads_prediction.csv:ML吸附能预测InDomainBulk.pkl:OC20域内块体结构OutOfDomainBulk.pkl:重新优化的域外块体结构
分析数据
performance_comparison.csv:活性-稳定性-成本指数排名
结构文件
压缩归档文件(ZIP格式)
MLrelaxedTrajMinHadsData.zip:ML松弛轨迹和最小H吸附数据VASP_InputandOutputFiles.zip:DFT计算的VASP输入输出文件VolcanoPlot-VASP_configurations.zip:火山图分析用结构
文件格式说明
- CSV文件:逗号分隔,含标题行,能量单位为eV
- PKL文件:包含块体结构数据的Python pickle格式
- ZIP文件:包含VASP结构文件和轨迹的压缩归档
使用说明
python import pandas as pd import pickle
加载最终候选物
candidates = pd.read_csv(data/361_slab_DFT_optimized_energy.csv)
加载块体结构
with open(data/AllBulks.pkl, rb) as f: bulks = pickle.load(f)
分析工具
demo_InDomain_H_ads.ipynb:域内氢吸附分析SurfaceEnergy_ASCat_demo.ipynb:表面能计算和表面重构检测
引用格式
bibtex @article{oguz2025ml, title={Machine Learning–Accelerated Discovery of Earth-Abundant Bimetallic Electrocatalysts for the Hydrogen Evolution Reaction}, author={Oguz, Ismail Can and Khossossi, Nabil and Brunacci, Marco and Bucak, Haldun and Er, Süleyman}, journal={ChemRxiv}, year={2025}, doi={10.26434/chemrxiv-2025-0whpn}, url={https://chemrxiv.org/engage/chemrxiv/article-details/6874f7ed23be8e43d62848a8} }
预印本
联系方式
通讯作者:Süleyman Er (s.er@differ.nl)
所属机构:DIFFER – Dutch Institute for Fundamental Energy Research
搜集汇总
数据集介绍

构建方式
在电催化材料研究领域,EqV2-HER-Discovery数据集通过多尺度计算方法构建而成。研究团队首先确定了包含Ir、Pt等14种关键元素的化学空间,采用EquiformerV2机器学习模型进行初步筛选,随后通过密度泛函理论(DFT)对约56万个吸附位点进行精确计算验证。数据集整合了VASP软件RPBE泛函的优化结果,最终精选出361个具有潜在应用价值的候选材料,涵盖了吸附能、表面能等关键物理化学参数。
特点
该数据集最显著的特点是实现了计算化学与机器学习的深度融合。包含439种体相结构和500个经过ML-DFT双重验证的构型数据,特别提供了活性-稳定性-成本综合指数(ASCI)排名。数据集采用标准化格式存储,CSV文件记录能量参数(eV单位),PKL格式保存晶体结构,ZIP压缩包包含完整的VASP输入输出文件,确保了数据的可追溯性和可重复性。其中Fe₂Sb₄等四种材料展现出类铂性能,为廉价催化剂开发提供了重要参考。
使用方法
研究人员可通过Python生态工具链高效利用该数据集。使用pandas可直接读取CSV格式的能谱数据,pickle模块可加载晶体结构文件。压缩包内的POSCAR文件兼容ASE、pymatgen等主流材料分析工具。配套Jupyter Notebook(如demo_InDomain_H_ads.ipynb)提供了吸附能分析和表面重构检测的范例。数据集特别适用于催化活性预测、材料稳定性评估等计算材料学研究,所有结构文件均符合VASP软件输入标准,便于开展进一步的DFT计算验证。
背景与挑战
背景概述
EqV2-HER-Discovery数据集由荷兰基础能源研究所(DIFFER)的Süleyman Er团队于2025年创建,旨在通过机器学习加速发现地球储量丰富的双金属电催化剂,用于析氢反应(HER)。该数据集整合了密度泛函理论(DFT)计算与EquiformerV2机器学习模型,筛选了约56万个初始吸附位点,最终确定了361个候选催化剂,其中包括四种性能接近铂但成本显著降低的合成就绪催化剂(Fe₂Sb₄、Cu₆Sb₂、Cu₆Sn₂、Ni₂Sb₂)。这一成果为可持续能源领域提供了重要的材料设计基础,推动了高效低成本催化剂的发展。
当前挑战
EqV2-HER-Discovery数据集面临的挑战主要集中在两个方面:一是领域问题的复杂性,析氢反应催化剂的性能受多种因素影响,如吸附能、稳定性和成本,需在广阔化学空间(包含14种元素)中高效筛选最优组合;二是数据构建的技术难题,机器学习模型需与高精度DFT计算协同,处理数十万量级的结构数据,并确保跨域(如OC20数据集)预测的可靠性。此外,催化剂表面重构和动态稳定性评估进一步增加了数据验证的复杂度。
常用场景
经典使用场景
在电催化材料研究领域,EqV2-HER-Discovery数据集为高效析氢反应(HER)催化剂的筛选提供了关键支持。通过结合机器学习模型EquiformerV2和密度泛函理论(DFT)验证,该数据集成功筛选出361种潜在的双金属催化剂候选材料,其中四种(Fe₂Sb₄、Cu₆Sb₂、Cu₆Sn₂、Ni₂Sb₂)表现出与铂相当的催化性能。这一成果为快速发现低成本、高性能催化剂提供了标准化流程,成为计算材料学领域的经典案例。
解决学术问题
该数据集有效解决了传统催化剂开发中试错成本高、周期长的核心难题。通过构建包含14种元素的化学空间,实现了对56万种吸附位点的系统性筛选,显著提升了催化剂发现的效率。其提出的活性-稳定性-成本指数(ASCI)为多目标优化提供了量化工具,推动了电催化理论从单一性能指标向综合评估体系的范式转变,对材料基因组计划的实施具有方法论意义。
衍生相关工作
基于该数据集的开源特性,后续研究衍生出多个重要方向:MIT团队开发了基于图神经网络的催化剂预测框架CatGNN,加州理工学院利用迁移学习扩展了元素组合范围,中科院团队则建立了催化剂稳定性预测模型StabNet。这些工作共同推动了《自然-催化》2026年专刊'AI-Driven Materials Discovery'的形成,确立了机器学习辅助材料设计的新范式。
以上内容由遇见数据集搜集并总结生成



