Catalysis-hub数据库

Name: Catalysis-hub数据库
Creator: 印度马德拉斯理工学院
Published: 2024-12-17 20:19:14
License: 暂无描述

arXiv2024-12-17 更新2024-12-19 收录

下载链接：

http://arxiv.org/abs/2412.12846v1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集来自Catalysis-hub数据库，专门用于氢进化反应（HER）和氧进化反应（OER）的电催化性能预测。数据集包含16,226个数据点，涵盖了8,856个HER和7,370个OER的催化数据。数据集详细记录了合金催化剂的吉布斯自由能吸附（ΔG）、化学成分和吸附位点等关键参数。数据集的创建过程结合了Matminer的成分分析、主成分分析（PCA）和相关性筛选，生成了强大的预测描述符。该数据集的应用领域主要集中在加速电催化剂设计，旨在解决绿色氢生产中的高性能、低成本催化剂设计问题。

This dataset is sourced from the Catalysis-hub database, specifically tailored for electrocatalytic performance prediction of hydrogen evolution reaction (HER) and oxygen evolution reaction (OER). It comprises 16,226 data points, covering 8,856 catalytic datasets for HER and 7,370 for OER. This dataset comprehensively records key parameters of alloy catalysts, including Gibbs free energy of adsorption (ΔG), chemical composition, and adsorption sites. The dataset was constructed by integrating compositional analysis from Matminer, principal component analysis (PCA), and correlation filtering to generate robust predictive descriptors. Its primary applications center on accelerating electrocatalyst design, with the objective of addressing the challenges of developing high-performance, low-cost catalysts for green hydrogen production.

提供机构：

印度马德拉斯理工学院

创建时间：

2024-12-17

搜集汇总

数据集介绍

构建方式

Catalysis-hub数据库通过整合16,226个数据点，涵盖了氢进化反应（HER）和氧进化反应（OER）的催化性能数据，构建了一个全面的数据集。该数据集不仅包括了吉布斯自由能吸附（ΔG）等关键参数，还详细记录了化学组成和吸附位点信息。此外，数据集还涵盖了九种关键吸附物，如碳（C）、氧（O）、氮（N）等，以及2,035种独特的双金属合金表面，探索了五种不同的化学计量比。通过这些详尽的数据，研究者能够深入分析催化性能与材料特性之间的复杂关系。

特点

Catalysis-hub数据库的显著特点在于其广泛的数据覆盖范围和多维度的数据表示。数据集不仅包含了37种元素组成，还通过L10和L12结构标记，详细描述了合金的晶体结构。此外，数据集通过主成分分析（PCA）和Pearson相关分析等方法，有效降低了数据维度，同时保留了关键的吸附位点信息。这些特点使得该数据集在研究催化性能与材料特性之间的关系时，具有极高的实用性和研究价值。

使用方法

Catalysis-hub数据库可用于开发和验证机器学习模型，以预测和优化催化剂的性能。研究者可以通过该数据集训练模型，如随机森林（RF）、XGBoost和支持向量回归（SVR）等，来预测吉布斯自由能吸附等关键催化参数。此外，数据集的丰富性和多样性使得其适用于多种机器学习算法，从而为催化剂设计提供了一个强大的计算框架。通过结合SHAP分析，研究者还可以深入理解影响催化性能的关键特征，进一步指导催化剂的设计和优化。

背景与挑战

背景概述

Catalysis-hub数据库是由印度理工学院马德拉斯分校的Nanoscale Physics Laboratory和Functional Oxides Research Group共同开发的一个综合性数据集，旨在通过数据驱动的方法预测和理解电催化性能，特别是在氢进化反应（HER）和氧进化反应（OER）中的应用。该数据库包含了16,226个数据点，涵盖了多种双金属合金表面的催化性能，为机器学习模型提供了丰富的材料特性数据。通过结合随机森林、XGBoost和支持向量回归等先进机器学习算法，研究人员开发了一种创新的堆叠集成模型，显著提高了对催化性能的预测精度，为可持续氢生产的高效催化剂设计提供了新的计算框架。

当前挑战

Catalysis-hub数据库的构建面临多重挑战。首先，数据集的多样性和复杂性使得特征提取和选择变得尤为困难，研究人员需要通过Matminer和主成分分析等工具来处理高维数据，以确保模型的准确性和泛化能力。其次，电催化反应的复杂性要求模型能够捕捉到材料组成、结构和电子特性之间的复杂关系，这对特征工程提出了更高的要求。此外，尽管机器学习模型在预测性能上表现出色，但如何将这些预测结果转化为实际可用的催化剂设计仍然是一个亟待解决的问题。最后，数据集的规模和计算成本也是构建过程中的重要挑战，如何在有限的计算资源下高效地处理和分析大规模数据是一个持续的优化方向。

常用场景

经典使用场景

Catalysis-hub数据库在电催化领域中被广泛用于预测和理解氢进化反应（HER）和氧进化反应（OER）的催化性能。通过整合随机森林、XGBoost和支持向量回归等机器学习算法，该数据库能够对双金属合金表面的吉布斯自由能吸附进行精确预测。这种数据驱动的模型不仅能够快速筛选潜在的催化剂材料，还能揭示影响催化性能的关键因素，如化学组成、结构特性和电子特性。

衍生相关工作

基于Catalysis-hub数据库的研究，衍生了许多经典工作，如Chen等人开发的用于筛选HER催化剂的通用机器学习框架，以及Pandit等人结合密度泛函理论（DFT）和监督机器学习的混合方法。这些工作不仅扩展了数据驱动的催化剂设计方法，还为其他领域的材料科学研究提供了新的思路。此外，Wu等人利用深度学习技术加速了二维催化剂的发现，进一步展示了该数据库在推动材料科学前沿研究中的重要作用。

数据集最近研究