five

Catalysis-hub数据库|电催化剂设计数据集|绿色能源数据集

收藏
arXiv2024-12-17 更新2024-12-19 收录
电催化剂设计
绿色能源
下载链接:
http://arxiv.org/abs/2412.12846v1
下载链接
链接失效反馈
资源简介:
该数据集来自Catalysis-hub数据库,专门用于氢进化反应(HER)和氧进化反应(OER)的电催化性能预测。数据集包含16,226个数据点,涵盖了8,856个HER和7,370个OER的催化数据。数据集详细记录了合金催化剂的吉布斯自由能吸附(ΔG)、化学成分和吸附位点等关键参数。数据集的创建过程结合了Matminer的成分分析、主成分分析(PCA)和相关性筛选,生成了强大的预测描述符。该数据集的应用领域主要集中在加速电催化剂设计,旨在解决绿色氢生产中的高性能、低成本催化剂设计问题。
提供机构:
印度马德拉斯理工学院
创建时间:
2024-12-17
AI搜集汇总
数据集介绍
main_image_url
构建方式
Catalysis-hub数据库通过整合16,226个数据点,涵盖了氢进化反应(HER)和氧进化反应(OER)的催化性能数据,构建了一个全面的数据集。该数据集不仅包括了吉布斯自由能吸附(ΔG)等关键参数,还详细记录了化学组成和吸附位点信息。此外,数据集还涵盖了九种关键吸附物,如碳(C)、氧(O)、氮(N)等,以及2,035种独特的双金属合金表面,探索了五种不同的化学计量比。通过这些详尽的数据,研究者能够深入分析催化性能与材料特性之间的复杂关系。
特点
Catalysis-hub数据库的显著特点在于其广泛的数据覆盖范围和多维度的数据表示。数据集不仅包含了37种元素组成,还通过L10和L12结构标记,详细描述了合金的晶体结构。此外,数据集通过主成分分析(PCA)和Pearson相关分析等方法,有效降低了数据维度,同时保留了关键的吸附位点信息。这些特点使得该数据集在研究催化性能与材料特性之间的关系时,具有极高的实用性和研究价值。
使用方法
Catalysis-hub数据库可用于开发和验证机器学习模型,以预测和优化催化剂的性能。研究者可以通过该数据集训练模型,如随机森林(RF)、XGBoost和支持向量回归(SVR)等,来预测吉布斯自由能吸附等关键催化参数。此外,数据集的丰富性和多样性使得其适用于多种机器学习算法,从而为催化剂设计提供了一个强大的计算框架。通过结合SHAP分析,研究者还可以深入理解影响催化性能的关键特征,进一步指导催化剂的设计和优化。
背景与挑战
背景概述
Catalysis-hub数据库是由印度理工学院马德拉斯分校的Nanoscale Physics Laboratory和Functional Oxides Research Group共同开发的一个综合性数据集,旨在通过数据驱动的方法预测和理解电催化性能,特别是在氢进化反应(HER)和氧进化反应(OER)中的应用。该数据库包含了16,226个数据点,涵盖了多种双金属合金表面的催化性能,为机器学习模型提供了丰富的材料特性数据。通过结合随机森林、XGBoost和支持向量回归等先进机器学习算法,研究人员开发了一种创新的堆叠集成模型,显著提高了对催化性能的预测精度,为可持续氢生产的高效催化剂设计提供了新的计算框架。
当前挑战
Catalysis-hub数据库的构建面临多重挑战。首先,数据集的多样性和复杂性使得特征提取和选择变得尤为困难,研究人员需要通过Matminer和主成分分析等工具来处理高维数据,以确保模型的准确性和泛化能力。其次,电催化反应的复杂性要求模型能够捕捉到材料组成、结构和电子特性之间的复杂关系,这对特征工程提出了更高的要求。此外,尽管机器学习模型在预测性能上表现出色,但如何将这些预测结果转化为实际可用的催化剂设计仍然是一个亟待解决的问题。最后,数据集的规模和计算成本也是构建过程中的重要挑战,如何在有限的计算资源下高效地处理和分析大规模数据是一个持续的优化方向。
常用场景
经典使用场景
Catalysis-hub数据库在电催化领域中被广泛用于预测和理解氢进化反应(HER)和氧进化反应(OER)的催化性能。通过整合随机森林、XGBoost和支持向量回归等机器学习算法,该数据库能够对双金属合金表面的吉布斯自由能吸附进行精确预测。这种数据驱动的模型不仅能够快速筛选潜在的催化剂材料,还能揭示影响催化性能的关键因素,如化学组成、结构特性和电子特性。
衍生相关工作
基于Catalysis-hub数据库的研究,衍生了许多经典工作,如Chen等人开发的用于筛选HER催化剂的通用机器学习框架,以及Pandit等人结合密度泛函理论(DFT)和监督机器学习的混合方法。这些工作不仅扩展了数据驱动的催化剂设计方法,还为其他领域的材料科学研究提供了新的思路。此外,Wu等人利用深度学习技术加速了二维催化剂的发现,进一步展示了该数据库在推动材料科学前沿研究中的重要作用。
数据集最近研究
最新研究方向
近年来,基于Catalysis-hub数据库的研究在电催化领域取得了显著进展,尤其是在氢进化反应(HER)和氧进化反应(OER)的催化性能预测方面。研究者通过整合随机森林、XGBoost和支持向量回归等先进机器学习算法,构建了一个创新的堆叠集成模型,显著提升了对催化剂性能的预测精度。该模型不仅在HER和OER的预测中分别达到了0.98和0.94的R²值,还通过SHAP分析揭示了影响催化性能的关键因素,如合金的熔点、电子结构和吸附位点的几何特征。这些研究不仅为高效、低成本的催化剂设计提供了新的计算框架,还为可持续氢能源的生产开辟了新的研究路径,具有重要的科学意义和应用前景。
相关研究论文
  • 1
    Data-Driven Catalyst Design: A Machine Learning Approach to Predicting Electrocatalytic Performance in Hydrogen Evolution and Oxygen Evolution Reactions印度马德拉斯理工学院 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

CHARLS

中国健康与养老追踪调查(CHARLS)数据集,旨在收集反映中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析人口老龄化问题,内容包括健康状况、经济状况、家庭结构和社会支持等。

charls.pku.edu.cn 收录

糖尿病预测数据集

糖尿病相关的医学研究或者健康数据

AI_Studio 收录

FMA (Free Music Archive)

免费音乐档案 (FMA) 是一个大型数据集,用于评估音乐信息检索中的多个任务。它包含 343 天的音频,来自 16,341 位艺术家的 106,574 首曲目和 14,854 张专辑,按 161 种流派的分级分类排列。它提供完整长度和高质量的音频、预先计算的功能,以及轨道和用户级元数据、标签和自由格式的文本,例如传记。作者定义了四个子集:Full:完整数据集,Large:音频限制为 30 秒的完整数据集 从轨道中间提取的剪辑(如果短于 30 秒,则为整个轨道),Medium:选择25,000 个具有单一根流派的 30 年代剪辑,小:一个平衡的子集,包含 8,000 个 30 年代剪辑,其中 8 种根流派中的每一个都有 1,000 个剪辑。官方分为训练集、验证集和测试集(80/10/10)使用分层抽样来保留每个流派的曲目百分比。同一艺术家的歌曲只是一组的一部分。资料来源:FMA:音乐分析数据集

OpenDataLab 收录