five

DigHyd

收藏
arXiv2025-09-04 更新2025-11-24 收录
下载链接:
https://github.com/gtex-project/dighyd-MLmodel
下载链接
链接失效反馈
官方服务:
资源简介:
DigHyd是一个由东北大学先进材料研究所(WPI-AIMR)开发的数字氢平台,它通过大规模数据挖掘现有实验文献中的固态氢储存材料,构建了一个包含5,089种金属氢化物成分的严格筛选数据集。该数据集可用于构建预测室温下金属氢化物性能的回归模型,例如质量氢密度和平衡压力。通过这些模型,可以生成成分设计图,揭示金属氢化物性能的基本权衡关系,并识别出具有高性能的候选系统,例如铍基合金。DigHyd数据集为加速固态氢储存材料的合理发现提供了一个透明且可扩展的框架。

DigHyd is a digital hydrogen platform developed by the WPI Advanced Institute for Materials Research (WPI-AIMR), Tohoku University. It has constructed a rigorously screened dataset containing 5,089 metal hydride compositions through large-scale data mining of solid-state hydrogen storage materials from existing experimental literature. This dataset can be used to build regression models for predicting the properties of metal hydrides at room temperature, such as gravimetric hydrogen density and equilibrium pressure. Using these models, one can generate compositional design maps, reveal the fundamental trade-offs in the properties of metal hydrides, and identify high-performance candidate systems such as beryllium-based alloys. The DigHyd dataset provides a transparent and scalable framework for accelerating the rational discovery of solid-state hydrogen storage materials.
提供机构:
东北大学先进材料研究所(WPI-AIMR),东北大学流体科学研究所,东京大学材料工程系,东北大学材料研究所(IMR)
创建时间:
2025-09-04
搜集汇总
数据集介绍
main_image_url
构建方式
在固态储氢材料研究领域,DigHyd数据集通过系统性文献挖掘与人工校验相结合的方式构建。研究团队从910篇实验文献中初步识别出5,089个金属氢化物的压力-组成等温线数据点,经过严格的人工审查排除化学式不明确的条目,最终形成包含1,967个质量储氢密度和1,078个室温平衡压力的独特条目。数据采用JSON格式存储并附带数字对象标识符,确保了数据的可追溯性与可复现性。
使用方法
基于该数据集开发的物理可解释模型为材料设计提供了新范式。研究人员可通过四个直观描述符——原子质量、电负性、摩尔密度和离子填充因子,构建预测质量储氢密度与平衡压力的解析模型。这些模型精度与先进机器学习方法相当,同时保持完全的物理透明度。用户可通过交互式Excel工具输入任意化学成分,即时获取性能预测,并可利用生成的材料设计图探索元素替代路径,特别是指出了铍基合金在平衡性能指标方面的独特潜力。
背景与挑战
背景概述
在碳中和能源技术蓬勃发展的背景下,氢能因其高比能和清洁燃烧特性成为关键载体,然而固态氢存储材料的开发长期受限于复杂构效关系与巨大成分空间。DigHyd数据集由日本东北大学先进材料研究所团队于近期构建,聚焦金属氢化物领域,通过大规模文献挖掘整合了5,089组压力-成分等温线数据,旨在建立物理可解释的氢存储性能预测模型。该数据集通过引入原子质量、电负性等本征描述符,揭示了盐型与间隙型氢化物在重量储氢密度与平衡压力间的固有权衡规律,为理性材料设计提供了化学直观的指导框架。
当前挑战
金属氢化物领域面临的核心挑战在于突破重量储氢密度与室温平衡压力间的性能权衡瓶颈,现有材料难以同时满足美国能源部设定的高容量与适中压力目标。数据集构建过程中需克服实验数据稀疏性与异构性难题:原始文献中热力学参数记录不完整,需通过范特霍夫方程间接推算平衡压力;成分标注模糊的条目需经人工校验排除,以确保化学式一致性。此外,描述符模型需在保持物理可解释性的前提下逼近黑盒机器学习算法的精度,这对特征选择与非线性变换提出了严苛要求。
常用场景
经典使用场景
在固态储氢材料研究领域,DigHyd数据集通过整合5089个金属氢化物压力-组成等温线数据点,为构建物理可解释的预测模型提供了坚实基础。该数据集典型应用于揭示金属氢化物重量储氢密度与室温平衡压力之间的内在权衡关系,通过基于原子质量、电负性等描述符的回归模型,系统解析了盐型氢化物与间隙型氢化物的性能差异,为材料设计提供了量化依据。
解决学术问题
该数据集有效解决了金属氢化物研究中的两大核心难题:一是通过大规模数据挖掘填补了传统实验数据稀疏性造成的知识空白,二是建立了基于物理描述符的透明预测框架,突破了黑箱机器学习模型在化学机理阐释上的局限。其构建的回归模型以原子质量、电负性等直观参数准确预测储氢性能,为理解材料构效关系提供了新范式,显著推进了固态储氢材料的理性设计进程。
实际应用
在氢能技术实际应用层面,DigHyd支撑的开发框架可直接指导高性能储氢材料的组分优化。基于数据集生成的成分设计图清晰标示出铍基合金等特殊体系在平衡储氢容量与解吸压力方面的优势,为满足美国能源部车载储氢标准提供了具体技术路径。该数据平台还可扩展至金属有机框架等多孔材料研究,推动储氢系统在燃料电池、内燃机等场景的实际部署。
数据集最近研究
最新研究方向
在固态储氢材料领域,DigHyd数据集正推动基于物理可解释描述符的前沿研究范式转型。通过构建涵盖5089种金属氢化物的大规模实验数据库,研究聚焦于利用原子质量、电负性等基础描述符建立透明预测模型,揭示储氢容量与平衡压力间的内在权衡机制。当前热点集中于铍基合金等突破性材料体系,其凭借独特电子结构与高摩尔密度特性,为逼近美国能源部储氢目标提供了新路径,同时凸显了数据驱动框架在跨能源材料探索中的普适价值。
相关研究论文
  • 1
    通过东北大学先进材料研究所(WPI-AIMR),东北大学流体科学研究所,东京大学材料工程系,东北大学材料研究所(IMR) · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作