h-llpt-24

Name: h-llpt-24
Creator: 德国康斯坦茨大学计算机与信息科学系，卢森堡科学技术研究所
Published: 2024-09-20 18:44:40
License: 暂无描述

arXiv2024-09-20 更新2024-09-26 收录

下载链接：

https://zenodo.org/records/8160491

下载链接

链接失效反馈

官方服务：

资源简介：

h-llpt-24数据集由德国康斯坦茨大学和卢森堡科学技术研究所创建，用于评估机器学习原子间势能模型在高压氢液-液相变模拟中的性能。该数据集包含612个密度泛函理论分子动力学模拟的参考数据，涵盖不同温度和质量密度下的几何结构、能量、力和应力。数据集的创建过程包括在不同条件下进行分子动力学模拟，并从中提取训练和测试数据。该数据集主要应用于机器学习模型的性能评估，旨在解决高压氢相变模拟中的准确性和效率问题。

The h-llpt-24 dataset was developed by the University of Konstanz (Germany) and the Luxembourg Institute of Science and Technology, aiming to evaluate the performance of machine learning interatomic potential models in simulations of high-pressure hydrogen liquid-liquid phase transitions. This dataset includes 612 sets of reference data generated via density functional theory (DFT) molecular dynamics simulations, covering atomic geometries, energies, forces, and stresses under varying temperatures and mass densities. The dataset construction process involves performing molecular dynamics simulations under diverse conditions and extracting training and test datasets from the simulation outputs. It is primarily applied to performance evaluation of machine learning models, with the goal of resolving the accuracy and efficiency challenges in high-pressure hydrogen phase transition simulations.

提供机构：

德国康斯坦茨大学计算机与信息科学系，卢森堡科学技术研究所

创建时间：

2024-09-20

搜集汇总

数据集介绍

构建方式

h-llpt-24数据集通过密度泛函理论（DFT）分子动力学（MD）模拟构建，涵盖了不同温度和质量密度下的氢的液-液相变。数据集包含612个DFT参考MD模拟，每个模拟包含10,000个时间步长。这些模拟在NVT系综中进行，使用PBE泛函作为势能，并通过Quantum ESPRESSO软件实现。数据集提供了几何结构、能量、力和应力等参考值，用于训练、验证和测试机器学习原子间势（MLP）。

特点

h-llpt-24数据集的主要特点是其复杂性，这种复杂性并非来自多化学元素的相互作用，而是源自氢粒子间非线性相互作用的非线性。此外，数据集提供了详细的物理系统特定衍生属性，如压力、稳定分子分数、扩散系数和径向分布函数，这些属性用于量化MLP在MD模拟中的性能。

使用方法

使用h-llpt-24数据集时，首先需要基于训练数据部分训练MLP。随后，使用训练好的MLP运行MD模拟，并计算衍生属性。最后，通过Hellinger距离（HD）将这些属性与DFT参考模拟的结果进行定量比较。数据集附带的Python代码自动化了MD模拟的运行、衍生属性的计算和可视化，简化了MLP性能的评估过程。

背景与挑战

背景概述

h-llpt-24数据集由Thomas Bischoff、Bastian Jäckl和Matthias Rupp等人创建，旨在为机器学习原子间势能（MLPs）提供一个基准测试平台。该数据集的核心研究问题是如何在高压力下模拟氢的液-液相变，这是一个具有挑战性的物理现象。通过提供密度泛函理论（DFT）分子动力学模拟的参考几何、能量、力和应力数据，h-llpt-24数据集为MLPs的性能评估提供了标准。该数据集的创建时间可追溯至2024年，主要研究人员来自德国康斯坦茨大学和卢森堡科学技术研究所。h-llpt-24数据集的影响力在于其为MLPs在复杂物理系统中的应用提供了重要的验证工具，推动了计算物理、化学和材料科学领域的发展。

当前挑战

h-llpt-24数据集面临的挑战主要集中在两个方面。首先，解决领域问题，即在高压力下氢的液-液相变的模拟，需要高精度的能量和力预测，这对MLPs的性能提出了极高的要求。其次，数据集构建过程中遇到的挑战包括如何从DFT模拟中提取可靠的参考数据，以及如何确保这些数据在训练和测试MLPs时的有效性和代表性。此外，MLPs在实际分子动力学模拟中的表现不仅依赖于测试集上的预测误差，还需要通过物理上合理的性能指标来评估，这增加了评估的复杂性。

常用场景

经典使用场景

在分子动力学（MD）模拟中，h-llpt-24数据集被广泛用于评估机器学习原子间势（MLPs）的性能。该数据集提供了在不同温度和质量密度下，通过密度泛函理论（DFT）MD模拟得到的参考几何结构、能量、力和应力数据。通过这些数据，研究者可以训练MLPs，并利用基准代码自动运行MLP加速的MD模拟，计算和可视化压力、稳定分子分数、扩散系数和径向分布函数等宏观量，从而定量比较MLPs与DFT参考模拟的结果。

衍生相关工作

h-llpt-24数据集的引入催生了一系列相关研究工作。例如，研究者们利用该数据集开发了多种MLPs，并进行了详细的性能比较和分析。此外，该数据集还促进了MD模拟中MLPs验证方法的标准化，推动了相关软件工具的发展，如FFAST（Force Field Analysis Software and Tools）。这些工作不仅提升了MLPs在MD模拟中的应用效果，也为未来更复杂系统的模拟提供了技术基础。

数据集最近研究