PhononBench

Name: PhononBench
Creator: 中国人民大学物理学院
Published: 2025-12-24 23:07:36
License: 暂无描述

arXiv2025-12-24 更新2025-12-26 收录

下载链接：

https://github.com/xqh19970407/PhononBench

下载链接

链接失效反馈

官方服务：

资源简介：

PhononBench是由中国人民大学物理学院团队构建的首个大规模AI生成晶体动态稳定性基准数据集，包含来自6个主流晶体生成模型的108,843个经过弛豫的晶体结构。该数据集通过MatterSim原子间势能函数实现高效声子谱计算，首次系统评估了生成晶体的动态稳定性，发现当前模型的平均动态稳定率仅为25.83%。数据集特别标注了28,119个全布里渊区声子稳定的可靠候选材料，为功能材料设计与发现提供了重要资源。所有数据均经过严格的重复性过滤、CIF文件校正和结构弛豫预处理，适用于晶体生成模型评估、材料稳定性研究等领域。

PhononBench is the first large-scale AI-generated crystal dynamic stability benchmark dataset constructed by the team from the School of Physics, Renmin University of China. It contains 108,843 relaxed crystal structures derived from six mainstream crystal generation models. Using the interatomic potential function of MatterSim to perform efficient phonon spectrum calculations, this dataset conducted the first systematic assessment of the dynamic stability of generated crystals, and found that the average dynamic stability rate of current models is only 25.83%. Specifically, the dataset annotates 28,119 reliable candidate materials with phonon stability across the entire Brillouin zone, providing an important resource for functional material design and discovery. All data have undergone rigorous duplicate filtering, CIF file correction and structural relaxation preprocessing, and are applicable to fields such as crystal generation model evaluation and material stability research.

提供机构：

中国人民大学物理学院

创建时间：

2025-12-24

原始信息汇总

PhononBench 数据集概述

数据集简介

PhononBench 是一个用于大规模评估人工智能生成晶体动力学稳定性的声子基准数据集。该数据集包含超过 10 万个结构，并提供了基于密度泛函理论（DFT）级别的 MatterSim 声子计算数据以及开源的高通量工作流程。

核心特征

数据规模：包含超过 10 万个晶体结构。
计算级别：提供 DFT 级别的 MatterSim 声子计算结果。
工作流程：提供用于评估晶体生成模型动力学稳定性的标准化、开源的高通量工作流程。

晶体生成与动力学稳定性统计摘要

下表汇总了不同晶体生成模型的评估结果，包括结构弛豫数量、动力学稳定结构数量、输入脚本成功数、唯一 CIF 文件数以及总生成结构数。

模型	弛豫结构数	动力学稳定结构数	输入脚本成功数	唯一 CIF 文件数	总生成结构数
CrystalFlow-MP20	8,533	1,428	8,852	9,952	16,000
CrystalFormer-Alex20	8,642	2,969	8,807	8,986	40,000
CrystalFormer-MP20	4,408	510	4,990	5,143	20,000
CrystaLLM-MP20	1,951	58	2,074	2,074	16,000
DiffCSP-MP20	9,163	2,488	9,959	10,000	16,000
InvDesFlow-AL-MP20	8,000	2,176	–	–	–
InvDesFlow-AL-Alex20	22,755	8,743	24,997	25,000	30,000
MatterGen-Alex20	10,902	4,469	11,829	11,829	16,000
MatterGen-MP20	9,279	2,278	10,000	10,000	16,000

数据获取说明

对应的基准数据正在上传中，完成后将公开提供。下载链接将在上传完成后添加至此。

评估方法要点

在晶体生成模型的评估中，当对大约 4000 种材料进行声子计算时，动力学稳定率通常会收敛。在本研究中，除大语言模型 CrystaLLM 外，所有测试模型均超过了此样本量。具体原因在论文中有详细讨论。

引用

如果使用 PhononBench，请引用以下论文：

@misc{han2025phononbenchalargescalephononbasedbenchmark, title = {PhononBench: A Large-Scale Phonon-Based Benchmark for Dynamical Stability in Crystal Generation}, author = {Xiao-Qi Han and Ze-Feng Gao and Peng-Jie Guo and Zhong-Yi Lu}, year = {2025}, eprint = {2512.21227}, archivePrefix= {arXiv}, primaryClass = {cond-mat.mtrl-sci}, url = {https://arxiv.org/abs/2512.21227} }

搜集汇总

数据集介绍

构建方式

在晶体材料生成领域，准确评估材料的动力学稳定性至关重要。PhononBench的构建依托于MatterSim通用机器学习原子间势，该势函数在超过一万种材料的声子预测中达到了密度泛函理论级别的精度。研究团队整合了六种主流晶体生成模型，包括基于图神经网络的扩散模型、流匹配模型以及大语言模型，生成了总计221,000个新颖晶体结构。经过严格的去重和CIF文件有效性后处理，对成功弛豫的108,843个结构进行了全面的声子谱计算，从而系统性地评估了AI生成晶体的动力学稳定性。

使用方法

PhononBench为晶体生成模型的评估与优化提供了系统性的方法论框架。研究人员可利用其开源的高通量评估工作流，基于MatterSim势函数与Phonopy工具进行高效的声子计算与稳定性分析。该基准支持对不同生成架构进行公平比较，以动力学稳定结构比例作为统一评估指标，有效消除了模型在新颖性、文件合规率等方面的偏差。此外，识别出的稳定晶体数据集可作为可靠起点，供密度泛函理论研究者进一步探究功能性质，从而加速实验上可合成材料的发现进程。

背景与挑战

背景概述

在人工智能驱动的晶体材料设计领域，生成模型已展现出预测新颖晶体结构的巨大潜力。然而，传统评估框架主要依赖热力学稳定性指标，未能充分考量决定材料能否实际合成与稳定存在的动力学稳定性。针对这一关键评估缺口，中国人民大学物理学院的韩晓琪、郭鹏杰、高泽锋和卢仲毅等研究人员于2025年推出了PhononBench数据集。该数据集首次构建了大规模、系统化的动力学稳定性基准，通过整合达到密度泛函理论精度的MatterSim原子间势能，对六个主流晶体生成模型产生的108,843个结构进行了高效声子谱计算与分析。PhononBench不仅揭示了当前生成模型在确保动力学稳定性方面的普遍局限，其识别出的28,119个全布里渊区声子稳定结构，也为后续材料探索提供了宝贵的候选库，标志着该领域评估标准从热力学向动力学维度的关键演进。

当前挑战

PhononBench致力于解决的核心领域挑战，在于系统评估AI生成晶体的动力学稳定性，这是传统热力学稳定性评估所忽略但决定材料实际可行性的关键物理属性。构建该数据集面临多重技术挑战：首要挑战在于克服传统第一性原理声子计算的高昂计算成本，以实现对十万量级生成结构的大规模、高效评估。研究团队通过采用经万种材料验证、达到DFT精度的MatterSim势能模型，才得以在可承受的计算资源下完成此项任务。其次，数据整合与处理流程亦具挑战，需对来自不同架构生成模型的原始结构进行去重、CIF文件校正、结构弛豫收敛筛选等多步骤预处理，确保输入数据的质量与一致性，为后续可靠的声子计算与稳定性分类奠定基础。

常用场景

经典使用场景

在晶体材料生成领域，PhononBench作为首个大规模动力学稳定性基准，其经典使用场景聚焦于系统评估人工智能生成晶体的声子稳定性。通过整合MatterSim原子间势能模型，该数据集实现了对超过十万个生成晶体结构的高通量声子谱计算，为比较不同生成模型在动力学稳定性方面的性能提供了统一标准。这一场景不仅揭示了当前生成模型在确保结构动态稳定性方面的普遍局限，还为优化模型设计提供了关键的数据支撑。

解决学术问题

PhononBench有效解决了晶体生成研究中动力学稳定性评估缺失的核心学术问题。传统评估多依赖热力学稳定性指标，而动力学稳定性作为材料可合成性与实际存在的关键决定因素，却因计算成本高昂而长期被忽视。该数据集通过大规模声子计算，首次系统量化了生成晶体的动力学稳定性比率，揭示了当前模型平均仅25.83%的稳定率，凸显了生成模型在物理可行性方面的重大挑战。这一工作为材料生成领域建立了至关重要的评估维度，推动了从单纯结构预测向物理可信材料设计的范式转变。

实际应用

在实际应用层面，PhononBench为材料发现与设计流程提供了可靠的预筛选工具。通过识别出28,119个全布里渊区声子稳定的晶体结构，该数据集构建了一个丰富的候选材料库，可直接用于后续实验合成或性能计算。在功能材料定向生成中，例如带隙调控的MatterGen模型，PhononBench能够快速评估不同条件下生成结构的动态稳定性，指导实验者优先选择稳定候选体。这种高通量稳定性筛选显著降低了传统密度泛函理论计算成本，加速了从计算设计到实验验证的转化进程。

数据集最近研究