PhononBench
收藏PhononBench 数据集概述
数据集简介
PhononBench 是一个用于大规模评估人工智能生成晶体动力学稳定性的声子基准数据集。该数据集包含超过 10 万个结构,并提供了基于密度泛函理论(DFT)级别的 MatterSim 声子计算数据以及开源的高通量工作流程。
核心特征
- 数据规模:包含超过 10 万个晶体结构。
- 计算级别:提供 DFT 级别的 MatterSim 声子计算结果。
- 工作流程:提供用于评估晶体生成模型动力学稳定性的标准化、开源的高通量工作流程。
晶体生成与动力学稳定性统计摘要
下表汇总了不同晶体生成模型的评估结果,包括结构弛豫数量、动力学稳定结构数量、输入脚本成功数、唯一 CIF 文件数以及总生成结构数。
| 模型 | 弛豫结构数 | 动力学稳定结构数 | 输入脚本成功数 | 唯一 CIF 文件数 | 总生成结构数 |
|---|---|---|---|---|---|
| CrystalFlow-MP20 | 8,533 | 1,428 | 8,852 | 9,952 | 16,000 |
| CrystalFormer-Alex20 | 8,642 | 2,969 | 8,807 | 8,986 | 40,000 |
| CrystalFormer-MP20 | 4,408 | 510 | 4,990 | 5,143 | 20,000 |
| CrystaLLM-MP20 | 1,951 | 58 | 2,074 | 2,074 | 16,000 |
| DiffCSP-MP20 | 9,163 | 2,488 | 9,959 | 10,000 | 16,000 |
| InvDesFlow-AL-MP20 | 8,000 | 2,176 | – | – | – |
| InvDesFlow-AL-Alex20 | 22,755 | 8,743 | 24,997 | 25,000 | 30,000 |
| MatterGen-Alex20 | 10,902 | 4,469 | 11,829 | 11,829 | 16,000 |
| MatterGen-MP20 | 9,279 | 2,278 | 10,000 | 10,000 | 16,000 |
数据获取说明
对应的基准数据正在上传中,完成后将公开提供。下载链接将在上传完成后添加至此。
评估方法要点
在晶体生成模型的评估中,当对大约 4000 种材料进行声子计算时,动力学稳定率通常会收敛。在本研究中,除大语言模型 CrystaLLM 外,所有测试模型均超过了此样本量。具体原因在论文中有详细讨论。
引用
如果使用 PhononBench,请引用以下论文:
@misc{han2025phononbenchalargescalephononbasedbenchmark, title = {PhononBench: A Large-Scale Phonon-Based Benchmark for Dynamical Stability in Crystal Generation}, author = {Xiao-Qi Han and Ze-Feng Gao and Peng-Jie Guo and Zhong-Yi Lu}, year = {2025}, eprint = {2512.21227}, archivePrefix= {arXiv}, primaryClass = {cond-mat.mtrl-sci}, url = {https://arxiv.org/abs/2512.21227} }

- 1PhononBench:A Large-Scale Phonon-Based Benchmark for Dynamical Stability in Crystal Generation中国人民大学物理学院 · 2025年



