five

LiPS-25

收藏
arXiv2025-11-21 更新2025-11-24 收录
下载链接:
https://github.com/nfragapane/lips-25
下载链接
链接失效反馈
官方服务:
资源简介:
LiPS-25是由牛津大学研发的锂硫磷固态电解质基准数据集,涵盖Li2S-P2S5伪二元组分线的晶体与非晶构型。该数据集包含12,525个原子结构,总计53.1万原子,数据源自无机晶体结构数据库、材料计划项目的畸变晶体,以及第一性原理分子动力学模拟和迭代熔融淬火采样。通过密度泛函理论计算能量与力标签,构建过程融合领域知识引导的组成筛选与主动学习策略。该数据集专为机器学习势函数评估而设计,致力于解决固态电解质中离子迁移机制与相变行为的精准预测问题,推动高导电材料开发。

LiPS-25 is a lithium thiophosphate solid electrolyte benchmark dataset developed by the University of Oxford, covering both crystalline and amorphous configurations along the pseudo-binary compositional line of Li₂S-P₂S₅. This dataset contains 12,525 atomic structures with a total of 531,000 atoms, and its data is sourced from the Inorganic Crystal Structure Database, distorted crystals from the Materials Project, first-principles molecular dynamics simulations, and iterative melt-quenching sampling. Energy and force labels were calculated using density functional theory (DFT), and the dataset construction process integrates domain knowledge-guided compositional screening and active learning strategies. Specifically designed for the evaluation of machine learning potentials, this dataset aims to address the accurate prediction of ion migration mechanisms and phase transition behaviors in solid electrolytes, thereby advancing the development of high-conductivity materials.
提供机构:
牛津大学
创建时间:
2025-11-21
原始信息汇总

数据集概述

基本信息

  • 数据集名称:LiPS-25基准数据集
  • 数据规模:约13,000个结构
  • 材料体系:Li-P-S电解质材料体系
  • 组成范围:沿Li₂S–P₂S₅伪二元组成线

数据内容

结构类型

  • 包含晶体结构
  • 包含非晶结构
  • 覆盖Li-P-S相空间的全面结构

数据子集

  • 完整数据集:位于data/lips-25目录
  • 过滤子集:Li₇P₃S₁₁结构,位于data/fine-tuning目录,用于微调实验

数据划分

  • 提供预定义的训练集划分
  • 提供预定义的验证集划分
  • 提供预定义的测试集划分

应用用途

  • 用于机器学习原子间势的基准测试
  • 支持Li-P-S体系的机器学习势函数开发

相关资源

基准测试任务

  • 提供四项性能测试套件
  • 包含常规数值误差指标
  • 包含物理驱动的评估任务
  • 位于benchmarking文件夹

模型资源

  • MACE超参数扫描模型:位于models/mace-models目录,提供graph-pes格式和LAMMPS兼容版本
  • 微调基础模型:位于models/fine-tuned目录,支持下游任务和进一步适配
搜集汇总
数据集介绍
main_image_url
构建方式
在固态电解质材料研究领域,LiPS-25数据集的构建采用了多阶段迭代策略,以覆盖Li2S–P2S5伪二元组分线的结构多样性。初始数据集(Iter0)整合了来自无机晶体结构数据库和材料项目的晶体结构,并通过原子位置扰动和体积畸变增强采样。随后引入基于NequIP架构的熔融-淬火模拟,采用委员会查询机制从非平衡轨迹中筛选最具不确定性的构型,逐步扩展至液态和非晶态相。所有结构均通过PBEsol泛函的密度泛函理论计算标注能量和力,确保了数据的物理一致性与计算可靠性。
使用方法
该数据集的应用围绕四类基准任务展开,形成从静态验证到动态评估的完整链条。研究者可首先通过形成能计算(任务1)检验模型的静态精度,继而利用熔融-淬火轨迹的力预测(任务2)评估非平衡态泛化能力。对于功能属性验证,可通过分子动力学模拟提取Li7P3S11的离子电导率(任务3),并与实验值范围进行对比。最终通过极端温压条件下的稳定性测试(任务4)全面衡量模型的鲁棒性。配套的Python脚本与LAMMPS输入文件确保了评估流程的可复现性。
背景与挑战
背景概述
锂磷硫(LiPS)固态电解质材料因其高离子电导率和电化学稳定性,成为新一代固态电池研究的核心体系。LiPS-25数据集由牛津大学无机化学实验室的Natascia L. Fragapane与Volker L. Deringer于2025年联合发布,聚焦于Li₂S–P₂S₅伪二元组分线的晶体与非晶结构。该数据集通过第一性原理计算标注能量与原子力数据,旨在构建标准化评估框架,推动机器学习势函数在复杂材料体系中的可靠性验证与应用拓展。其覆盖七种关键组分与多尺度构型,为固态电解质界面演化与离子迁移机制研究提供了基础数据支撑。
当前挑战
LiPS-25需应对双重挑战:在领域问题层面,固态电解质的离子输运行为依赖非平衡态动力学过程,要求机器学习势函数精准捕捉局域原子环境与长程关联效应;数据集构建过程中,需平衡晶体与非晶相的结构多样性,并通过迭代熔融淬火策略增强对无序体系的采样。此外,数据标注依赖密度泛函理论计算,其计算成本与精度权衡、以及不同交换关联泛函间的能量基准统一,均为数据集质量控制的潜在难点。
常用场景
经典使用场景
在固态电解质材料研究领域,LiPS-25数据集作为基准测试工具,被广泛用于评估机器学习原子间势函数的性能。该数据集聚焦于Li2S-P2S5伪二元组分线的典型固态电解质材料,涵盖晶体与非晶态构型,为开发高精度势函数模型提供了结构多样的训练与验证数据。研究人员通过该数据集能够系统检验模型在复杂化学环境中的泛化能力,特别是在捕捉锂离子迁移机制和相变行为等关键物理现象方面的表现。
解决学术问题
LiPS-25数据集有效解决了机器学习势函数在固态电解质研究中面临的若干核心学术问题。通过提供涵盖晶体、玻璃态及液态构型的原子结构及其对应的DFT能量与力标签,该数据集支持对模型热力学稳定性预测精度、离子电导率计算可靠性等关键性能的量化评估。其意义在于建立了从静态误差度量到动态物理性质验证的多层次评估体系,显著提升了机器学习势函数在电池材料模拟中的可信度与实用性,推动了计算材料科学向数据驱动范式的转型。
实际应用
该数据集的实际应用场景主要集中于全固态电池电解质材料的开发与优化。通过利用LiPS-25训练的势函数,研究人员能够以接近第一性原理的精度模拟锂硫磷酸盐体系在不同温度与压力条件下的结构演化、离子迁移路径及相变过程。这些模拟为实验合成提供了理论指导,例如预测新型超离子导体成分、分析界面稳定性问题,显著降低了传统试错法研发成本,加速了高性能固态电解质的设计周期。
数据集最近研究
最新研究方向
在固态电解质材料领域,LiPS-25数据集作为机器学习原子间势能(MLIP)的基准评估工具,正推动前沿研究聚焦于多维度验证框架的构建。该数据集通过整合晶体与非晶结构,支持从静态能量精度到动态离子迁移特性的系统评测,尤其关注图神经网络架构在锂硫磷体系中的超参数优化与预训练模型微调行为。热点研究围绕物理导向的评估任务展开,例如离子电导率预测与极端条件下的模拟鲁棒性测试,这些工作显著提升了MLIP在电池材料模拟中的可移植性与可靠性,为复杂功能材料的计算设计奠定了新范式。
相关研究论文
  • 1
    通过牛津大学 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作