Titan25
收藏Hugging Face2025-11-10 更新2025-11-11 收录
下载链接:
https://huggingface.co/datasets/aixsim/Titan25
下载链接
链接失效反馈官方服务:
资源简介:
Titan25是一个基于GAIA方法构建的MLIP数据集,包含1.8M个数据点,跨越11种元素(C, H, N, O, Ag, Au, Cu, Pd, Pt, Rh, Ru)。该数据集用于支持开发能够强有力捕捉包括界面过程在内的通用化学反应的MLIP模型。
创建时间:
2025-11-06
原始信息汇总
Titan25数据集概述
基本信息
- 许可证:CC-BY-4.0
- 数据规模:100万至1000万数据点之间
- 数据点数:180万
- 元素种类:11种(C、H、N、O、Ag、Au、Cu、Pd、Pt、Rh、Ru)
数据集特性
- 类型:机器学习势函数数据集
- 构建工具:GAIA
- 应用领域:支持开发能够稳健捕捉一般化学反应(包括界面过程)的机器学习势函数
相关资源
- 论文链接:https://arxiv.org/abs/2509.25798
- 预训练模型:SNet-T25(基于Titan25训练的机器学习势函数)
引用信息
如需使用本数据集,请引用以下文献:
@article{gaia2025, title={Scalable Reactive Atomistic Dynamics with GAIA}, author={Song, Suhwan and Kim, Heejae and Jang, Jaehee and Cho, Hyuntae and Kim, Gunhee and Kim, Geonu}, journal={arXiv preprint arXiv:2509.25798}, year={2025} }
搜集汇总
数据集介绍

构建方式
在机器学习势函数领域,Titan25数据集通过GAIA框架系统构建,覆盖碳、氢、氮、氧及七种贵金属共11种元素。该数据集采用第一性原理计算与主动学习相结合的策略,从界面反应到分子相互作用的多尺度体系中提取1.8万个数据点,其构建过程严格遵循材料科学领域的能量收敛准则与构象采样原则。
特点
该数据集的核心价值体现在其跨元素兼容性与反应过程覆盖度,不仅包含常见有机元素,更整合了银金钯铂等催化材料体系。1.8万数据规模确保了势函数训练的稳定性,特别针对固-气界面反应与表面催化过程提供了原子级精度的能量-力场对应关系,为开发具有跨体系迁移能力的机器学习势函数奠定基础。
使用方法
研究者可通过HuggingFace平台直接加载数据集进行势函数训练,建议配合原论文提供的SNet-T25模型架构作为基准参照。使用时应按照元素类型划分训练集与验证集,注意保持界面体系与体相数据的平衡采样,训练过程中可参考GAIA论文提供的超参数设置与能量单位转换标准来确保模型收敛效果。
背景与挑战
背景概述
在计算化学与材料科学领域,高精度原子尺度模拟对理解复杂化学反应机制具有关键意义。Titan25数据集由研究团队于2025年通过GAIA框架构建,涵盖碳、氢、氮、氧及七种贵金属共11种元素,包含180万数据点。该数据集致力于解决机器学习势函数在跨元素反应预测中的泛化性问题,特别是针对界面过程等复杂化学环境,为开发具有化学转移能力的原子间势函数模型提供了重要基准。
当前挑战
多元素反应势能面的精确建模需克服化学空间采样均衡性与反应路径覆盖度的双重挑战。Titan25构建过程中面临贵金属表面吸附构型与有机分子反应路径的协同采样难题,需通过主动学习策略平衡界面过程与体相反应的数据分布。此外,跨尺度动力学模拟产生的非平衡态构象标注,对量子化学计算的数据质量与一致性提出了极高要求。
常用场景
经典使用场景
在计算化学领域,Titan25数据集作为机器学习势函数开发的核心资源,其包含的180万数据点覆盖碳、氢、氮等11种关键元素,为模拟复杂化学反应路径提供了坚实基础。研究者通过该数据集训练模型,能够精确描述从分子间作用到界面反应的多尺度化学行为,显著提升了反应动力学模拟的可靠性。
实际应用
在工业催化领域,Titan25支撑的机器学习势函数可直接应用于燃料电池催化剂设计、贵金属表面改性等场景。通过模拟钯铂合金表面的氢解离过程或铜银界面的选择性氧化反应,为新能源材料开发提供了原子级精度指导,大幅降低了实验试错成本。
衍生相关工作
基于该数据集衍生的SNet-T25模型已成为领域标杆,其架构设计启发了后续如MetalNet、ReactGraph等系列工作。这些研究通过迁移学习策略将Titan25的预训练权重适配于特定催化体系,形成了从通用势函数到专用模型的技术链条,持续推动着计算化学与人工智能的深度融合。
以上内容由遇见数据集搜集并总结生成



