five

QMOF150_ADiT

收藏
Hugging Face2025-03-24 更新2025-03-25 收录
下载链接:
https://huggingface.co/datasets/chaitjo/QMOF150_ADiT
下载链接
链接失效反馈
官方服务:
资源简介:
QMOF150数据集,来自论文《All-atom Diffusion Transformers: Unified generative modelling of molecules and materials》的作者 Joshi Chaitanya K. 等人,该数据集用于全原子扩散变换器模型的研究。
创建时间:
2025-03-22
原始信息汇总

QMOF150数据集概述

基本信息

相关论文

  • 论文标题: "All-atom Diffusion Transformers: Unified generative modelling of molecules and materials"
  • 论文链接: https://www.arxiv.org/abs/2503.03965
  • 作者:
    • Chaitanya K. Joshi
    • Xiang Fu
    • Yi-Lun Liao
    • Vahe Gharakhanyan
    • Benjamin Kurt Miller
    • Anuroop Sriram* (联合通讯作者)
    • Zachary W. Ulissi* (联合通讯作者)
  • 机构: FAIR Chemistry at Meta
搜集汇总
数据集介绍
main_image_url
构建方式
QMOF150_ADiT数据集源自《All-atom Diffusion Transformers: Unified generative modelling of molecules and materials》研究论文,由Meta FAIR Chemistry团队的多位学者联合构建。该数据集基于Andrew-S-Rosen团队开发的QMOF原始数据库,通过系统性筛选与标准化处理,最终形成包含150种金属有机框架(MOF)结构的高质量集合。数据构建过程严格遵循计算材料学规范,每个结构均经过几何优化与电子结构验证,确保其物理化学性质的可靠性。
特点
作为专注于生成式建模的专用数据集,QMOF150_ADiT的突出特点在于其全原子级别的结构表征。数据集涵盖多种金属节点与有机配体的组合形式,晶体结构的周期性边界条件被完整保留。特别值得注意的是,所有MOF结构均附带精确的扩散过程动力学参数,这为研究分子和材料的统一生成模型提供了独特的数据支持。数据集的空间对称性与孔隙率等关键特征均经过量子化学计算验证。
使用方法
该数据集主要面向计算化学与材料信息学领域的研究者,建议通过GitHub仓库提供的专用加载工具进行访问。使用前需安装PyTorch或JAX框架以支持扩散变换器的运算需求。典型应用场景包括:训练全原子扩散生成模型、验证材料逆向设计算法性能、以及开发跨尺度分子动力学模拟方法。研究人员可通过HuggingFace平台直接获取预处理后的标准化数据,亦可访问原始GitHub仓库进行更底层的参数定制。
背景与挑战
背景概述
QMOF150_ADiT数据集源于2023年Meta公司FAIR Chemistry团队在分子与材料生成建模领域的前沿研究,核心研究人员包括Chaitanya K. Joshi、Anuroop Sriram等学者。该数据集作为《All-atom Diffusion Transformers》论文的支撑数据,致力于解决跨尺度原子系统统一生成建模的难题,其创新性地将扩散变换器框架拓展至全原子系统建模领域。原始数据源自Andrew S. Rosen团队构建的QMOF数据库,通过重构与标注为生成式模型提供了涵盖150种金属有机框架的标准化训练基准,显著推进了计算化学与材料设计领域的可生成性研究。
当前挑战
该数据集面临双重技术挑战:在领域问题层面,金属有机框架材料具有复杂的多孔晶体结构和非周期性原子排列,传统生成模型难以准确捕捉其长程相互作用与拓扑多样性;在构建过程中,需平衡计算化学精度与生成效率的矛盾,原始QMOF数据的能级计算与几何优化涉及高维量子力学参数,转化为适用于扩散变换器的训练样本时需解决坐标系统标准化与周期性边界条件处理等关键问题。数据标注过程中对配体-金属键合模式的分类标准制定也构成显著挑战。
常用场景
经典使用场景
QMOF150_ADiT数据集作为分子与材料生成建模领域的基准数据集,其经典使用场景主要集中在利用扩散变换器(Diffusion Transformers)进行全原子尺度下的结构预测与生成。研究人员通过该数据集训练模型,能够模拟晶体材料的三维原子排列,探索新型金属有机框架(MOFs)的稳定构型,为高通量材料设计提供数据支撑。
衍生相关工作
基于该数据集衍生的经典工作包括Meta团队提出的全原子扩散变换器架构(ADiT),其统一处理分子与材料生成的范式启发了后续研究如晶体图神经网络与扩散模型的融合。相关成果发表在《Nature》子刊等顶级期刊,推动了生成式AI在计算化学中的应用边界。
数据集最近研究
最新研究方向
在材料科学和计算化学领域,QMOF150_ADiT数据集的推出为分子与材料的生成建模研究注入了新的活力。该数据集源自《全原子扩散变换器:分子与材料的统一生成建模》一文,研究团队通过整合量子力学计算的金属有机框架(MOF)结构数据,为扩散变换器模型提供了高质量的基准。当前,前沿研究正聚焦于利用该数据集探索多尺度材料生成、稳定性预测以及高通量虚拟筛选等方向。特别是在新型催化剂设计和能源存储材料开发中,该数据集的应用显著加速了材料发现的进程。其开源特性更促进了跨学科合作,使得计算方法与实验验证得以紧密结合,为材料基因组计划提供了重要支撑。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作