nmrshiftdb2-2024
收藏arXiv2024-08-28 更新2024-08-30 收录
下载链接:
https://zenodo.org/records/13317524
下载链接
链接失效反馈官方服务:
资源简介:
nmrshiftdb2-2024数据集是由厦门大学和DP Technology联合创建的,用于支持核磁共振(NMR)化学位移预测模型的评估。该数据集通过对现有的NMR实验数据库nmrshiftdb2进行广泛的清洗和验证而创建,包含480,000条化学位移数据,涵盖了多样化的化学系统。数据集的创建过程包括手动筛选和纠正错误条目,确保数据的质量和可靠性。该数据集主要应用于分析化学和结构化学领域,旨在提高NMR化学位移预测的准确性和效率,从而在分子结构解析和材料设计中发挥重要作用。
The nmrshiftdb2-2024 dataset was jointly developed by Xiamen University and DP Technology to support the evaluation of nuclear magnetic resonance (NMR) chemical shift prediction models. This dataset was constructed by extensively cleaning and validating the existing NMR experimental database nmrshiftdb2, and contains 480,000 chemical shift entries covering diverse chemical systems. The dataset construction process includes manual screening and correction of erroneous entries to ensure data quality and reliability. This dataset is mainly applied in the fields of analytical chemistry and structural chemistry, aiming to improve the accuracy and efficiency of NMR chemical shift prediction, thereby playing an important role in molecular structure elucidation and material design.
提供机构:
厦门大学
创建时间:
2024-08-28
搜集汇总
数据集介绍

构建方式
nmrshiftdb2-2024数据集的构建基于nmrshiftdb2数据库,经过严格的清洗和验证过程。研究人员手动筛选和纠正了数据库中的错误条目,以创建一个更全面、更可靠的化学位移预测数据集。这个数据集包含了更多原子、更多种类的元素以及更复杂的结构,为未来的NMR预测模型发展提供了坚实的基础资源。
使用方法
nmrshiftdb2-2024数据集可用于以下方面:1)NMR化学位移预测模型的训练和验证;2)NMR光谱解析和结构分析;3)材料设计和化学研究。此外,研究人员还开发了一个用户友好的交互式Web应用程序,允许用户快速、方便地预测分子的化学位移。
背景与挑战
背景概述
核磁共振(NMR)光谱分析在化学、生物学和材料科学中扮演着至关重要的角色,它能够揭示分子的局部化学环境。准确的NMR化学位移预测对于光谱信号的分配和NMR光谱的解释至关重要,进而有助于结构的修订和构型的确定。传统的NMR化学位移预测方法在处理复杂分子结构时,常常面临准确性和效率之间的平衡问题。随着深度学习的发展,为提高NMR化学位移预测提供了新的途径。目前,针对液体状态和固体状态的NMR数据集,已经出现了多种深度学习模型,例如基于图卷积网络的GCN和基于E(3)-等变消息传递神经网络的DetaNet。然而,液体状态和固体状态的NMR具有不同的特征,需要单独的框架来准确预测NMR化学位移。本研究提出了NMRNet,一个统一的框架,通过预训练和微调范式,设计用于通用原子环境建模,基于共享的SE(3) Transformer架构。通过收集大量的晶体结构数据进行预训练,建立了晶体局部环境的有效表示,能够直接应用于与晶体材料相关的各种下游任务。此外,还汇编了一个全面的基准,用于评估NMR化学位移预测模型,包括来自以前研究的各种化学系统的数据集。本研究创建了一个标准化的数据集nmrshiftdb2-2024,该数据集是在对现有的NMR实验数据库nmrshiftdb2进行广泛的清洗和验证的基础上产生的,为未来NMR预测模型的发展提供了基础资源。NMRNet在液体状态和固体状态NMR中都实现了最先进的预测性能,即使在复杂系统中也表现出强大的泛化能力。这项工作为光谱学和结构分析领域带来了新的视角,为材料设计和化学研究中的未来创新做出了重大贡献。
当前挑战
NMR化学位移预测面临着多个挑战。首先,液体状态和固体状态的NMR数据集具有不同的特征,需要单独的框架来准确预测NMR化学位移。其次,传统的NMR化学位移预测方法在处理复杂分子结构时,常常面临准确性和效率之间的平衡问题。此外,深度学习模型在峰值分配和构型确定等复杂任务中仍然存在挑战。例如,NMRNet在峰值分配任务中的准确性仍然受到限制,尤其是在1H NMR中,由于不同原子之间的实验化学位移值较小且差异较接近,这使得该任务更具挑战性。此外,尽管NMRNet的3D坐标表示方法能够更好地表示原子环境,但它在准确区分化学等效原子方面仍然存在困难。这些限制阻碍了NMRNet在峰值分配任务中的能力,但也指出了未来NMR相关和光谱相关深度学习模型发展的方向。
常用场景
经典使用场景
在核磁共振化学位移预测领域,nmrshiftdb2-2024数据集作为基准数据集,被广泛应用于深度学习模型的训练和评估。该数据集包含了大量经过清洗和验证的液态NMR实验数据,为液态NMR化学位移预测提供了丰富的训练资源。此外,nmrshiftdb2-2024数据集也被用于评估NMRNet模型在不同元素和溶剂环境下的预测性能,验证了该模型在复杂系统中的泛化能力和鲁棒性。
解决学术问题
nmrshiftdb2-2024数据集解决了传统NMR化学位移预测方法在处理复杂分子结构时的准确性和效率问题。该数据集为深度学习模型提供了大量的训练数据,使得模型能够学习到更加复杂的结构-谱图关系。此外,nmrshiftdb2-2024数据集的建立也推动了NMR预测领域的发展,为未来NMR预测模型的改进和创新提供了基础。
实际应用
nmrshiftdb2-2024数据集在实际应用中,可以用于帮助化学家快速准确地预测分子结构,以及识别和解析NMR谱图。此外,该数据集还可以用于开发新的NMR预测模型,以提高预测的准确性和效率。例如,NMRNet模型在nmrshiftdb2-2024数据集上的训练结果表明,该模型在液态NMR化学位移预测方面取得了最先进的性能,为实际应用提供了可靠的技术支持。
数据集最近研究
最新研究方向
核磁共振化学位移的深度学习预测领域,本研究提出了NMRNet,这是一个基于SE(3) Transformer的原子环境建模的深度学习框架,通过预训练和微调范式进行。为了支持NMR化学位移预测模型的评估,本研究建立了一个基于先前研究和数据库的全面基准,涵盖了多种化学系统。NMRNet在液体和固体NMR数据集上都取得了最先进的性能,展示了其在实际场景中的鲁棒性和实用价值。这是首次将固体和液体NMR整合到一个统一的模型架构中,突出了对不同的原子环境进行领域特定处理的需要。本研究为NMR预测设定了新的标准,推动了深度学习在分析和结构化学中的应用。
相关研究论文
- 1Towards a Unified Benchmark and Framework for Deep Learning-Based Prediction of Nuclear Magnetic Resonance Chemical Shifts厦门大学 · 2024年
以上内容由遇见数据集搜集并总结生成



