five

QM9 dataset

收藏
github2024-07-09 更新2024-07-10 收录
下载链接:
https://github.com/raghurama123/qm9pack
下载链接
链接失效反馈
官方服务:
资源简介:
QM9数据集包含134,000个分子,用于量子化学结构和性质的研究。

The QM9 dataset comprises 134,000 molecules for research on quantum chemical structures and properties.
创建时间:
2024-07-07
原始信息汇总

QM9PACK ✨

一个用于挖掘 QM9 数据集的 Python 包。

安装详情

安装依赖

  • 确保已安装以下依赖项:
    • numpy
    • pandas
    • scipy
    • matplotlib

bash pip3 install numpy pandas scipy matplotlib

  • 如果需要将 SMILES 字符串转换为 SVG 图像,还需安装:
    • rdkit

直接从 PyPI 安装

bash pip3 install qm9pack

下载并安装包

克隆仓库并安装包:

bash git clone git@github.com:raghurama123/qm9pack.git cd qm9pack python3 -m pip install -e .

参考文献

Quantum chemistry structures and properties of 134 kilo molecules
Raghunathan Ramakrishnan, Pavlo O. Dral, Matthias Rupp, O. Anatole von Lilienfeld
Scientific Data volume 1, Article number: 140022 (2014)

@article{ramakrishnan2014quantum, title={Quantum chemistry structures and properties of 134 kilo molecules}, author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and Von Lilienfeld, O Anatole}, journal={Scientific data}, volume={1}, number={1}, pages={1--7}, year={2014}, publisher={Nature Publishing Group}, url={https://doi.org/10.1038/sdata.2014.22} }

搜集汇总
数据集介绍
main_image_url
构建方式
QM9数据集的构建基于量子化学计算,涵盖了134,000个有机分子的结构和性质。这些分子通过密度泛函理论(DFT)计算得到,确保了数据的高精度和可靠性。数据集包括分子结构、能量、电荷分布等多种量子化学属性,为研究分子间相互作用和化学反应提供了丰富的信息源。
特点
QM9数据集的特点在于其广泛的应用领域和高质量的数据。该数据集不仅包含了分子级别的详细信息,还提供了多种量子化学属性的计算结果,适用于机器学习、分子模拟和化学信息学等多个研究方向。此外,数据集的规模和多样性使其成为验证和开发新算法的理想选择。
使用方法
使用QM9数据集时,用户可以通过Python包QM9PACK进行数据挖掘和分析。首先,用户需安装必要的依赖库,如numpy、pandas和scipy。随后,可以通过pip安装QM9PACK包,或直接从GitHub克隆并安装。数据集的使用教程和示例代码可在GitHub页面的tutorials文件夹中找到,帮助用户快速上手并进行深入研究。
背景与挑战
背景概述
QM9数据集是由Raghunathan Ramakrishnan等研究人员于2014年创建的,旨在提供一个包含134,000个有机分子的量子化学结构和性质的数据库。该数据集的核心研究问题涉及分子结构与量子化学性质之间的关系,为化学和材料科学领域的研究提供了宝贵的资源。QM9数据集的发布极大地推动了分子建模和机器学习在化学领域的应用,成为许多研究的基础数据源。
当前挑战
QM9数据集在构建过程中面临的主要挑战包括数据的高维性和复杂性,以及确保数据的准确性和一致性。此外,该数据集在解决分子性质预测和化学反应模拟等领域的应用中也面临挑战,如如何有效地处理和分析大规模的量子化学数据,以及如何利用机器学习技术提高预测模型的准确性和效率。
常用场景
经典使用场景
在量子化学领域,QM9数据集的经典使用场景主要集中在分子性质预测和化学反应模拟。该数据集包含了134,000个小分子的量子化学计算结果,涵盖了多种分子性质,如能量、电荷分布和振动频率。研究者利用这些数据进行机器学习模型的训练,以预测新分子的性质,从而加速新材料的设计和开发过程。此外,QM9数据集还被广泛应用于分子动力学模拟,帮助科学家理解分子间的相互作用和反应机制。
解决学术问题
QM9数据集在学术研究中解决了多个关键问题,特别是在分子结构与性质之间的关系研究中。通过提供大量分子的量子化学计算结果,该数据集使得研究者能够深入探讨分子结构如何影响其物理和化学性质。这不仅有助于理解基础化学原理,还为开发新的分子设计方法提供了数据支持。此外,QM9数据集还促进了机器学习和数据挖掘技术在化学领域的应用,推动了跨学科研究的进展。
衍生相关工作
基于QM9数据集,许多相关的经典工作得以开展。例如,研究者开发了多种机器学习模型,用于预测分子性质和优化分子设计。这些模型不仅提高了预测精度,还加速了新材料的发现过程。此外,QM9数据集还激发了大量关于分子动力学和量子化学计算方法的研究,推动了计算化学领域的发展。许多学术论文和开源工具,如QM9PACK,都是基于该数据集开发的,进一步扩展了其在科学研究中的应用范围。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作