five

QM9 dataset|量子化学数据集|分子研究数据集

收藏
github2024-07-09 更新2024-07-10 收录
量子化学
分子研究
下载链接:
https://github.com/raghurama123/qm9pack
下载链接
链接失效反馈
资源简介:
QM9数据集包含134,000个分子,用于量子化学结构和性质的研究。
创建时间:
2024-07-07
原始信息汇总

QM9PACK ✨

一个用于挖掘 QM9 数据集的 Python 包。

安装详情

安装依赖

  • 确保已安装以下依赖项:
    • numpy
    • pandas
    • scipy
    • matplotlib

bash pip3 install numpy pandas scipy matplotlib

  • 如果需要将 SMILES 字符串转换为 SVG 图像,还需安装:
    • rdkit

直接从 PyPI 安装

bash pip3 install qm9pack

下载并安装包

克隆仓库并安装包:

bash git clone git@github.com:raghurama123/qm9pack.git cd qm9pack python3 -m pip install -e .

参考文献

Quantum chemistry structures and properties of 134 kilo molecules
Raghunathan Ramakrishnan, Pavlo O. Dral, Matthias Rupp, O. Anatole von Lilienfeld
Scientific Data volume 1, Article number: 140022 (2014)

@article{ramakrishnan2014quantum, title={Quantum chemistry structures and properties of 134 kilo molecules}, author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and Von Lilienfeld, O Anatole}, journal={Scientific data}, volume={1}, number={1}, pages={1--7}, year={2014}, publisher={Nature Publishing Group}, url={https://doi.org/10.1038/sdata.2014.22} }

AI搜集汇总
数据集介绍
main_image_url
构建方式
QM9数据集的构建基于量子化学计算,涵盖了134,000个有机分子的结构和性质。这些分子通过密度泛函理论(DFT)计算得到,确保了数据的高精度和可靠性。数据集包括分子结构、能量、电荷分布等多种量子化学属性,为研究分子间相互作用和化学反应提供了丰富的信息源。
特点
QM9数据集的特点在于其广泛的应用领域和高质量的数据。该数据集不仅包含了分子级别的详细信息,还提供了多种量子化学属性的计算结果,适用于机器学习、分子模拟和化学信息学等多个研究方向。此外,数据集的规模和多样性使其成为验证和开发新算法的理想选择。
使用方法
使用QM9数据集时,用户可以通过Python包QM9PACK进行数据挖掘和分析。首先,用户需安装必要的依赖库,如numpy、pandas和scipy。随后,可以通过pip安装QM9PACK包,或直接从GitHub克隆并安装。数据集的使用教程和示例代码可在GitHub页面的tutorials文件夹中找到,帮助用户快速上手并进行深入研究。
背景与挑战
背景概述
QM9数据集是由Raghunathan Ramakrishnan等研究人员于2014年创建的,旨在提供一个包含134,000个有机分子的量子化学结构和性质的数据库。该数据集的核心研究问题涉及分子结构与量子化学性质之间的关系,为化学和材料科学领域的研究提供了宝贵的资源。QM9数据集的发布极大地推动了分子建模和机器学习在化学领域的应用,成为许多研究的基础数据源。
当前挑战
QM9数据集在构建过程中面临的主要挑战包括数据的高维性和复杂性,以及确保数据的准确性和一致性。此外,该数据集在解决分子性质预测和化学反应模拟等领域的应用中也面临挑战,如如何有效地处理和分析大规模的量子化学数据,以及如何利用机器学习技术提高预测模型的准确性和效率。
常用场景
经典使用场景
在量子化学领域,QM9数据集的经典使用场景主要集中在分子性质预测和化学反应模拟。该数据集包含了134,000个小分子的量子化学计算结果,涵盖了多种分子性质,如能量、电荷分布和振动频率。研究者利用这些数据进行机器学习模型的训练,以预测新分子的性质,从而加速新材料的设计和开发过程。此外,QM9数据集还被广泛应用于分子动力学模拟,帮助科学家理解分子间的相互作用和反应机制。
解决学术问题
QM9数据集在学术研究中解决了多个关键问题,特别是在分子结构与性质之间的关系研究中。通过提供大量分子的量子化学计算结果,该数据集使得研究者能够深入探讨分子结构如何影响其物理和化学性质。这不仅有助于理解基础化学原理,还为开发新的分子设计方法提供了数据支持。此外,QM9数据集还促进了机器学习和数据挖掘技术在化学领域的应用,推动了跨学科研究的进展。
衍生相关工作
基于QM9数据集,许多相关的经典工作得以开展。例如,研究者开发了多种机器学习模型,用于预测分子性质和优化分子设计。这些模型不仅提高了预测精度,还加速了新材料的发现过程。此外,QM9数据集还激发了大量关于分子动力学和量子化学计算方法的研究,推动了计算化学领域的发展。许多学术论文和开源工具,如QM9PACK,都是基于该数据集开发的,进一步扩展了其在科学研究中的应用范围。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

My Sexy Neighbor 🔞 Prologue Review Stats and Historical Trends

The My Sexy Neighbor 🔞 Prologue Steam review dataset lets you explore review stats, trends, and history for My Sexy Neighbor 🔞 Prologue reviews on Steam. Data is aggregated month over month going back to November 2024.

steambase.io 收录

ITS2 Database

ITS2 Database holds information about sequence, structure and taxonomic classification of all ITS2 in GenBank.

国家生物信息中心 收录

DIOR

“DIOR” 是用于光学遥感图像中对象检测的大规模基准数据集,该数据集由23,463图像和带有水平边界框注释的192,518对象实例组成。

OpenDataLab 收录

大学生运动和体质健康数据集(2014-2023)

《大学生运动与体质健康数据集(2014-2023)》涵盖了大学生群体在运动能力、基础身体形态、身体机能及身体素质等多个方面的关键基础数据。该数据集的采集时间跨度为2014年至2023年,样本采集自全国34个省级行政区域,共计123281名大学生参与,平均年龄为20.53岁。建立大学生运动和体质健康数据集可以准确把握学生体质健康的整体水平和变化趋势,了解大学生运动和体质健康状况,对指导个性化健康干预、优化体育教育资源配置、支持促进科学研究以及提高公众健康意识等均具有重要意义。

国家人口健康科学数据中心 收录

恩施州智慧停车数据集

恩施数产智慧停车平台通过统一的数据整合,为城市动态交通、道路规划、停车场规划等,提供更加科学精准的数据支撑,建立了高效、合理、动态发展的城市停车管理机制,使城市停车管理工作更加高效、科学、现代化。

长江大数据交易中心 收录