five

graphs-datasets/MD17-malonaldehyde

收藏
Hugging Face2023-02-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/graphs-datasets/MD17-malonaldehyde
下载链接
链接失效反馈
官方服务:
资源简介:
malonaldehyde数据集是一个分子动力学(MD)数据集,包含使用PBE+vdW-TS电子结构方法计算的总能量和力标签。所有几何结构以埃为单位,能量和力分别以kcal/mol和kcal/mol/A为单位。数据集包含893237个图,平均每个图有9个节点和72条边。每个图的数据包括节点特征、边索引、边属性和标签等信息。数据集未进行分割,建议使用交叉验证。

The Malonaldehyde dataset is a molecular dynamics (MD) dataset containing total energy and force labels calculated using the PBE+vdW-TS electronic structure method. All geometric structures are given in units of angstroms (Å), while energy and force are measured in units of kcal/mol and kcal/mol/Å, respectively. The dataset consists of 893,237 graphs, with an average of 9 nodes and 72 edges per graph. The data for each graph includes node features, edge indices, edge attributes, labels, and other related information. The dataset has not been split, and cross-validation is recommended.
提供机构:
graphs-datasets
原始信息汇总

数据集概述

数据集名称

malonaldehyde

数据集类型

分子动力学(MD)数据集

数据集描述

  • 数据集总结:该数据集包含使用PBE+vdW-TS电子结构方法计算的总能量和力标签。所有几何数据以埃为单位,能量和力分别以kcal/mol和kcal/mol/A为单位。
  • 支持的任务和排行榜:适用于有机分子属性预测,具体为回归任务,预测单一属性。评分标准为能量预测的平均绝对误差(以meV为单位)。

数据集结构

  • 数据属性
    • 规模:大
    • 图数量:893237
    • 平均节点数:9.0
    • 平均边数:71.99990148202383
  • 数据字段
    • node_feat:节点特征列表
    • edge_index:边索引列表
    • edge_attr:边特征列表
    • y:标签列表
    • num_nodes:节点数量
  • 数据分割:数据未分割,建议使用交叉验证。

外部使用

  • PyGeometric:可通过PyGeometric加载数据集,具体代码示例见README文件。

附加信息

  • 许可信息:数据集许可未知。
  • 引用信息:引用信息详见README文件中的参考文献。

贡献

  • 贡献信息未在README文件中明确提及。
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建基于分子动力学(MD)模拟,采用PBE+vdW-TS电子结构方法计算了每个数据集中的总能量和力标签。数据集包含了893237个图,平均每个图有9个节点和72条边,所有的几何结构均以埃为单位,能量和力的单位分别为千卡/摩尔和千卡/摩尔/埃。
使用方法
在使用该数据集时,用户可以通过PyGeometric库加载数据,数据以列表形式存储,每个列表项代表一个图,其中包含了节点特征、边索引、边属性、标签和节点数量等信息。用户需自行对数据进行分割,以适应不同的训练和验证需求。
背景与挑战
背景概述
MD17-malonaldehyde数据集是一个分子动力学(MD)领域的珍贵资源,旨在为有机分子属性预测提供支持。该数据集由Christopher Morris等研究人员于2020年整理并发布,其数据来源于PBE+vdW-TS电子结构方法的计算,包含了893237个图结构,每个图结构的几何参数以埃为单位,能量和力标签则以每摩尔千卡为单位。MD17-malonaldehyde数据集为有机分子性质预测这一回归任务提供了实验基础,并在相关研究领域产生了显著影响,被广泛应用于机器学习模型的训练与评估中。
当前挑战
尽管MD17-malonaldehyde数据集在分子动力学领域具有重要价值,但在使用过程中也面临诸多挑战。首先,数据集未提供明确的版权信息,给数据的使用和分发带来了一定限制。其次,数据集未预先划分训练集、验证集和测试集,用户需自行进行交叉验证,这增加了数据处理的复杂性。此外,数据集在构建过程中,如何确保电子结构方法计算得到的能量和力的准确性,以及如何平衡大数据量与计算资源之间的关系,也是需要克服的难题。
常用场景
经典使用场景
在分子动力学模拟领域,MD17-malonaldehyde数据集以其丰富的分子结构和能量数据,成为有机分子属性预测的基准。此数据集通常用于训练机器学习模型,以预测分子的总能量和力,为理解分子间相互作用提供数据支撑。
解决学术问题
MD17-malonaldehyde数据集解决了学术研究中分子能量预测的准确性问题,通过提供大规模的分子结构和相应的能量标签,使得研究者能够开发并验证新的机器学习模型,从而提高能量预测的精度,推动化学信息学和分子模拟领域的发展。
实际应用
实际应用中,MD17-malonaldehyde数据集的应用范围广泛,可用于药物设计、新材料开发等领域,通过预测分子的能量和力,有助于科学家更高效地筛选出具有特定属性的分子,加速实验过程,降低研发成本。
数据集最近研究
最新研究方向
在分子动力学模拟领域,`graphs-datasets/MD17-malonaldehyde`数据集因其丰富的分子结构与能量数据,正成为研究焦点。该数据集支持有机分子性质预测,其研究方向的进展主要体现在利用图机器学习技术进行能量预测,旨在降低分子模拟中的计算成本。通过均绝对误差评估,此数据集为科研人员提供了评估和优化分子力场模型的宝贵资源,对于药物设计、材料科学等领域的深入研究具有重要意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作