graphs-datasets/MD17-benzene
收藏Hugging Face2023-02-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/graphs-datasets/MD17-benzene
下载链接
链接失效反馈官方服务:
资源简介:
benzene数据集是一个分子动力学(MD)数据集,包含使用PBE+vdW-TS电子结构方法计算的总能量和力标签。所有几何结构以埃为单位,能量和力分别以kcal/mol和kcal/mol/A为单位。数据集的主要任务是用于有机分子属性预测,具体是一个回归任务,评分标准是能量预测的平均绝对误差(以meV为单位)。数据集包含527983个图,平均每个图有12个节点和129.88条边。每个图的数据字段包括节点特征、边索引、边属性和标签。数据集未进行分割,建议使用交叉验证。
The benzene dataset is a molecular dynamics (MD) dataset containing total energy and force labels calculated via the PBE+vdW-TS electronic structure method. All geometric structures are provided in angstroms, with energy and force values using units of kcal/mol and kcal/mol/Å respectively. The core task of this dataset is organic molecular property prediction, specifically a regression task, with the evaluation metric being the mean absolute error (in meV) of energy predictions. The dataset consists of 527,983 graphs, with an average of 12 nodes and 129.88 edges per graph. Each graph includes data fields such as node features, edge indices, edge attributes, and labels. This dataset has not been pre-split, and cross-validation is recommended for model training and evaluation.
提供机构:
graphs-datasets
原始信息汇总
数据集概述
数据集名称
benzene
数据集类型
分子动力学(MD)数据集
数据集描述
- 数据集总结:该数据集包含使用PBE+vdW-TS电子结构方法计算的总能量和力标签。所有几何数据以埃为单位,能量和力分别以kcal/mol和kcal/mol/A为单位。
- 支持的任务和排行榜:适用于有机分子属性预测,具体为回归任务,预测单一属性。评分标准为能量预测的平均绝对误差(以meV为单位)。
数据集结构
- 数据属性:
- 规模:大
- 图数量:527983
- 平均节点数:12.0
- 平均边数:129.8848866632322
- 数据字段:
node_feat:节点特征列表edge_index:边索引列表edge_attr:边特征列表y:标签数量列表num_nodes:图的节点数量
- 数据分割:数据未分割,建议使用交叉验证。
附加信息
- 许可证信息:数据集发布于未知许可证下。
- 引用信息:
- 引用文献1:TUDataset: A collection of benchmark datasets for learning with graphs, ICML 2020 Workshop on Graph Representation Learning and Beyond (GRL+ 2020)
- 引用文献2:Machine learning of accurate energy-conserving molecular force fields, Science Advances
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



