five

chao1224/Geom3D_data

收藏
Hugging Face2023-08-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/chao1224/Geom3D_data
下载链接
链接失效反馈
官方服务:
资源简介:
# Specifications of Dataset Download in Geom3D We provide both the raw and processed data at [this HuggingFace link](https://huggingface.co/datasets/chao1224/Geom3D_data). ## PCQM4Mv2 ``` mkdir -p pcqm4mv2/raw cd pcqm4mv2/raw wget http://ogb-data.stanford.edu/data/lsc/pcqm4m-v2-train.sdf.tar.gz tar -xf pcqm4m-v2-train.sdf.tar.gz wget http://ogb-data.stanford.edu/data/lsc/pcqm4m-v2.zip unzip pcqm4m-v2.zip mv pcqm4m-v2/raw/data.csv.gz . rm pcqm4m-v2.zip rm -rf pcqm4m-v2 ``` ## GEOM ``` wget https://dataverse.harvard.edu/api/access/datafile/4327252 mv 4327252 rdkit_folder.tar.gz tar -xvf rdkit_folder.tar.gz ``` ## Molecule3D Install it following the google drive link [here](https://github.com/divelab/MoleculeX/tree/molx/Molecule3D). ## QM9 Automatically installed under folder `.QM9/raw`. ## MD17 Automatically installed under folder `./MD17`. In March 2023 (or even earlier), they updated the MD17 FTP site, and the previous datasets are missing. We may need to keep and upload a version to the website. ## rMD17 Download the dataset from [this link](https://figshare.com/articles/dataset/Revised_MD17_dataset_rMD17_/12672038?file=24013628), and put the file `12672038.zip` under `./rMD17` folder. - `unzip 12672038.zip` - `tar xjf rmd17.tar.bz2` - `mv rmd17/npz_data .` - `mv rmd17/splits .` ## COLL We use this repo: `git@github.com:TUM-DAML/gemnet_pytorch.git`. ## LBA/PDBBind ``` mkdir -p lba/raw mkdir -p lba/processed cd lba/raw # wget http://www.pdbbind.org.cn/download/pdbbind_v2015_refined_set.tar.gz # wget http://www.pdbbind.org.cn/download/pdbbind_v2018_refined.tar.gz # wget http://www.pdbbind.org.cn/download/pdbbind_v2019_refined.tar.gz # wget https://zenodo.org/record/4914718/files/LBA-split-by-sequence-identity-30-indices.tar.gz wget http://www.pdbbind.org.cn/download/PDBbind_v2020_refined.tar.gz tar -xzvf PDBbind_v2020_refined.tar.gz wget https://zenodo.org/record/4914718/files/LBA-split-by-sequence-identity-30.tar.gz tar -xzvf LBA-split-by-sequence-identity-30.tar.gz mv split-by-sequence-identity-30/indices ../processed/ mv split-by-sequence-identity-30/targets ../processed/ ``` ## LEP ``` mkdir -p lep/raw mkdir -p lep/processed cd lep/raw wget https://zenodo.org/record/4914734/files/LEP-raw.tar.gz tar -xzvf LEP-raw.tar.gz wget https://zenodo.org/record/4914734/files/LEP-split-by-protein.tar.gz tar -xzvf LEP-split-by-protein.tar.gz ``` ## MoleculeNet dataset ``` wget http://snap.stanford.edu/gnn-pretrain/data/chem_dataset.zip unzip chem_dataset.zip dataset_list=(tox21 toxcast clintox bbbp sider muv hiv bace) for dataset in "${dataset_list[@]}"; do mkdir -p molecule_datasets/"$dataset"/raw cp dataset/"$dataset"/raw/* molecule_datasets/"$dataset"/raw/ done rm -rf dataset wget -O malaria-processed.csv https://raw.githubusercontent.com/HIPS/neural-fingerprint/master/data/2015-06-03-malaria/malaria-processed.csv mkdir -p ./molecule_datasets/malaria/raw mv malaria-processed.csv ./molecule_datasets/malaria/raw/malaria.csv wget -O cep-processed.csv https://raw.githubusercontent.com/HIPS/neural-fingerprint/master/data/2015-06-02-cep-pce/cep-processed.csv mkdir -p ./molecule_datasets/cep/raw mv cep-processed.csv ./molecule_datasets/cep/raw/cep.csv ``` ## EC & FOLD Check this [link](https://github.com/phermosilla/IEConv_proteins#download-the-preprocessed-datasets). - `ProtFunct` is for task `EC` - `HomologyTAPE` is for task `FOLD` Or - `cd EC; python download.py` - `cd FOLD; python download.py` ## MatBench ``` mkdir MatBench cd MatBench wget https://figshare.com/ndownloader/files/17494820 mv 17494820 expt_is_metal.json.gz gzip -d expt_is_metal.json.gz wget https://figshare.com/ndownloader/files/17494814 mv 17494814 expt_gap.json.gz gzip -d expt_gap.json.gz wget https://figshare.com/ndownloader/files/17494637 mv 17494637 glass.json.gz gzip -d glass.json.gz wget https://figshare.com/ndownloader/articles/9755486/versions/2 mv 2 perovskites.json.gz unzip perovskites.json.gz rm perovskites.json.gz rm 17494805_perovskites.json.gz gzip -d 17494808_perovskites.json.gz mv 17494808_perovskites.json perovskites.json wget https://figshare.com/ndownloader/files/17476067 mv 17476067 dielectric.json.gz gzip -d dielectric.json.gz wget https://figshare.com/ndownloader/files/17476064 mv 17476064 log_gvrh.json.gz gzip -d log_gvrh.json.gz wget https://figshare.com/ndownloader/files/17476061 mv 17476061 log_kvrh.json.gz gzip -d log_kvrh.json.gz wget https://figshare.com/ndownloader/files/17476046 mv 17476046 jdft2d.json.gz gzip -d jdft2d.json.gz wget https://figshare.com/ndownloader/files/17476040 mv 17476040 steels.json.gz gzip -d steels.json.gz wget https://figshare.com/ndownloader/files/17476037 mv 17476037 phonons.json.gz gzip -d phonons.json.gz wget https://figshare.com/ndownloader/files/17476034 mv 17476034 mp_is_metal.json.gz gzip -d mp_is_metal.json.gz wget https://figshare.com/ndownloader/files/17476028 mv 17476028 mp_e_form.json.gz gzip -d mp_e_form.json.gz wget https://figshare.com/ndownloader/files/17084741 mv 17084741 mp_gap.json.gz gzip -d mp_gap.json.gz ``` The dataset size can match with [MatBenchmark v0.1](https://github.com/materialsproject/matbench/blob/main/matbench/matbench_v0.1_dataset_metadata.json). ## QMOF ``` mkdir QMOF cd QMOF wget https://figshare.com/ndownloader/articles/13147324/versions/13 mv 13 qmof_database_v13.zip unzip qmof_database_v13.zip unzip qmof_database.zip cd qmof_database python xyz_to_cifs.py cd ../.. ``` Or follow [this link](https://github.com/arosen93/QMOF/blob/main/benchmarks.md) for prediction on QMOF DB v13.

# Geom3D数据集下载规范 我们已在[此HuggingFace链接](https://huggingface.co/datasets/chao1224/Geom3D_data)提供原始数据与预处理后的数据。 ## PCQM4Mv2 mkdir -p pcqm4mv2/raw cd pcqm4mv2/raw wget http://ogb-data.stanford.edu/data/lsc/pcqm4m-v2-train.sdf.tar.gz tar -xf pcqm4m-v2-train.sdf.tar.gz wget http://ogb-data.stanford.edu/data/lsc/pcqm4m-v2.zip unzip pcqm4m-v2.zip mv pcqm4m-v2/raw/data.csv.gz . rm pcqm4m-v2.zip rm -rf pcqm4m-v2 ## GEOM wget https://dataverse.harvard.edu/api/access/datafile/4327252 mv 4327252 rdkit_folder.tar.gz tar -xvf rdkit_folder.tar.gz ## Molecule3D 请按照此谷歌云端硬盘链接[此处](https://github.com/divelab/MoleculeX/tree/molx/Molecule3D)进行安装。 ## QM9 将自动安装于`.QM9/raw`文件夹下。 ## MD17 将自动安装于`./MD17`文件夹下。 2023年3月(甚至更早),其MD17文件传输协议(FTP)站点完成更新,此前的数据集已无法获取。我们需留存并上传一份副本至本网站。 ## rMD17 从[此链接](https://figshare.com/articles/dataset/Revised_MD17_dataset_rMD17_/12672038?file=24013628)下载数据集,并将文件`12672038.zip`放置于`./rMD17`文件夹中: - `unzip 12672038.zip` - `tar xjf rmd17.tar.bz2` - `mv rmd17/npz_data .` - `mv rmd17/splits .` ## COLL 我们使用此仓库:`git@github.com:TUM-DAML/gemnet_pytorch.git`。 ## LBA/PDBBind mkdir -p lba/raw mkdir -p lba/processed cd lba/raw # wget http://www.pdbbind.org.cn/download/pdbbind_v2015_refined_set.tar.gz # wget http://www.pdbbind.org.cn/download/pdbbind_v2018_refined.tar.gz # wget http://www.pdbbind.org.cn/download/pdbbind_v2019_refined.tar.gz # wget https://zenodo.org/record/4914718/files/LBA-split-by-sequence-identity-30-indices.tar.gz wget http://www.pdbbind.org.cn/download/PDBbind_v2020_refined.tar.gz tar -xzvf PDBbind_v2020_refined.tar.gz wget https://zenodo.org/record/4914718/files/LBA-split-by-sequence-identity-30.tar.gz tar -xzvf LBA-split-by-sequence-identity-30.tar.gz mv split-by-sequence-identity-30/indices ../processed/ mv split-by-sequence-identity-30/targets ../processed/ ## LEP mkdir -p lep/raw mkdir -p lep/processed cd lep/raw wget https://zenodo.org/record/4914734/files/LEP-raw.tar.gz tar -xzvf LEP-raw.tar.gz wget https://zenodo.org/record/4914734/files/LEP-split-by-protein.tar.gz tar -xzvf LEP-split-by-protein.tar.gz ## MoleculeNet数据集 wget http://snap.stanford.edu/gnn-pretrain/data/chem_dataset.zip unzip chem_dataset.zip dataset_list=(tox21 toxcast clintox bbbp sider muv hiv bace) for dataset in "${dataset_list[@]}"; do mkdir -p molecule_datasets/"$dataset"/raw cp dataset/"$dataset"/raw/* molecule_datasets/"$dataset"/raw/ done rm -rf dataset wget -O malaria-processed.csv https://raw.githubusercontent.com/HIPS/neural-fingerprint/master/data/2015-06-03-malaria/malaria-processed.csv mkdir -p ./molecule_datasets/malaria/raw mv malaria-processed.csv ./molecule_datasets/malaria/raw/malaria.csv wget -O cep-processed.csv https://raw.githubusercontent.com/HIPS/neural-fingerprint/master/data/2015-06-02-cep-pce/cep-processed.csv mkdir -p ./molecule_datasets/cep/raw mv cep-processed.csv ./molecule_datasets/cep/raw/cep.csv ## EC & FOLD 请查看此[链接](https://github.com/phermosilla/IEConv_proteins#download-the-preprocessed-datasets)。 - `ProtFunct`对应任务`EC` - `HomologyTAPE`对应任务`FOLD` 或执行以下命令: - `cd EC; python download.py` - `cd FOLD; python download.py` ## MatBench mkdir MatBench cd MatBench wget https://figshare.com/ndownloader/files/17494820 mv 17494820 expt_is_metal.json.gz gzip -d expt_is_metal.json.gz wget https://figshare.com/ndownloader/files/17494814 mv 17494814 expt_gap.json.gz gzip -d expt_gap.json.gz wget https://figshare.com/ndownloader/files/17494637 mv 17494637 glass.json.gz gzip -d glass.json.gz wget https://figshare.com/ndownloader/articles/9755486/versions/2 mv 2 perovskites.json.gz unzip perovskites.json.gz rm perovskites.json.gz rm 17494805_perovskites.json.gz gzip -d 17494808_perovskites.json.gz mv 17494808_perovskites.json perovskites.json wget https://figshare.com/ndownloader/files/17476067 mv 17476067 dielectric.json.gz gzip -d dielectric.json.gz wget https://figshare.com/ndownloader/files/17476064 mv 17476064 log_gvrh.json.gz gzip -d log_gvrh.json.gz wget https://figshare.com/ndownloader/files/17476061 mv 17476061 log_kvrh.json.gz gzip -d log_kvrh.json.gz wget https://figshare.com/ndownloader/files/17476046 mv 17476046 jdft2d.json.gz gzip -d jdft2d.json.gz wget https://figshare.com/ndownloader/files/17476040 mv 17476040 steels.json.gz gzip -d steels.json.gz wget https://figshare.com/ndownloader/files/17476037 mv 17476037 phonons.json.gz gzip -d phonons.json.gz wget https://figshare.com/ndownloader/files/17476034 mv 17476034 mp_is_metal.json.gz gzip -d mp_is_metal.json.gz wget https://figshare.com/ndownloader/files/17476028 mv 17476028 mp_e_form.json.gz gzip -d mp_e_form.json.gz wget https://figshare.com/ndownloader/files/17084741 mv 17084741 mp_gap.json.gz gzip -d mp_gap.json.gz 该数据集规模可与[MatBenchmark v0.1](https://github.com/materialsproject/matbench/blob/main/matbench/matbench_v0.1_dataset_metadata.json)相匹配。 ## QMOF mkdir QMOF cd QMOF wget https://figshare.com/ndownloader/articles/13147324/versions/13 mv 13 qmof_database_v13.zip unzip qmof_database_v13.zip unzip qmof_database.zip cd qmof_database python xyz_to_cifs.py cd ../.. 或按照[此链接](https://github.com/arosen93/QMOF/blob/main/benchmarks.md)的说明对QMOF数据库v13开展预测任务。
提供机构:
chao1224
原始信息汇总

数据集下载指南

PCQM4Mv2

  • 数据下载命令:

    mkdir -p pcqm4mv2/raw cd pcqm4mv2/raw wget http://ogb-data.stanford.edu/data/lsc/pcqm4m-v2-train.sdf.tar.gz tar -xf pcqm4m-v2-train.sdf.tar.gz wget http://ogb-data.stanford.edu/data/lsc/pcqm4m-v2.zip unzip pcqm4m-v2.zip mv pcqm4m-v2/raw/data.csv.gz . rm pcqm4m-v2.zip rm -rf pcqm4m-v2

GEOM

  • 数据下载命令:

    wget https://dataverse.harvard.edu/api/access/datafile/4327252 mv 4327252 rdkit_folder.tar.gz tar -xvf rdkit_folder.tar.gz

Molecule3D

QM9

  • 自动安装位置:.QM9/raw

MD17

  • 自动安装位置:./MD17

rMD17

  • 数据下载命令:

    wget https://figshare.com/articles/dataset/Revised_MD17_dataset_rMD17_/12672038?file=24013628 mv 12672038.zip ./rMD17 unzip 12672038.zip tar xjf rmd17.tar.bz2 mv rmd17/npz_data . mv rmd17/splits .

COLL

  • 使用仓库:git@github.com:TUM-DAML/gemnet_pytorch.git

LBA/PDBBind

  • 数据下载命令:

    mkdir -p lba/raw cd lba/raw wget http://www.pdbbind.org.cn/download/PDBbind_v2020_refined.tar.gz tar -xzvf PDBbind_v2020_refined.tar.gz wget https://zenodo.org/record/4914718/files/LBA-split-by-sequence-identity-30.tar.gz tar -xzvf LBA-split-by-sequence-identity-30.tar.gz mv split-by-sequence-identity-30/indices ../processed/ mv split-by-sequence-identity-30/targets ../processed/

LEP

  • 数据下载命令:

    mkdir -p lep/raw cd lep/raw wget https://zenodo.org/record/4914734/files/LEP-raw.tar.gz tar -xzvf LEP-raw.tar.gz wget https://zenodo.org/record/4914734/files/LEP-split-by-protein.tar.gz tar -xzvf LEP-split-by-protein.tar.gz

MoleculeNet dataset

  • 数据下载命令:

    wget http://snap.stanford.edu/gnn-pretrain/data/chem_dataset.zip unzip chem_dataset.zip dataset_list=(tox21 toxcast clintox bbbp sider muv hiv bace) for dataset in "${dataset_list[@]}"; do mkdir -p molecule_datasets/"$dataset"/raw cp dataset/"$dataset"/raw/* molecule_datasets/"$dataset"/raw/ done rm -rf dataset wget -O malaria-processed.csv https://raw.githubusercontent.com/HIPS/neural-fingerprint/master/data/2015-06-03-malaria/malaria-processed.csv mkdir -p ./molecule_datasets/malaria/raw mv malaria-processed.csv ./molecule_datasets/malaria/raw/malaria.csv wget -O cep-processed.csv https://raw.githubusercontent.com/HIPS/neural-fingerprint/master/data/2015-06-02-cep-pce/cep-processed.csv mkdir -p ./molecule_datasets/cep/raw mv cep-processed.csv ./molecule_datasets/cep/raw/cep.csv

EC & FOLD

MatBench

  • 数据下载命令:

    mkdir MatBench cd MatBench wget https://figshare.com/ndownloader/files/17494820 mv 17494820 expt_is_metal.json.gz gzip -d expt_is_metal.json.gz wget https://figshare.com/ndownloader/files/17494814 mv 17494814 expt_gap.json.gz gzip -d expt_gap.json.gz wget https://figshare.com/ndownloader/files/17494637 mv 17494637 glass.json.gz gzip -d glass.json.gz wget https://figshare.com/ndownloader/articles/9755486/versions/2 mv 2 perovskites.json.gz unzip perovskites.json.gz rm perovskites.json.gz rm 17494805_perovskites.json.gz gzip -d 17494808_perovskites.json.gz mv 17494808_perovskites.json perovskites.json wget https://figshare.com/ndownloader/files/17476067 mv 17476067 dielectric.json.gz gzip -d dielectric.json.gz wget https://figshare.com/ndownloader/files/17476064 mv 17476064 log_gvrh.json.gz gzip -d log_gvrh.json.gz wget https://figshare.com/ndownloader/files/17476061 mv 17476061 log_kvrh.json.gz gzip -d log_kvrh.json.gz wget https://figshare.com/ndownloader/files/17476046 mv 17476046 jdft2d.json.gz gzip -d jdft2d.json.gz wget https://figshare.com/ndownloader/files/17476040 mv 17476040 steels.json.gz gzip -d steels.json.gz wget https://figshare.com/ndownloader/files/17476037 mv 17476037 phonons.json.gz gzip -d phonons.json.gz wget https://figshare.com/ndownloader/files/17476034 mv 17476034 mp_is_metal.json.gz gzip -d mp_is_metal.json.gz wget https://figshare.com/ndownloader/files/17476028 mv 17476028 mp_e_form.json.gz gzip -d mp_e_form.json.gz wget https://figshare.com/ndownloader/files/17084741 mv 17084741 mp_gap.json.gz gzip -d mp_gap.json.gz

QMOF

  • 数据下载命令:

    mkdir QMOF cd QMOF wget https://figshare.com/ndownloader/articles/13147324/versions/13 mv 13 qmof_database_v13.zip unzip qmof_database_v13.zip unzip qmof_database.zip cd qmof_database python xyz_to_cifs.py cd ../..

  • 预测指南:链接

搜集汇总
数据集介绍
main_image_url
构建方式
在计算化学与材料科学领域,高质量的数据集是推动模型发展的基石。Geom3D_data通过整合多个权威子数据集构建而成,其构建过程体现了系统性与严谨性。具体而言,该数据集汇集了PCQM4Mv2、GEOM、Molecule3D、QM9、MD17、rMD17、COLL、LBA/PDBBind、LEP、MoleculeNet、EC & FOLD、MatBench以及QMOF等子集,覆盖了从分子性质预测到蛋白质结构分析,再到材料性能评估的广泛任务。每个子集均从官方或公认的数据源获取,例如通过wget命令从斯坦福大学、哈佛大学Dataverse、Figshare等平台下载原始文件,并遵循各子集特定的预处理流程进行整理,确保了数据来源的可靠性与一致性。
特点
该数据集的核心特征在于其跨尺度与多任务的综合性。它不仅涵盖了小分子量子化学性质、分子构象、分子动力学轨迹等微观尺度数据,还包含了蛋白质-配体结合亲和力、酶功能分类、材料晶体结构及性能预测等介观与宏观尺度信息。这种多层次的数据结构为开发统一的几何深度学习模型提供了丰富而多样的训练与验证场景。数据格式多样,包括SDF文件、CSV表格、NPZ压缩数组以及CIF晶体结构文件等,适配不同算法的输入需求。部分子集如MatBench和QMOF直接关联材料发现的实际应用,凸显了数据集的前沿性与实用性。
使用方法
为有效利用该数据集,用户需遵循其模块化的获取与准备流程。数据集以分目录形式组织,每个子集独立存放于相应文件夹中。使用前,需根据README提供的具体命令行指令,逐步下载并解压各子集的原始或预处理数据。例如,对于PCQM4Mv2,需依次下载并解压`.sdf.tar.gz`和`.zip`文件;对于蛋白质相关数据如LBA,则需获取PDBbind精炼集并匹配特定的序列身份划分索引。部分数据集如QM9、MD17可自动安装,而MatBench等则需手动下载并解压JSON格式文件。完成数据准备后,用户可根据研究目标,直接引用相应子集的路径进行模型训练、测试或基准评估,实现从分子到材料的跨领域机器学习任务。
背景与挑战
背景概述
在计算化学与材料科学领域,三维几何结构数据的整合与分析对于推动分子性质预测、药物发现及材料设计至关重要。chao1224/Geom3D_data数据集由研究人员于近年构建,旨在汇集多个权威子数据集如PCQM4Mv2、GEOM、QM9及MatBench等,形成一个统一且易于访问的三维几何数据资源库。该数据集的核心研究问题聚焦于为机器学习模型提供高质量、多任务的分子与材料结构数据,以支持性质预测、构象生成及蛋白质-配体相互作用等复杂任务。通过整合来自斯坦福大学、哈佛大学等机构的开放数据,该资源显著降低了领域内数据获取与预处理的壁垒,为几何深度学习与科学计算交叉研究提供了坚实基础。
当前挑战
该数据集致力于解决分子与材料三维几何结构的多任务学习挑战,涵盖性质回归、分类及构象生成等复杂问题。构建过程中面临多重困难:其一,数据来源异构且格式多样,如SDF、CSV及JSON等,需进行繁琐的标准化与清洗以确保一致性;其二,部分子数据集如MD17因原始数据源更新而出现缺失,需额外维护与备份以保障可复现性;其三,大规模数据如GEOM与QMOF的存储与分发涉及庞大文件传输,对网络带宽与本地处理能力提出较高要求。此外,数据集的持续更新与跨平台兼容性亦需投入大量工程化努力。
常用场景
经典使用场景
在计算化学与材料科学领域,Geom3D_data数据集为研究者提供了统一且标准化的分子与材料三维结构数据平台。其经典使用场景集中于分子性质预测任务,例如通过量子化学计算数据(如QM9、PCQM4Mv2)训练图神经网络模型,以精确估算分子的电子能隙、极化率等量子力学属性。该数据集整合了从有机小分子到蛋白质复合体的多尺度结构信息,使得模型能够在统一框架下学习原子间相互作用与空间构效关系,为高通量虚拟筛选与理性设计奠定基础。
实际应用
在实际应用层面,Geom3D_data为药物发现与材料研发提供了关键数据支撑。基于该数据集训练的模型可加速候选药物的结合位点识别与毒性评估(如MoleculeNet中的毒性数据集),同时助力新型功能材料(如钙钛矿、金属有机框架)的能带结构与力学性能预测。在工业界,此类数据驱动方法能够显著降低实验试错成本,实现从分子设计到性能验证的闭环优化,为绿色能源、生物医药等领域的创新提供可靠的计算工具。
衍生相关工作
围绕Geom3D_data衍生的经典研究工作丰富多样,涵盖了图神经网络架构的革新与跨领域基准测试的建立。例如,基于PCQM4Mv2数据开发的分子图表示学习模型(如Graphormer)在量子性质预测任务中取得突破;而结合LBA/PDBBind数据的空间几何感知网络(如IEConv)则提升了蛋白质-配体相互作用的建模精度。此外,MatBench子集催生了众多材料机器学习框架的对比研究,推动了标准化评估协议在计算材料学中的普及与发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作