djh992/pdbbind_complex_GB2022
收藏Hugging Face2023-02-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/djh992/pdbbind_complex_GB2022
下载链接
链接失效反馈官方服务:
资源简介:
---
tags:
- molecules
- Chemistry
- SMILES
- Protein
- Ligand
- Complexes
---
### To generate the dataset
Register for an account at https://www.pdbbind.org.cn/, confirm the validation email, then login and download
the Index files (1)
the general protein-ligand complexes (2)
the refined protein-ligand complexes (3)
Extract those files in pdbbind_complex_GB2022/data
Run the script pdbbind.py in a compute job on an MPI-enabled cluster (e.g., mpirun -n 64 pdbbind.py).
Output will be tar files in `train/`, `val/` and `test/` folders, following the split direction which is from EquiBind manuscript.
提供机构:
djh992
原始信息汇总
数据集概述
数据集标签
- 分子
- 化学
- SMILES
- 蛋白质
- 配体
- 复合物
数据集生成步骤
- 在 https://www.pdbbind.org.cn/ 注册账户并验证邮箱。
- 登录后下载以下文件:
- 索引文件 (1)
- 通用蛋白质-配体复合物 (2)
- 精细蛋白质-配体复合物 (3)
- 将下载的文件解压至
pdbbind_complex_GB2022/data目录。 - 在支持MPI的集群上运行
pdbbind.py脚本(例如:mpirun -n 64 pdbbind.py)。
输出结构
- 训练集 (
train/) - 验证集 (
val/) - 测试集 (
test/)
输出文件为tar格式,遵循EquiBind手稿中的分割指导。



