five

djh992/pdbbind_complex_GB2022

收藏
Hugging Face2023-02-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/djh992/pdbbind_complex_GB2022
下载链接
链接失效反馈
官方服务:
资源简介:
--- tags: - molecules - Chemistry - SMILES - Protein - Ligand - Complexes --- ### To generate the dataset Register for an account at https://www.pdbbind.org.cn/, confirm the validation email, then login and download the Index files (1) the general protein-ligand complexes (2) the refined protein-ligand complexes (3) Extract those files in pdbbind_complex_GB2022/data Run the script pdbbind.py in a compute job on an MPI-enabled cluster (e.g., mpirun -n 64 pdbbind.py). Output will be tar files in `train/`, `val/` and `test/` folders, following the split direction which is from EquiBind manuscript.
提供机构:
djh992
原始信息汇总

数据集概述

数据集标签

  • 分子
  • 化学
  • SMILES
  • 蛋白质
  • 配体
  • 复合物

数据集生成步骤

  1. 在 https://www.pdbbind.org.cn/ 注册账户并验证邮箱。
  2. 登录后下载以下文件:
    • 索引文件 (1)
    • 通用蛋白质-配体复合物 (2)
    • 精细蛋白质-配体复合物 (3)
  3. 将下载的文件解压至 pdbbind_complex_GB2022/data 目录。
  4. 在支持MPI的集群上运行 pdbbind.py 脚本(例如:mpirun -n 64 pdbbind.py)。

输出结构

  • 训练集 (train/)
  • 验证集 (val/)
  • 测试集 (test/)

输出文件为tar格式,遵循EquiBind手稿中的分割指导。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作