antoinebcx/smiles-molecules-chembl
收藏Hugging Face2024-08-06 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/antoinebcx/smiles-molecules-chembl
下载链接
链接失效反馈官方服务:
资源简介:
ChEMBL是一个手动整理的生物活性分子数据库,具有药物样特性。它汇集了化学、生物活性和基因组数据,以帮助将基因组信息转化为有效的新药物。该数据集用于基于分布学习和目标导向的分子生成,目的是生成具有某些理想特性的新分子。数据集包含1,941,405个分子,其中训练集有1,358,980个,验证集有194,123个,测试集有388,302个。数据分割由Therapeutics Data Commons进行,且已移除缺失值。
ChEMBL is a manually curated database of bioactive molecules with drug-like properties. It brings together chemical, bioactivity and genomic data to aid the translation of genomic information into effective new drugs.
提供机构:
antoinebcx



