MOSES (Molecular sets (MOSES))
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/MOSES
下载链接
链接失效反馈官方服务:
资源简介:
我们提出了一个从 ZINC 数据库中提炼出来的基准数据集。_x000D_
_x000D_
该套装基于 ZINC Clean Leads 系列。它总共包含 4,591,276 个分子,按分子量在 250 到 350 道尔顿范围内过滤,可旋转键数不大于 7,XlogP 小于或等于 3.5。我们去除了含有带电原子或除 C、N、S、O、F、Cl、Br、H 或超过 8 个原子的循环之外的原子的分子。分子通过药物化学过滤器 (MCF) 和 PAINS 过滤器过滤。_x000D_
_x000D_
该数据集包含 1,936,962 个分子结构。对于实验,我们将数据集分成训练、测试和支架测试集,分别包含大约 1.6M、176k 和 176k 分子。脚手架测试集包含训练和测试集中不存在的独特 Bemis-Murcko 脚手架。我们使用这组来评估模型生成以前未观察到的支架的能力。
提供机构:
OpenDataLab
创建时间:
2022-06-28



