zpn/pcba_686978
收藏数据集概述
基本信息
- 名称: pcba_686978
- 语言: 单语种(monolingual)
- 许可证: MIT
- 大小: 100K<n<1M
- 标签: 生物(bio)、生物化学(bio-chem)、分子网络(molnet)、分子网(molecule-net)、生物物理学(biophysics)
- 任务类别: 其他(other)
数据集描述
- 摘要:
pcba_686978是 MoleculeNet 中的一个数据集,源自 PubChem BioAssay (PCBA) 数据库,包含小分子的生物活性数据,是通过高通量筛选生成的。 - 任务与排行榜: 未提及具体任务和排行榜。
- 语言: 未提及具体语言信息。
数据集结构
- 数据实例: 包含
smiles、selfies和target三个数据字段。smiles: 分子结构的 SMILES 表示。selfies: 分子结构的 SELFIES 表示。target: 生物测定的测量结果(活性/非活性)。
- 数据分割: 数据集被随机分割为 80/10/10 的训练/验证/测试集。
数据集创建
-
来源数据: 数据最初由斯坦福大学的 Pande 小组生成。
-
许可证: 数据集最初以 MIT 许可证发布。
-
引用信息:
@misc{https://doi.org/10.48550/arxiv.1703.00564, doi = {10.48550/ARXIV.1703.00564}, url = {https://arxiv.org/abs/1703.00564}, author = {Wu, Zhenqin and Ramsundar, Bharath and Feinberg, Evan N. and Gomes, Joseph and Geniesse, Caleb and Pappu, Aneesh S. and Leswing, Karl and Pande, Vijay}, keywords = {Machine Learning (cs.LG), Chemical Physics (physics.chem-ph), Machine Learning (stat.ML), FOS: Computer and information sciences, FOS: Computer and information sciences, FOS: Physical sciences, FOS: Physical sciences}, title = {MoleculeNet: A Benchmark for Molecular Machine Learning}, publisher = {arXiv}, year = {2017}, copyright = {arXiv.org perpetual, non-exclusive license} }
-
贡献者: 感谢 @zanussbaum 添加此数据集。



