maomlab/AggregatorAdvisor
收藏Hugging Face2024-10-02 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/maomlab/AggregatorAdvisor
下载链接
链接失效反馈官方服务:
资源简介:
AggregatorAdvisor数据集用于识别在生化测定中可能聚集的分子,基于已知聚集物的化学相似性和物理性质。在默认的亲和力范围内(100 nM到10 μM),如果计算的LogP > 3且Tc ≥ 85%,则用户应将该化合物作为聚集物进行调查。如果LogP > 3或Tc > 85%,则用户应被告知这两个标准中的一个正在生效,并应运行控制实验。如果这两个条件都不满足,则报告此情况,并建议用户始终运行控制实验。训练和测试数据集是从原始数据集中经过清洗和分割后创建的。
AggregatorAdvisor数据集用于识别在生化测定中可能聚集的分子,基于已知聚集物的化学相似性和物理性质。在默认的亲和力范围内(100 nM到10 μM),如果计算的LogP > 3且Tc ≥ 85%,则用户应将该化合物作为聚集物进行调查。如果LogP > 3或Tc > 85%,则用户应被告知这两个标准中的一个正在生效,并应运行控制实验。如果这两个条件都不满足,则报告此情况,并建议用户始终运行控制实验。训练和测试数据集是从原始数据集中经过清洗和分割后创建的。
提供机构:
maomlab
原始信息汇总
AggregatorAdvisor 数据集概述
数据集简介
- 名称: AggregatorAdvisor
- 标签: chemistry, medicinal chemistry
- 语言: en
- 大小: 10K<n<100K
- 概述: AggregatorAdvisor 数据集用于识别已知或可能聚集的分子,基于化学相似性和物理属性。数据集包含训练和测试子集,分别包含10116和2529个样本。
数据集结构
- 配置名称: AggregatorAdvisor
- 数据文件:
- 训练集: AggregatorAdvisor/train.csv
- 测试集: AggregatorAdvisor/test.csv
数据特征
- new SMILES: 分子结构的简化分子线性输入规范,类型为字符串。
- substance_id: 物质ID,类型为字符串。
- aggref_index: 聚集指数,类型为整数。
- logP: 分子的LogP值,类型为浮点数。
- reference: 参考信息,类型为字符串。
数据集分割
- 训练集:
- 样本数: 10116
- 字节数: 404768
- 测试集:
- 样本数: 2529
- 字节数: 101288
引用
- 文献: J. Med. Chem. 2015, 58, 17, 7076–7087
- DOI: 10.1021/acs.jmedchem.5b01105



