five

maomlab/AggregatorAdvisor

收藏
Hugging Face2024-10-02 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/maomlab/AggregatorAdvisor
下载链接
链接失效反馈
官方服务:
资源简介:
AggregatorAdvisor数据集用于识别在生化测定中可能聚集的分子,基于已知聚集物的化学相似性和物理性质。在默认的亲和力范围内(100 nM到10 μM),如果计算的LogP > 3且Tc ≥ 85%,则用户应将该化合物作为聚集物进行调查。如果LogP > 3或Tc > 85%,则用户应被告知这两个标准中的一个正在生效,并应运行控制实验。如果这两个条件都不满足,则报告此情况,并建议用户始终运行控制实验。训练和测试数据集是从原始数据集中经过清洗和分割后创建的。

AggregatorAdvisor数据集用于识别在生化测定中可能聚集的分子,基于已知聚集物的化学相似性和物理性质。在默认的亲和力范围内(100 nM到10 μM),如果计算的LogP > 3且Tc ≥ 85%,则用户应将该化合物作为聚集物进行调查。如果LogP > 3或Tc > 85%,则用户应被告知这两个标准中的一个正在生效,并应运行控制实验。如果这两个条件都不满足,则报告此情况,并建议用户始终运行控制实验。训练和测试数据集是从原始数据集中经过清洗和分割后创建的。
提供机构:
maomlab
原始信息汇总

AggregatorAdvisor 数据集概述

数据集简介

  • 名称: AggregatorAdvisor
  • 标签: chemistry, medicinal chemistry
  • 语言: en
  • 大小: 10K<n<100K
  • 概述: AggregatorAdvisor 数据集用于识别已知或可能聚集的分子,基于化学相似性和物理属性。数据集包含训练和测试子集,分别包含10116和2529个样本。

数据集结构

  • 配置名称: AggregatorAdvisor
  • 数据文件:
    • 训练集: AggregatorAdvisor/train.csv
    • 测试集: AggregatorAdvisor/test.csv

数据特征

  • new SMILES: 分子结构的简化分子线性输入规范,类型为字符串。
  • substance_id: 物质ID,类型为字符串。
  • aggref_index: 聚集指数,类型为整数。
  • logP: 分子的LogP值,类型为浮点数。
  • reference: 参考信息,类型为字符串。

数据集分割

  • 训练集:
    • 样本数: 10116
    • 字节数: 404768
  • 测试集:
    • 样本数: 2529
    • 字节数: 101288

引用

  • 文献: J. Med. Chem. 2015, 58, 17, 7076–7087
  • DOI: 10.1021/acs.jmedchem.5b01105
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作