five

scikit-fingerprints/MoleculeNet_SIDER

收藏
Hugging Face2024-07-18 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/scikit-fingerprints/MoleculeNet_SIDER
下载链接
链接失效反馈
官方服务:
资源简介:
MoleculeNet SIDER数据集是MoleculeNet基准测试的一部分,主要用于预测药物不良反应(ADRs)作为药物副作用,涉及MedDRA分类中的27个系统器官类别。所有任务都是二分类任务。数据集包含12个任务,任务类型为多任务分类,总样本数为7831个。推荐的划分方法是scaffold划分,推荐的评估指标是AUROC。数据集适用于表格分类、图机器学习和文本分类任务,标签涉及化学、生物学和医学领域。

The MoleculeNet SIDER dataset is part of the MoleculeNet benchmark, designed to predict adverse drug reactions (ADRs) as drug side effects across 27 system organ classes in the MedDRA classification. All tasks are binary classification tasks. The dataset contains 7831 samples, with a recommended scaffold split method and AUROC as the recommended metric. It covers chemistry, biology, and medical fields, suitable for tabular classification, graph machine learning, and text classification tasks.
提供机构:
scikit-fingerprints
原始信息汇总

MoleculeNet SIDER 数据集概述

基本信息

  • 数据集名称: MoleculeNet SIDER
  • 许可证: unknown
  • 任务类别:
    • 表格分类
    • 图机器学习
    • 文本分类
  • 标签:
    • 化学
    • 生物学
    • 医学
  • 数据规模: 1K<n<10K
  • 配置:
    • 配置名称: default
    • 数据文件:
      • 分割: train
      • 路径: "sider.csv"

任务描述

  • 任务: 预测不良药物反应(ADRs)作为药物副作用,涉及27个系统器官类别的MedDRA分类。
  • 任务类型: 多任务分类
  • 总样本数: 7831
  • 推荐分割: scaffold
  • 推荐度量: AUROC

参考文献

  • Han Altae-Tran et al. "Low Data Drug Discovery with One-Shot Learning" ACS Cent. Sci. 2017, 3, 4, 283–293
  • Wu, Zhenqin, et al. "MoleculeNet: a benchmark for molecular machine learning." Chemical Science 9.2 (2018): 513-530
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作