five

maomlab/HematoxLong2023

收藏
Hugging Face2025-06-11 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/maomlab/HematoxLong2023
下载链接
链接失效反馈
官方服务:
资源简介:
Hematotoxicity数据集包含1772种化学物质,其中包括589个阳性分子和1183个阴性分子。这些分子根据其Murcko骨架分为1330个分子的训练集和442个分子的测试集。此外,还从相关研究和数据库中收集了610个新分子作为外部验证集。上传到Hugging Face仓库的训练和测试数据集已经过清理和分割,原始数据集包含2382个分子。

Hematotoxicity数据集包含1772种化学物质,其中包括589个阳性分子和1183个阴性分子。这些分子根据其Murcko骨架分为1330个分子的训练集和442个分子的测试集。此外,还从相关研究和数据库中收集了610个新分子作为外部验证集。上传到Hugging Face仓库的训练和测试数据集已经过清理和分割,原始数据集包含2382个分子。
提供机构:
maomlab
原始信息汇总

Hematotoxicity Dataset (HematoxLong2023)

数据集概述

  • 名称: Hematotoxicity Dataset
  • 标签: chemistry, chemical information
  • 语言: 英语
  • 许可证: MIT

数据集详情

  • 训练集: 包含1788个分子
  • 测试集: 包含594个分子
  • 数据集创建: 通过净化和分割原始数据集创建

数据集配置

  • 配置名称: HematoxLong2023
  • 数据文件:
    • 训练集路径: HematoxLong2023/train.csv
    • 测试集路径: HematoxLong2023/test.csv

数据集特征

  • 特征名称: new SMILES
    • 数据类型: string
  • 特征名称: Label
    • 数据类型: class_label
      • 类别名称:
        • 0: negative
        • 1: positive

数据集分割

  • 训练集:
    • 样本数量: 1788
    • 字节数: 28736
  • 测试集:
    • 样本数量: 594
    • 字节数: 9632

任务类别

  • 任务类型: tabular-classification

引用

@article{Long2023, author = {Teng-Zhi Long, Shao-Hua Shi, Shao Liu, Ai-Ping Lu, Zhao-Qian Liu, Min Li, Ting-Jun Hou*, and Dong-Sheng Cao}, doi = {10.1021/acs.jcim.2c01088}, journal = {Journal of Chemical Information and Modeling}, number = {1}, title = {Structural Analysis and Prediction of Hematotoxicity Using Deep Learning Approaches}, volume = {63}, year = {2023}, url = {https://pubs.acs.org/doi/10.1021/acs.jcim.2c01088}, publisher = {ACS publications} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作