maomlab/HematoxLong2023
收藏Hugging Face2025-06-11 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/maomlab/HematoxLong2023
下载链接
链接失效反馈官方服务:
资源简介:
Hematotoxicity数据集包含1772种化学物质,其中包括589个阳性分子和1183个阴性分子。这些分子根据其Murcko骨架分为1330个分子的训练集和442个分子的测试集。此外,还从相关研究和数据库中收集了610个新分子作为外部验证集。上传到Hugging Face仓库的训练和测试数据集已经过清理和分割,原始数据集包含2382个分子。
Hematotoxicity数据集包含1772种化学物质,其中包括589个阳性分子和1183个阴性分子。这些分子根据其Murcko骨架分为1330个分子的训练集和442个分子的测试集。此外,还从相关研究和数据库中收集了610个新分子作为外部验证集。上传到Hugging Face仓库的训练和测试数据集已经过清理和分割,原始数据集包含2382个分子。
提供机构:
maomlab
原始信息汇总
Hematotoxicity Dataset (HematoxLong2023)
数据集概述
- 名称: Hematotoxicity Dataset
- 标签: chemistry, chemical information
- 语言: 英语
- 许可证: MIT
数据集详情
- 训练集: 包含1788个分子
- 测试集: 包含594个分子
- 数据集创建: 通过净化和分割原始数据集创建
数据集配置
- 配置名称: HematoxLong2023
- 数据文件:
- 训练集路径: HematoxLong2023/train.csv
- 测试集路径: HematoxLong2023/test.csv
数据集特征
- 特征名称: new SMILES
- 数据类型: string
- 特征名称: Label
- 数据类型: class_label
- 类别名称:
- 0: negative
- 1: positive
- 类别名称:
- 数据类型: class_label
数据集分割
- 训练集:
- 样本数量: 1788
- 字节数: 28736
- 测试集:
- 样本数量: 594
- 字节数: 9632
任务类别
- 任务类型: tabular-classification
引用
@article{Long2023, author = {Teng-Zhi Long, Shao-Hua Shi, Shao Liu, Ai-Ping Lu, Zhao-Qian Liu, Min Li, Ting-Jun Hou*, and Dong-Sheng Cao}, doi = {10.1021/acs.jcim.2c01088}, journal = {Journal of Chemical Information and Modeling}, number = {1}, title = {Structural Analysis and Prediction of Hematotoxicity Using Deep Learning Approaches}, volume = {63}, year = {2023}, url = {https://pubs.acs.org/doi/10.1021/acs.jcim.2c01088}, publisher = {ACS publications} }



