introvoyz041/SmilodonUnif
收藏Hugging Face2025-12-27 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/introvoyz041/SmilodonUnif
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: SMILES
dtype: large_string
- name: qed
dtype: float32
- name: SPS
dtype: float32
- name: MolWt
dtype: float32
- name: BalabanJ
dtype: float32
- name: TPSA
dtype: float32
- name: FractionCSP3
dtype: float32
- name: HeavyAtomCount
dtype: int32
- name: NumAromaticRings
dtype: int32
- name: NumHAcceptors
dtype: int32
- name: NumHDonors
dtype: int32
- name: NumRotatableBonds
dtype: int32
- name: RingCount
dtype: int32
- name: MolLogP
dtype: float32
- name: MolMR
dtype: float32
splits:
- name: train
num_bytes: 781759815
num_examples: 5070990
- name: val
num_bytes: 97749770
num_examples: 633873
- name: test
num_bytes: 97687825
num_examples: 633875
download_size: 513919386
dataset_size: 977197410
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: val
path: data/val-*
- split: test
path: data/test-*
---
数据集信息:
特征:
- 名称: 简化分子线性输入规范(SMILES)
数据类型: 大字符串
- 名称: 定量药物相似性评分(QED)
数据类型: float32
- 名称: SPS
数据类型: float32
- 名称: 分子量(MolWt)
数据类型: float32
- 名称: 巴拉班J指数(BalabanJ)
数据类型: float32
- 名称: 拓扑极性表面积(TPSA)
数据类型: float32
- 名称: sp3杂化碳占比(FractionCSP3)
数据类型: float32
- 名称: 重原子数(HeavyAtomCount)
数据类型: int32
- 名称: 芳香环数目(NumAromaticRings)
数据类型: int32
- 名称: 氢键受体数目(NumHAcceptors)
数据类型: int32
- 名称: 氢键供体数目(NumHDonors)
数据类型: int32
- 名称: 可旋转键数目(NumRotatableBonds)
数据类型: int32
- 名称: 环总数(RingCount)
数据类型: int32
- 名称: 辛醇-水分配系数对数(MolLogP)
数据类型: float32
- 名称: 摩尔折射率(MolMR)
数据类型: float32
数据集划分:
- 划分名称: train
字节大小: 781759815
样本数量: 5070990
- 划分名称: val
字节大小: 97749770
样本数量: 633873
- 划分名称: test
字节大小: 97687825
样本数量: 633875
下载总大小: 513919386
数据集总大小: 977197410
数据集配置:
- 配置名称: default
数据文件:
- 对应划分: train
文件路径: data/train-*
- 对应划分: val
文件路径: data/val-*
- 对应划分: test
文件路径: data/test-*
提供机构:
introvoyz041



