five

introvoyz041/SmilodonUnif

收藏
Hugging Face2025-12-27 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/introvoyz041/SmilodonUnif
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: SMILES dtype: large_string - name: qed dtype: float32 - name: SPS dtype: float32 - name: MolWt dtype: float32 - name: BalabanJ dtype: float32 - name: TPSA dtype: float32 - name: FractionCSP3 dtype: float32 - name: HeavyAtomCount dtype: int32 - name: NumAromaticRings dtype: int32 - name: NumHAcceptors dtype: int32 - name: NumHDonors dtype: int32 - name: NumRotatableBonds dtype: int32 - name: RingCount dtype: int32 - name: MolLogP dtype: float32 - name: MolMR dtype: float32 splits: - name: train num_bytes: 781759815 num_examples: 5070990 - name: val num_bytes: 97749770 num_examples: 633873 - name: test num_bytes: 97687825 num_examples: 633875 download_size: 513919386 dataset_size: 977197410 configs: - config_name: default data_files: - split: train path: data/train-* - split: val path: data/val-* - split: test path: data/test-* ---

数据集信息: 特征: - 名称: 简化分子线性输入规范(SMILES) 数据类型: 大字符串 - 名称: 定量药物相似性评分(QED) 数据类型: float32 - 名称: SPS 数据类型: float32 - 名称: 分子量(MolWt) 数据类型: float32 - 名称: 巴拉班J指数(BalabanJ) 数据类型: float32 - 名称: 拓扑极性表面积(TPSA) 数据类型: float32 - 名称: sp3杂化碳占比(FractionCSP3) 数据类型: float32 - 名称: 重原子数(HeavyAtomCount) 数据类型: int32 - 名称: 芳香环数目(NumAromaticRings) 数据类型: int32 - 名称: 氢键受体数目(NumHAcceptors) 数据类型: int32 - 名称: 氢键供体数目(NumHDonors) 数据类型: int32 - 名称: 可旋转键数目(NumRotatableBonds) 数据类型: int32 - 名称: 环总数(RingCount) 数据类型: int32 - 名称: 辛醇-水分配系数对数(MolLogP) 数据类型: float32 - 名称: 摩尔折射率(MolMR) 数据类型: float32 数据集划分: - 划分名称: train 字节大小: 781759815 样本数量: 5070990 - 划分名称: val 字节大小: 97749770 样本数量: 633873 - 划分名称: test 字节大小: 97687825 样本数量: 633875 下载总大小: 513919386 数据集总大小: 977197410 数据集配置: - 配置名称: default 数据文件: - 对应划分: train 文件路径: data/train-* - 对应划分: val 文件路径: data/val-* - 对应划分: test 文件路径: data/test-*
提供机构:
introvoyz041
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作