Pixelatory/GDB-11
收藏Hugging Face2023-09-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Pixelatory/GDB-11
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含26,425,839个样本,这些样本是经过RDKit规范化的唯一SMILES分子,以CSV格式存储。数据集来源于Entire GDB-11,并经过了提取和规范化处理。
This dataset contains 26,425,839 samples, which are RDKit-normalized unique SMILES representations of molecules, and is stored in CSV format. It is derived from the entire GDB-11 and has undergone extraction and normalization processing.
提供机构:
Pixelatory
原始信息汇总
数据集概述
标签
- 化学
- 生物学
数据规模
- 10M<n<100M
样本数量
- 26,425,839 个样本
数据格式
- CSV 格式
数据内容
- 仅包含唯一的、RDKit 标准化的 SMILES 分子
数据来源
- 原始数据来自 "Entire GDB-11" 数据集,可在 https://gdb.unibe.ch/downloads/ 下载



