five

Pixelatory/GDB-11

收藏
Hugging Face2023-09-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Pixelatory/GDB-11
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含26,425,839个样本,这些样本是经过RDKit规范化的唯一SMILES分子,以CSV格式存储。数据集来源于Entire GDB-11,并经过了提取和规范化处理。

This dataset contains 26,425,839 samples, which are RDKit-normalized unique SMILES representations of molecules, and is stored in CSV format. It is derived from the entire GDB-11 and has undergone extraction and normalization processing.
提供机构:
Pixelatory
原始信息汇总

数据集概述

标签

  • 化学
  • 生物学

数据规模

  • 10M<n<100M

样本数量

  • 26,425,839 个样本

数据格式

  • CSV 格式

数据内容

  • 仅包含唯一的、RDKit 标准化的 SMILES 分子

数据来源

  • 原始数据来自 "Entire GDB-11" 数据集,可在 https://gdb.unibe.ch/downloads/ 下载
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作