phanvancongthanh/belka-protein-hsa
收藏Hugging Face2024-04-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/phanvancongthanh/belka-protein-hsa
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含分子与蛋白质之间的绑定信息,主要特征包括分子SMILES字符串、蛋白质名称以及它们是否绑定的标记。数据集仅包含训练集,共有98415610个示例,总大小约为10GB。
该数据集包含分子与蛋白质之间的绑定信息,主要特征包括分子SMILES字符串、蛋白质名称以及它们是否绑定的标记。数据集仅包含训练集,共有98415610个示例,总大小约为10GB。
提供机构:
phanvancongthanh
原始信息汇总
数据集概述
数据集特征
- id: 数据类型为 int64。
- molecule_smiles: 数据类型为 string。
- protein_name: 数据类型为 string。
- binds: 数据类型为 int64。
数据集分割
- train:
- 数据大小: 10036728154.333334 字节
- 示例数量: 98415610
数据集大小
- 下载大小: 2108948591 字节
- 数据集总大小: 10036728154.333334 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- split: train
- data_files:



