DeepFoldProtein/SCOP-1.65-New-Clu90
收藏Hugging Face2024-01-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/DeepFoldProtein/SCOP-1.65-New-Clu90
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含蛋白质结构相关的特征,如pdb_id_chain、domain_ids、domain_boundaries等,以及一个包含6245个样本的训练集。数据集主要用于蛋白质结构分析和相关研究。
该数据集包含蛋白质结构相关的特征,如pdb_id_chain、domain_ids、domain_boundaries等,以及一个包含6245个样本的训练集。数据集主要用于蛋白质结构分析和相关研究。
提供机构:
DeepFoldProtein
原始信息汇总
数据集信息
特征
- pdb_id_chain: 数据类型为字符串。
- domain_ids: 数据类型为字符串。
- domain_boundaries: 数据类型为字符串。
- ndom: 数据类型为整数(int64)。
- is_dis: 数据类型为整数(int64)。
- seq: 数据类型为字符串。
数据分割
- train: 包含6245个样本,占用1890091.3731031602字节。
数据集大小
- 下载大小: 1631897字节。
- 数据集大小: 1890091.3731031602字节。
配置
- default: 包含训练数据文件,路径为
data/train-*。



