DeepFoldProtein/2022-12-17-pdb-intersect-pisces_pc30_r2.5_processed_1024_ankh_test
收藏Hugging Face2024-03-06 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/DeepFoldProtein/2022-12-17-pdb-intersect-pisces_pc30_r2.5_processed_1024_ankh_test
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: pdb_id
dtype: string
- name: chain_code
dtype: string
- name: seq
dtype: string
- name: sst8
dtype: string
- name: sst3
dtype: string
- name: len_x
dtype: int64
- name: has_nonstd_aa
dtype: bool
- name: len_y
dtype: int64
- name: method
dtype: string
- name: resol
dtype: float64
- name: rfac
dtype: float64
- name: freerfac
dtype: float64
- name: input_ids
sequence: int32
- name: attention_mask
sequence: int8
- name: special_tokens_mask
sequence: int8
- name: label
sequence: int64
splits:
- name: train
num_bytes: 829010
num_examples: 100
download_size: 66672
dataset_size: 829010
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
提供机构:
DeepFoldProtein
原始信息汇总
数据集信息
特征
- pdb_id: 字符串类型
- chain_code: 字符串类型
- seq: 字符串类型
- sst8: 字符串类型
- sst3: 字符串类型
- len_x: 整数类型 (int64)
- has_nonstd_aa: 布尔类型
- len_y: 整数类型 (int64)
- method: 字符串类型
- resol: 浮点数类型 (float64)
- rfac: 浮点数类型 (float64)
- freerfac: 浮点数类型 (float64)
- input_ids: 整数序列 (int32)
- attention_mask: 整数序列 (int8)
- special_tokens_mask: 整数序列 (int8)
- label: 整数序列 (int64)
数据分割
- train: 包含100个样本,占用829010字节
数据集大小
- 下载大小: 66672字节
- 数据集大小: 829010字节
配置
- default:
- 数据文件路径:
data/train-*
- 数据文件路径:



