DeepFoldProtein/ss_disorder_rsa_processed
收藏Hugging Face2024-04-29 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/DeepFoldProtein/ss_disorder_rsa_processed
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: code
dtype: string
- name: sequence
dtype: string
- name: ss3
dtype: string
- name: ss8
dtype: string
- name: disorder
dtype: string
- name: rsa
dtype: string
- name: (omg phi psi)
dtype: string
- name: input_ids
sequence: int32
- name: attention_mask
sequence: int8
- name: special_tokens_mask
sequence: int8
- name: ss8_label
sequence: int64
- name: rsa_label
sequence: float64
- name: rsa_loss_mask
sequence: int64
splits:
- name: train
num_bytes: 1647741850
num_examples: 35539
download_size: 244062307
dataset_size: 1647741850
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
提供机构:
DeepFoldProtein
原始信息汇总
数据集概述
数据集特征
- code: 数据类型 - string
- sequence: 数据类型 - string
- ss3: 数据类型 - string
- ss8: 数据类型 - string
- disorder: 数据类型 - string
- rsa: 数据类型 - string
- (omg phi psi): 数据类型 - string
- input_ids: 数据类型 - int32, 序列类型
- attention_mask: 数据类型 - int8, 序列类型
- special_tokens_mask: 数据类型 - int8, 序列类型
- ss8_label: 数据类型 - int64, 序列类型
- rsa_label: 数据类型 - float64, 序列类型
- rsa_loss_mask: 数据类型 - int64, 序列类型
数据集分割
- train:
- 数据量: 1647741850 字节
- 示例数量: 35539
数据集大小
- 下载大小: 244062307 字节
- 数据集大小: 1647741850 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*



