SaProtHub/DMS_UBC9_HUMAN
收藏Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/SaProtHub/DMS_UBC9_HUMAN
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含人类蛋白质UBC9的单点突变及其对应的突变效应评分,这些评分来自深度突变扫描实验。数据集分为训练集(2169个样本)、验证集(265个样本)和测试集(287个样本)。标签表示基于深度突变扫描实验的每个蛋白质的突变效应评分。
This dataset contains single site mutation of protein UBC9_HUMAN and the corresponding mutation effect score from deep mutation scanning experiment. The dataset is split into training (2169 samples), validation (265 samples), and test (287 samples) sets. The label represents the mutation effect score of each protein based on deep mutation scanning experiment.
提供机构:
SaProtHub
原始信息汇总
数据集概述
基本信息
- 名称: DMS_UBC9_HUMAN
- 别名: SaProtHub/DMS_UBC9_HUMAN
- 创建者: SaprotHub
- 关键词: 1K - 10K, csv, Text, Datasets, pandas, Croissant, 🇺🇸 Region: US
- URL: https://hf-mirror.com/datasets/SaProtHub/DMS_UBC9_HUMAN
描述
该数据集包含人类蛋白质UBC9_HUMAN的单点突变及其对应的深度突变扫描实验的突变效应分数。
数据集结构
分布
-
类型: cr:FileObject
- 名称: repo
- 描述: HF Mirror git仓库。
- 内容URL: https://hf-mirror.com/datasets/SaProtHub/DMS_UBC9_HUMAN/tree/refs%2Fconvert%2Fparquet
- 编码格式: git+https
-
类型: cr:FileSet
- 名称: parquet-files-for-config-default
- 描述: 由HF Mirror转换的基础Parquet文件(参见:https://hf-mirror.com/docs/datasets-server/parquet)。
- 包含于: repo
- 编码格式: application/x-parquet
- 包含: default//.parquet
记录集
- 类型: cr:RecordSet
- 名称: default
- 描述: SaProtHub/DMS_UBC9_HUMAN - default子集
- 3个分割: train, validation, test
字段
-
类型: cr:Field
- 名称: default/Sequence
- 描述: HF Mirror parquet文件中的Sequence列。
- 数据类型: sc:Text
-
类型: cr:Field
- 名称: default/label
- 描述: HF Mirror parquet文件中的label列。
- 数据类型: sc:Float
-
类型: cr:Field
- 名称: default/stage
- 描述: HF Mirror parquet文件中的stage列。
- 数据类型: sc:Text
相关信息
-
分割:
- train: 2169
- valid: 265
- test: 287
-
标签: 标签表示基于深度突变扫描实验的每个蛋白质的突变效应分数。
-
相关论文: 该数据集来自《Deep generative models of genetic variation capture the effects of mutations》。



