SaProtHub/DMS_YAP1_HUMAN
收藏数据集概述
数据集基本信息
- 名称: DMS_YAP1_HUMAN
- 别名: SaProtHub/DMS_YAP1_HUMAN
- 创建者: SaprotHub
- 关键词: < 1K, csv, Text, Datasets, pandas, Croissant, 🇺🇸 Region: US
- URL: https://hf-mirror.com/datasets/SaProtHub/DMS_YAP1_HUMAN
数据集描述
该数据集包含蛋白质DMS_YAP1_HUMAN氨基酸序列的单点突变及其对应的深度突变扫描实验的突变效应评分。
数据集分割
- 训练集: 291
- 验证集: 35
- 测试集: 36
相关论文
数据集来自“Deep generative models of genetic variation capture the effects of mutations”。
标签
标签表示基于深度突变扫描的每个突变氨基酸序列的适应性评分。详细描述请参见数据集页面:https://hf-mirror.com/datasets/SaProtHub/DMS_YAP1_HUMAN。
数据分布
-
类型: cr:FileObject
-
名称: repo
-
描述: HF Mirror git仓库。
-
内容URL: https://hf-mirror.com/datasets/SaProtHub/DMS_YAP1_HUMAN/tree/refs%2Fconvert%2Fparquet
-
编码格式: git+https
-
类型: cr:FileSet
-
名称: parquet-files-for-config-default
-
描述: 由HF Mirror转换的基础Parquet文件(参见:https://hf-mirror.com/docs/datasets-server/parquet)。
-
包含于: repo
-
编码格式: application/x-parquet
-
包含: default//.parquet
记录集
- 类型: cr:RecordSet
- 名称: default
- 描述: SaProtHub/DMS_YAP1_HUMAN - default子集
- 3个分割: train, validation, test
字段
-
名称: default/Sequence
-
描述: HF Mirror parquet文件中的Sequence列。
-
数据类型: sc:Text
-
来源:
- 文件集: parquet-files-for-config-default
- 提取: Sequence列
-
名称: default/label
-
描述: HF Mirror parquet文件中的label列。
-
数据类型: sc:Float
-
来源:
- 文件集: parquet-files-for-config-default
- 提取: label列
-
名称: default/stage
-
描述: HF Mirror parquet文件中的stage列。
-
数据类型: sc:Text
-
来源:
- 文件集: parquet-files-for-config-default
- 提取: stage列
符合标准
- 标准: http://mlcommons.org/croissant/1.0




