SaProtHub/DMS_RASH_HUMAN
收藏数据集概述
基本信息
- 名称: DMS_RASH_HUMAN
- 别名: SaProtHub/DMS_RASH_HUMAN
- 创建者: SaprotHub
- 关键词: 1K - 10K, csv, Text, Datasets, pandas, Croissant, 🇺🇸 Region: US
- URL: https://hf-mirror.com/datasets/SaProtHub/DMS_RASH_HUMAN
描述
该数据集包含人类蛋白质RASH_HUMAN的单点突变及其对应的深度突变扫描实验的突变效应分数。
数据集结构
-
分布:
-
类型: cr:FileObject
-
名称: repo
-
描述: HF Mirror git仓库。
-
内容URL: https://hf-mirror.com/datasets/SaProtHub/DMS_RASH_HUMAN/tree/refs%2Fconvert%2Fparquet
-
编码格式: git+https
-
类型: cr:FileSet
-
名称: parquet-files-for-config-default
-
描述: 由HF Mirror转换的基础Parquet文件(参见:https://hf-mirror.com/docs/datasets-server/parquet)。
-
包含于: repo
-
编码格式: application/x-parquet
-
包含: default//.parquet
-
-
记录集:
-
类型: cr:RecordSet
-
名称: default
-
描述: SaProtHub/DMS_RASH_HUMAN - default子集
- 3个分割: train, validation, test
-
字段:
-
类型: cr:Field
-
名称: default/Sequence
-
描述: HF Mirror parquet文件中的Sequence列。
-
数据类型: sc:Text
-
来源: parquet-files-for-config-default
-
类型: cr:Field
-
名称: default/label
-
描述: HF Mirror parquet文件中的label列。
-
数据类型: sc:Float
-
来源: parquet-files-for-config-default
-
类型: cr:Field
-
名称: default/stage
-
描述: HF Mirror parquet文件中的stage列。
-
数据类型: sc:Text
-
来源: parquet-files-for-config-default
-
-
相关信息
-
分割:
- train: 2479
- valid: 338
- test: 317
-
标签: 标签表示基于深度突变扫描实验的每个蛋白质的突变效应分数。
相关论文
数据集来自《Deep generative models of genetic variation capture the effects of mutations》。
符合标准
- 标准: http://mlcommons.org/croissant/1.0



