SaProtHub/DMS_BLAT_ECOLX
收藏Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/SaProtHub/DMS_BLAT_ECOLX
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含蛋白质BLAT_ECOLX的单点突变及其在深度突变扫描实验中的相应突变效应分数。数据集分为训练集、验证集和测试集,分别包含4366、575和527个样本。数据集来源于一篇相关论文,标签表示基于深度突变扫描实验的每个蛋白质的突变效应分数。
This dataset contains single site mutation of protein BLAT_ECOLX and the corresponding mutation effect score from deep mutation scanning experiment. The dataset is split into training, validation, and test sets, containing 4366, 575, and 527 samples respectively. The dataset is derived from a related paper, and the label represents the mutation effect score of each protein based on deep mutation scanning experiment.
提供机构:
SaProtHub
原始信息汇总
数据集概述
基本信息
- 名称: DMS_BLAT_ECOLX
- 别名: SaProtHub/DMS_BLAT_ECOLX
- 创建者: SaprotHub
- 关键词: 1K - 10K, csv, Text, Datasets, pandas, Croissant, 🇺🇸 Region: US
- URL: https://hf-mirror.com/datasets/SaProtHub/DMS_BLAT_ECOLX
描述
该数据集包含蛋白质BLAT_ECOLX的单点突变及其相应的深度突变扫描实验的突变效应得分。
分割
- 训练集: 4366
- 验证集: 575
- 测试集: 527
相关论文
数据集来自《Deep generative models of genetic variation capture the effects of mutations》。
标签
标签表示基于深度突变扫描实验的每个蛋白质的突变效应得分。
数据格式
- 分布:
- Git仓库:
- 名称: repo
- 描述: HF Mirror git仓库。
- 内容URL: https://hf-mirror.com/datasets/SaProtHub/DMS_BLAT_ECOLX/tree/refs%2Fconvert%2Fparquet
- 编码格式: git+https
- Parquet文件集:
- 名称: parquet-files-for-config-default
- 描述: HF Mirror转换的基础Parquet文件(参考: https://hf-mirror.com/docs/datasets-server/parquet)。
- 包含于: repo
- 编码格式: application/x-parquet
- 包含: default//.parquet
- Git仓库:
记录集
- 默认子集:
- 名称: default
- 描述: SaProtHub/DMS_BLAT_ECOLX - default子集
- 分割: 3个分割: train, validation, test
- 字段:
- Sequence:
- 名称: default/Sequence
- 描述: HF Mirror parquet文件中的Sequence列。
- 数据类型: Text
- label:
- 名称: default/label
- 描述: HF Mirror parquet文件中的label列。
- 数据类型: Float
- stage:
- 名称: default/stage
- 描述: HF Mirror parquet文件中的stage列。
- 数据类型: Text
- Sequence:
符合标准
- 标准: http://mlcommons.org/croissant/1.0
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



