five

SaProtHub/DMS_BLAT_ECOLX

收藏
Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/SaProtHub/DMS_BLAT_ECOLX
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含蛋白质BLAT_ECOLX的单点突变及其在深度突变扫描实验中的相应突变效应分数。数据集分为训练集、验证集和测试集,分别包含4366、575和527个样本。数据集来源于一篇相关论文,标签表示基于深度突变扫描实验的每个蛋白质的突变效应分数。

This dataset contains single site mutation of protein BLAT_ECOLX and the corresponding mutation effect score from deep mutation scanning experiment. The dataset is split into training, validation, and test sets, containing 4366, 575, and 527 samples respectively. The dataset is derived from a related paper, and the label represents the mutation effect score of each protein based on deep mutation scanning experiment.
提供机构:
SaProtHub
原始信息汇总

数据集概述

基本信息

  • 名称: DMS_BLAT_ECOLX
  • 别名: SaProtHub/DMS_BLAT_ECOLX
  • 创建者: SaprotHub
  • 关键词: 1K - 10K, csv, Text, Datasets, pandas, Croissant, 🇺🇸 Region: US
  • URL: https://hf-mirror.com/datasets/SaProtHub/DMS_BLAT_ECOLX

描述

该数据集包含蛋白质BLAT_ECOLX的单点突变及其相应的深度突变扫描实验的突变效应得分。

分割

  • 训练集: 4366
  • 验证集: 575
  • 测试集: 527

相关论文

数据集来自《Deep generative models of genetic variation capture the effects of mutations》。

标签

标签表示基于深度突变扫描实验的每个蛋白质的突变效应得分。

数据格式

  • 分布:
    • Git仓库:
      • 名称: repo
      • 描述: HF Mirror git仓库。
      • 内容URL: https://hf-mirror.com/datasets/SaProtHub/DMS_BLAT_ECOLX/tree/refs%2Fconvert%2Fparquet
      • 编码格式: git+https
    • Parquet文件集:
      • 名称: parquet-files-for-config-default
      • 描述: HF Mirror转换的基础Parquet文件(参考: https://hf-mirror.com/docs/datasets-server/parquet)。
      • 包含于: repo
      • 编码格式: application/x-parquet
      • 包含: default//.parquet

记录集

  • 默认子集:
    • 名称: default
    • 描述: SaProtHub/DMS_BLAT_ECOLX - default子集
    • 分割: 3个分割: train, validation, test
    • 字段:
      • Sequence:
        • 名称: default/Sequence
        • 描述: HF Mirror parquet文件中的Sequence列。
        • 数据类型: Text
      • label:
        • 名称: default/label
        • 描述: HF Mirror parquet文件中的label列。
        • 数据类型: Float
      • stage:
        • 名称: default/stage
        • 描述: HF Mirror parquet文件中的stage列。
        • 数据类型: Text

符合标准

  • 标准: http://mlcommons.org/croissant/1.0
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作