five

SaProtHub/DMS_RASH_HUMAN

收藏
Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/SaProtHub/DMS_RASH_HUMAN
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了人类RASH蛋白的单点突变及其对应的突变效应评分,这些数据来源于深度突变扫描实验。数据集分为训练集(2479个样本)、验证集(338个样本)和测试集(317个样本)。标签表示基于深度突变扫描实验的每个蛋白质的突变效应评分。

This dataset contains single site mutation of protein RASH_HUMAN and the corresponding mutation effect score from deep mutation scanning experiment. The dataset is split into training (2479 samples), validation (338 samples), and test sets (317 samples). The label means the mutation effect score of each protein based on deep mutation scanning experiment.
提供机构:
SaProtHub
原始信息汇总

数据集概述

基本信息

  • 名称: DMS_RASH_HUMAN
  • 别名: SaProtHub/DMS_RASH_HUMAN
  • 创建者: SaprotHub
  • 关键词: 1K - 10K, csv, Text, Datasets, pandas, Croissant, 🇺🇸 Region: US
  • URL: https://hf-mirror.com/datasets/SaProtHub/DMS_RASH_HUMAN

描述

该数据集包含人类蛋白质RASH_HUMAN的单点突变及其对应的深度突变扫描实验的突变效应分数。

数据集结构

  • 分布:

    • 类型: cr:FileObject

    • 名称: repo

    • 描述: HF Mirror git仓库。

    • 内容URL: https://hf-mirror.com/datasets/SaProtHub/DMS_RASH_HUMAN/tree/refs%2Fconvert%2Fparquet

    • 编码格式: git+https

    • 类型: cr:FileSet

    • 名称: parquet-files-for-config-default

    • 描述: 由HF Mirror转换的基础Parquet文件(参见:https://hf-mirror.com/docs/datasets-server/parquet)。

    • 包含于: repo

    • 编码格式: application/x-parquet

    • 包含: default//.parquet

  • 记录集:

    • 类型: cr:RecordSet

    • 名称: default

    • 描述: SaProtHub/DMS_RASH_HUMAN - default子集

      • 3个分割: train, validation, test
    • 字段:

      • 类型: cr:Field

      • 名称: default/Sequence

      • 描述: HF Mirror parquet文件中的Sequence列。

      • 数据类型: sc:Text

      • 来源: parquet-files-for-config-default

      • 类型: cr:Field

      • 名称: default/label

      • 描述: HF Mirror parquet文件中的label列。

      • 数据类型: sc:Float

      • 来源: parquet-files-for-config-default

      • 类型: cr:Field

      • 名称: default/stage

      • 描述: HF Mirror parquet文件中的stage列。

      • 数据类型: sc:Text

      • 来源: parquet-files-for-config-default

相关信息

  • 分割:

    • train: 2479
    • valid: 338
    • test: 317
  • 标签: 标签表示基于深度突变扫描实验的每个蛋白质的突变效应分数。

相关论文

数据集来自《Deep generative models of genetic variation capture the effects of mutations》。

符合标准

  • 标准: http://mlcommons.org/croissant/1.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作