SaProtHub/Meta-scale-protein-stability-dataset
收藏Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/SaProtHub/Meta-scale-protein-stability-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含各种蛋白质突变(包括一些人类设计的蛋白质)的ΔΔG值。ΔΔG值表示蛋白质的稳定性。数据集分为训练集、验证集和测试集,分别包含486352、60995和60492个样本。标签表示基于深度突变扫描实验的每个突变氨基酸序列的ΔΔG值。ΔΔG值反映了突变对蛋白质稳定性的影响:正值表示突变增强了蛋白质的稳定性,负值则表示突变降低了蛋白质的稳定性。
This dataset contains ΔΔG values of various protein mutations (including some human designed proteins). The ΔΔG value indicates the stability of the protein. The dataset is divided into training, validation, and test sets, containing 486352, 60995, and 60492 samples, respectively. The label represents the ΔΔG value of each mutant amino acid sequence based on a deep mutation scanning experiment. The ΔΔG value reflects the impact of the mutation on protein stability: a positive value suggests that the mutation enhances protein stability, while a negative value indicates that the mutation decreases protein stability.
提供机构:
SaProtHub
原始信息汇总
数据集概述
描述
该数据集包含各种蛋白质突变的ΔΔG值(包括一些人造蛋白质)。ΔΔG值表示蛋白质的稳定性。
数据划分
- 训练集: 486352
- 验证集: 60995
- 测试集: 60492
标签
标签表示基于深度突变扫描实验的每个突变氨基酸序列的ΔΔG值。
ΔG(delta G)理解
- ΔG是过程的吉布斯自由能变化,决定过程是否在热力学上是有利的。
- 负ΔG:表示过程在能量上有利。对于蛋白质展开,这意味着蛋白质在其展开形式中更稳定。
- 正ΔG:表示过程在能量上不利。对于蛋白质展开,这意味着蛋白质需要能量来维持其展开状态,即它在折叠形式中稳定。
ΔΔG(delta delta G)理解
- ΔΔG表示突变相对于基础蛋白质的ΔG变化。
- 正ΔΔG:表明突变增强了蛋白质的稳定性。
- 负ΔΔG:表明突变降低了蛋白质的稳定性。



