SaProtHub/Dataset-Beta_Lactamase-PEER
收藏Hugging Face2025-02-04 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/SaProtHub/Dataset-Beta_Lactamase-PEER
下载链接
链接失效反馈官方服务:
资源简介:
β-Lactamase Prediction数据集研究的是TEM-1 beta-lactamase蛋白质的一阶突变体的活性。目标变量y是一个实验测试的适应度分数,记录了每个突变体的缩放突变效应。数据集包含4158个训练样本、520个验证样本和520个测试样本。所有数据以LMDB格式组织,每个样本包含一个结构感知的序列和对应的适应度标签。
β-Lactamase Prediction数据集研究的是TEM-1 beta-lactamase蛋白质的一阶突变体的活性。目标变量y是一个实验测试的适应度分数,记录了每个突变体的缩放突变效应。数据集包含4158个训练样本、520个验证样本和520个测试样本。所有数据以LMDB格式组织,每个样本包含一个结构感知的序列和对应的适应度标签。
提供机构:
SaProtHub
原始信息汇总
数据集概述
数据集名称
β-Lactamase Prediction
数据集描述
该数据集研究TEM-1 beta-lactamase蛋白的第一级突变体的活性。目标变量y ∈ R 是实验测试的适应性评分,记录每个突变体的缩放突变效应。
数据集分割
- 训练集: 4158
- 验证集: 520
- 测试集: 520
数据格式
数据组织在LMDB格式中,数据库架构包括:
- 长度: 样本数量
- 0:
- seq: 结构感知序列
- fitness: 序列的适应性标签
- 1:
- ...
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集用于β-内酰胺酶活性预测,专注于TEM-1 beta-lactamase蛋白质的一阶突变体研究。数据集包含5,198个样本,分为训练、验证和测试集,每个样本包括蛋白质序列和对应的实验适应度分数,适用于蛋白质序列理解和突变效应预测任务。
以上内容由遇见数据集搜集并总结生成



