five

SaProtHub/Dataset-Beta_Lactamase-PEER

收藏
Hugging Face2025-02-04 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/SaProtHub/Dataset-Beta_Lactamase-PEER
下载链接
链接失效反馈
官方服务:
资源简介:
β-Lactamase Prediction数据集研究的是TEM-1 beta-lactamase蛋白质的一阶突变体的活性。目标变量y是一个实验测试的适应度分数,记录了每个突变体的缩放突变效应。数据集包含4158个训练样本、520个验证样本和520个测试样本。所有数据以LMDB格式组织,每个样本包含一个结构感知的序列和对应的适应度标签。

β-Lactamase Prediction数据集研究的是TEM-1 beta-lactamase蛋白质的一阶突变体的活性。目标变量y是一个实验测试的适应度分数,记录了每个突变体的缩放突变效应。数据集包含4158个训练样本、520个验证样本和520个测试样本。所有数据以LMDB格式组织,每个样本包含一个结构感知的序列和对应的适应度标签。
提供机构:
SaProtHub
原始信息汇总

数据集概述

数据集名称

β-Lactamase Prediction

数据集描述

该数据集研究TEM-1 beta-lactamase蛋白的第一级突变体的活性。目标变量yR 是实验测试的适应性评分,记录每个突变体的缩放突变效应。

数据集分割

  • 训练集: 4158
  • 验证集: 520
  • 测试集: 520

数据格式

数据组织在LMDB格式中,数据库架构包括:

  • 长度: 样本数量
  • 0:
    • seq: 结构感知序列
    • fitness: 序列的适应性标签
  • 1:
    • ...
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集用于β-内酰胺酶活性预测,专注于TEM-1 beta-lactamase蛋白质的一阶突变体研究。数据集包含5,198个样本,分为训练、验证和测试集,每个样本包括蛋白质序列和对应的实验适应度分数,适用于蛋白质序列理解和突变效应预测任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作