five

SaProtHub/Dataset-AAV-FLIP

收藏
Hugging Face2025-01-27 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/SaProtHub/Dataset-AAV-FLIP
下载链接
链接失效反馈
官方服务:
资源简介:
AAV预测是一个回归任务,其中每个输入蛋白质x被映射到一个衡量适应度分数的标签y。数据集来源于FLIP: Benchmark tasks in fitness landscape inference for proteins,并遵循了原始数据的划分方式,具体包括22246个训练样本、2462个验证样本和50432个测试样本。所有数据以LMDB格式组织,数据库结构包括样本数量和每个样本的序列及适应度标签。

AAV预测是一个回归任务,其中每个输入蛋白质x被映射到一个衡量适应度分数的标签y。数据集来源于FLIP: Benchmark tasks in fitness landscape inference for proteins,并遵循了原始数据的划分方式,具体包括22246个训练样本、2462个验证样本和50432个测试样本。所有数据以LMDB格式组织,数据库结构包括样本数量和每个样本的序列及适应度标签。
提供机构:
SaProtHub
原始信息汇总

数据集概述

数据集名称

AAV Prediction

数据集描述

AAV Prediction 是一个回归任务数据集,其中每个输入蛋白质 x 被映射到一个实数标签 y,表示其适应度得分。

数据集来源

数据集来源于 FLIP: Benchmark tasks in fitness landscape inference for proteins

数据集划分

  • 训练集: 22246
  • 验证集: 2462
  • 测试集: 50432

数据格式

数据集采用 LMDB 格式组织,数据库结构如下:

  • 长度: 样本数量
  • 0:
    • seq: 结构感知序列
    • fitness: 序列的适应度标签
  • 1:
    • ...

许可证

MIT 许可证

搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作