SaProtHub/Dataset-AAV-FLIP
收藏Hugging Face2025-01-27 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/SaProtHub/Dataset-AAV-FLIP
下载链接
链接失效反馈官方服务:
资源简介:
AAV预测是一个回归任务,其中每个输入蛋白质x被映射到一个衡量适应度分数的标签y。数据集来源于FLIP: Benchmark tasks in fitness landscape inference for proteins,并遵循了原始数据的划分方式,具体包括22246个训练样本、2462个验证样本和50432个测试样本。所有数据以LMDB格式组织,数据库结构包括样本数量和每个样本的序列及适应度标签。
AAV预测是一个回归任务,其中每个输入蛋白质x被映射到一个衡量适应度分数的标签y。数据集来源于FLIP: Benchmark tasks in fitness landscape inference for proteins,并遵循了原始数据的划分方式,具体包括22246个训练样本、2462个验证样本和50432个测试样本。所有数据以LMDB格式组织,数据库结构包括样本数量和每个样本的序列及适应度标签。
提供机构:
SaProtHub
原始信息汇总
数据集概述
数据集名称
AAV Prediction
数据集描述
AAV Prediction 是一个回归任务数据集,其中每个输入蛋白质 x 被映射到一个实数标签 y,表示其适应度得分。
数据集来源
数据集来源于 FLIP: Benchmark tasks in fitness landscape inference for proteins。
数据集划分
- 训练集: 22246
- 验证集: 2462
- 测试集: 50432
数据格式
数据集采用 LMDB 格式组织,数据库结构如下:
- 长度: 样本数量
- 0:
- seq: 结构感知序列
- fitness: 序列的适应度标签
- 1:
- ...
许可证
MIT 许可证
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



