CAFA5 T5 embeds, part 1 (1...50000)
收藏kaggle2023-08-23 更新2024-03-11 收录
下载链接:
https://www.kaggle.com/datasets/ogurtsov/cafa5-t5-embeds-part-1-150000
下载链接
链接失效反馈官方服务:
资源简介:
Residual-level T5 embeds for train proteins
创建时间:
2023-08-23
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是CAFA5蛋白质功能预测竞赛的训练蛋白质T5嵌入表示的第一部分,包含5万个蛋白质的残基级别嵌入向量文件,总大小约49.41 GB。这些嵌入由T5模型生成,适用于生物信息学、深度学习和自然语言处理的交叉领域研究,特别是蛋白质功能注释任务。
以上内容由遇见数据集搜集并总结生成



