five

Fantasia Embeddings GOA2024

收藏
NIAID Data Ecosystem2026-05-10 收录
下载链接:
https://zenodo.org/record/14546345
下载链接
链接失效反馈
官方服务:
资源简介:
Database of UniProt Entries with Corresponding Embeddings This database contains all UniProt entries and their corresponding embeddings, calculated using the following models: ProstT5 ProtT5 ESM2 The database is implemented in PostgreSQL and uses the pgvector extension to efficiently store and query high-dimensional embedding vectors. These embeddings are utilized in the FANTASIA pipeline to generate sequence annotations.Tags for GOA2022 have been added.

含对应嵌入向量的通用蛋白质知识库(UniProt)条目数据库 本数据库收录全部通用蛋白质知识库(UniProt)条目及其对应的嵌入向量,所有嵌入向量均通过以下模型计算得到: ProstT5 ProtT5 ESM2 本数据库基于PostgreSQL构建,并借助pgvector扩展实现高维嵌入向量的高效存储与查询。此类嵌入向量可应用于FANTASIA流水线以生成序列注释信息,同时已添加GOA2022(基因本体注释2022版)相关标签。
创建时间:
2026-03-30
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作