ProteinKG25
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/ProteinKG25
下载链接
链接失效反馈官方服务:
资源简介:
ProteinKG25 是一个大规模的 KG 数据集,其描述和蛋白质序列分别与 GO 术语和蛋白质实体对齐。它包含大约 612,483 个实体、4,990,097 个三元组(包括 4,879,951 个蛋白质三元组和 110,146 个 Go-Go 三元组)。
提供机构:
OpenDataLab
创建时间:
2022-06-07
搜集汇总
数据集介绍

背景与挑战
背景概述
ProteinKG25是一个大规模知识图谱数据集,包含约61.2万个实体和499万个三元组,专门用于蛋白质序列与GO术语的对齐研究。该数据集由浙江大学与阿里巴巴联合研究中心于2022年发布,旨在支持蛋白质预训练任务。
以上内容由遇见数据集搜集并总结生成



