ProteinGym 蛋白质突变数据集
收藏超神经2024-07-09 更新2024-07-13 收录
下载链接:
https://hyper.ai/cn/datasets/32818
下载链接
链接失效反馈资源简介:
数据集共包含来自 87 个 DMS 测序实验的大约 150 万个错义变体。
This dataset contains approximately 1.5 million missense variants derived from 87 DMS sequencing experiments.
创建时间:
2024-07-09
AI搜集汇总
数据集介绍

背景与挑战
背景概述
ProteinGym 蛋白质突变数据集是一个大规模基准测试数据集,包含来自87个DMS测序实验的大约150万个错义变体,专门用于评估蛋白质语言模型的性能。该数据集在AI for Science领域有重要应用,例如在一篇Nature Communications论文中被用于研究通过少样本学习提高模型效率。
以上内容由AI搜集并总结生成



