five

CrossDocked2020:ResGen 研究处理的数据集

收藏
超神经2024-02-28 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/29021
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集的初始数据包含超过 2,200 万个蛋白质-小分子配对 (protein–ligand pairs),为确保训练集与测试集之间的序列相似性小于 40%,研究人员经过筛选,得到了约 10 万个蛋白质-小分子配对,测试集中包含了 100 个蛋白质口袋。

The initial dataset contains over 22 million protein–ligand pairs. To ensure the sequence similarity between the training and test sets is less than 40%, researchers conducted screening and obtained approximately 100,000 protein–ligand pairs. The test set includes 100 protein pockets.
创建时间:
2024-01-18
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是CrossDocked2020的一个处理版本,专门用于ResGen研究。它从超过2200万个蛋白质-小分子配对中筛选出约10万个配对,确保训练集与测试集的序列相似性低于40%,测试集包含100个蛋白质口袋。该数据集主要用于蛋白质-小分子相互作用研究,特别是评估分子对蛋白质口袋的结合能力。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务