DrugRepurposing, SARSCoV, Pseudomonas
收藏github2020-09-12 更新2024-05-31 收录
下载链接:
https://github.com/CLAIRE-COVID-T4/pyg-covid-datasets
下载链接
链接失效反馈官方服务:
资源简介:
DrugRepurposing数据集提供了一系列药物结构和人类蛋白质相互作用图,以及药物与人类蛋白质的交互作用,还包括人类病毒及其与人类交互组的交互。SARSCoV数据集提供了一系列用于分类和无监督任务的数据集,数据来源于AI Cures的SARSCoV相关数据集。Pseudomonas数据集提供了一组分子数据,用于AI Cures的Pseudomonas Aeruginosa开放任务。
The DrugRepurposing dataset offers a collection of drug structures and human protein interaction maps, along with interactions between drugs and human proteins. It also includes human viruses and their interactions with the human interactome. The SARSCoV dataset provides a series of datasets for classification and unsupervised tasks, sourced from AI Cures' SARSCoV-related datasets. The Pseudomonas dataset presents a set of molecular data intended for AI Cures' Pseudomonas Aeruginosa open challenge.
创建时间:
2020-05-08
原始信息汇总
数据集概述
DrugRepurposing 数据集
- 内容: 提供药物结构、人类蛋白质相互作用图、药物与人类蛋白质的相互作用(二分图)、人类病毒及其与人类相互体的相互作用。
- 特征: 包含用户定义的图、节点和边特征。
- 病毒选择: 可通过
virus参数选择病毒,包括HCV,HHV-1至HHV-8,HIV-1,HIV-2,HPV-6,HPV-10,HPV-16,MERS-CoV,SARS-CoV,SARS-CoV-2,SV-40,VACV。
SARSCoV 数据集
- 内容: 提供多种分类和无监督任务的数据集,数据来源于AI Cures SARSCoV-related datasets。
- 数据集选项: 可通过
name参数选择数据集,包括AID1706,AID1706_eval,AID1706_full,PLpro,Mpro,PubChemIdex,BRHLib,ExtLib,ExpExtLib,EColi。 - 目标: 除
PubChemIdex,BRHLib,ExtLib,ExpExtLib外,其他数据集包含二进制目标activity。
Pseudomonas 数据集
- 内容: 提供分子数据,用于Pseudomonas Aeruginosa Open-Task of AI Cures。
- 基本使用: 通过指定URL下载并处理数据。
搜集汇总
数据集介绍

构建方式
DrugRepurposing数据集的构建基于多种数据源的整合,包括药物结构、人类蛋白质相互作用网络以及药物与人类蛋白质的相互作用。数据集通过从DrugBank、BioGRID等公开数据库中提取药物结构和蛋白质相互作用数据,并结合特定病毒与人类蛋白质的相互作用信息,构建了一个多层次的图结构。数据集的图结构包含了节点特征、边特征以及药物与蛋白质之间的二分图关系,为药物重定位研究提供了丰富的信息基础。
使用方法
使用DrugRepurposing数据集时,用户首先需要安装必要的Python库,如PyTorch、PyTorch-Geometric等。通过导入数据集类并指定根目录和病毒参数,用户可以轻松加载数据集。数据集提供了多种方法,如获取人类蛋白质相互作用网络、药物与蛋白质的相互作用等。用户可以通过简单的API调用获取所需的图结构数据,并利用这些数据进行药物重定位或病毒-宿主相互作用的研究。数据集的灵活性和易用性使其成为相关领域研究的理想工具。
背景与挑战
背景概述
DrugRepurposing、SARSCoV和Pseudomonas数据集是为COVID-19相关研究而构建的,旨在通过药物重定位和病毒-宿主相互作用的研究,加速抗病毒药物的发现。这些数据集由多个研究机构共同开发,主要依托于PyTorch-Geometric框架,结合了药物结构、人类蛋白质相互作用网络以及病毒与宿主蛋白质的相互作用数据。DrugRepurposing数据集特别关注多种病毒(如SARS-CoV-2、HIV等)与人类蛋白质的相互作用,为药物重定位提供了丰富的图结构数据。SARSCoV数据集则聚焦于SARS-CoV相关生物实验数据,涵盖多种实验条件下的化合物活性信息。Pseudomonas数据集则针对铜绿假单胞菌的开放任务,提供了分子结构及其活性数据。这些数据集在药物发现和病毒学研究领域具有重要影响力,为研究人员提供了多维度、多层次的实验数据支持。
当前挑战
这些数据集在构建和应用过程中面临多重挑战。首先,药物重定位任务需要整合复杂的多源数据,包括药物结构、蛋白质相互作用网络以及病毒-宿主相互作用数据,数据的高维性和异构性增加了模型训练的难度。其次,SARSCoV数据集中的实验数据来自不同的生物实验平台,数据的一致性和标准化处理成为关键问题。此外,Pseudomonas数据集中的分子活性数据规模有限,可能限制了模型的泛化能力。在数据构建过程中,如何有效提取和表示药物与蛋白质的相互作用、如何平衡数据集的多样性与质量,以及如何处理缺失数据和噪声,都是亟待解决的技术难题。这些挑战不仅影响了数据集的可用性,也对相关领域的研究提出了更高的要求。
常用场景
经典使用场景
在药物重定向研究中,DrugRepurposing数据集被广泛应用于探索现有药物对新型冠状病毒(SARS-CoV-2)等病毒的潜在治疗效果。通过构建药物与人类蛋白质相互作用网络,研究者能够识别出可能抑制病毒复制的药物分子,从而加速新疗法的开发。
解决学术问题
该数据集解决了药物重定向领域中的关键问题,即如何高效地从现有药物库中筛选出对特定病毒具有潜在疗效的候选药物。通过提供药物结构、蛋白质相互作用网络以及病毒与宿主蛋白质的相互作用数据,研究者能够系统地评估药物的抗病毒潜力,显著缩短了药物研发周期。
实际应用
在实际应用中,DrugRepurposing数据集已被用于支持COVID-19相关药物的快速筛选和验证。例如,研究者利用该数据集识别出多种FDA批准的药物,这些药物在体外实验中显示出对SARS-CoV-2的抑制作用,为临床试验提供了有力的候选药物。
数据集最近研究
最新研究方向
在COVID-19相关研究领域,DrugRepurposing、SARSCoV和Pseudomonas数据集为药物重定向和病毒抑制研究提供了重要支持。DrugRepurposing数据集通过整合药物结构、人类蛋白质相互作用网络以及病毒与宿主蛋白的相互作用,为基于图神经网络的药物筛选和病毒靶点预测提供了丰富的数据基础。SARSCoV数据集则聚焦于SARS-CoV相关蛋白酶的抑制活性研究,涵盖了多种实验数据,如3CL蛋白酶和PL蛋白酶的抑制实验,为抗病毒药物的高通量筛选和虚拟筛选提供了关键数据。Pseudomonas数据集则针对铜绿假单胞菌的抑制任务,为抗菌药物的开发提供了分子层面的数据支持。这些数据集在药物发现、病毒抑制和抗菌研究中的应用,推动了相关领域的前沿进展,特别是在图神经网络和深度学习模型的辅助下,显著提升了药物筛选的效率和准确性。
以上内容由遇见数据集搜集并总结生成



