five

SCOPE-DTI

收藏
arXiv2025-03-12 更新2025-03-14 收录
下载链接:
http://arxiv.org/abs/2503.09251v1
下载链接
链接失效反馈
官方服务:
资源简介:
SCOPE-DTI是一个大规模、平衡的半归纳人类药物-靶点相互作用数据集,由13个公共仓库构建而成,相比常见基准数据集,数据量扩大了100倍。该数据集整合了蛋白质和化合物的三维结构表示、图神经网络和双线性注意机制,有效捕捉跨领域交互模式,显著优于现有最先进方法。此外,SCOPE-DTI还提供了一个用户友好的界面和数据库,加速药物发现研究。

SCOPE-DTI is a large-scale, balanced semi-inductive human drug-target interaction (DTI) dataset constructed from 13 public repositories, with a scale 100 times larger than that of common benchmark DTI datasets. This dataset integrates three-dimensional structural representations of proteins and compounds, graph neural networks, and bilinear attention mechanisms, effectively capturing cross-domain interaction patterns and significantly outperforming existing state-of-the-art methods. Additionally, SCOPE-DTI provides a user-friendly interface and database to accelerate drug discovery research.
提供机构:
香港中文大学(深圳)医学院
创建时间:
2025-03-12
搜集汇总
数据集介绍
main_image_url
构建方式
SCOPE-DTI数据集的构建方式是通过整合13个公共数据源,构建了一个大规模、平衡的半归纳人类药物-靶标相互作用(DTI)数据集。该数据集通过13个公共数据源收集了DTI数据,并将这些数据进行整合和清洗,以消除数据中的不一致性和错误。数据集中包含蛋白质、化合物和相互作用标签等信息。蛋白质使用UniProt标识符进行注释,并根据IUPHAR数据库进行分类。为了进行结构建模,使用AlphaFold2生成了3D蛋白质结构。化合物使用PubChem和ChEMBL数据库进行注释,并使用RDKit构建了3D结构,并使用Merck分子力场进行优化。相互作用标签通过使用标准化测量特定的截止值从PubChem生物活性数据中系统地分配,将相互作用分为阳性(1)或阴性(0)。为了解决目标级别类别不平衡的问题,实施了一种过滤方法,以确保交互标签在目标之间更加平衡。
使用方法
SCOPE-DTI数据集的使用方法是通过SCOPE框架进行药物-靶标相互作用预测。用户可以通过输入化合物的SMILES字符串来执行搜索或预测任务。在搜索模式下,服务器会识别并返回SCOPE数据集中与输入分子结构相似度大于0.9的所有化合物。在预测模式下,输入分子将与SCOPE库中的所有蛋白质配对,并提供半归纳精度的相互作用预测。此外,用户还可以直接从网站上下载完整的SCOPE数据集。SCOPE框架还提供了模型解释性分析,用户可以通过分析模型的预测性能与蛋白质已知交互数量之间的关系,以及通过UMAP-OPTICS聚类分析模型生成的BAN注意力向量,来理解模型的预测能力和工作机制。
背景与挑战
背景概述
药物-靶标相互作用(DTI)的识别是药物发现、药物再利用、毒性预测以及提高临床试验成功率的关键步骤。传统的实验方法因其高准确性和可靠性而在DTI识别中占据主导地位。然而,实验方法的高成本和时间需求限制了其可扩展性,尤其是在巨大的化学和生物学搜索空间中。随着大量实验数据集的积累,数据驱动的计算方法得到了发展。机器学习方法利用这些大规模数据集来学习和概括相互作用模式,从而实现快速、经济的预测新药物-靶标相互作用(DTIs)。近年来,深度学习在计算DTI预测方面取得了显著进展。SCOPE-DTI数据集的提出,旨在解决深度学习模型在实际应用中的局限性,如数据多样性和建模复杂性不足等问题。SCOPE-DTI数据集由13个公共存储库构建,数据量比常见基准数据集如Human数据集增加了100倍。SCOPE模型整合了三维蛋白质和化合物表示、图神经网络和双线性注意机制,能够有效捕捉跨域相互作用模式,在各种DTI预测任务中显著优于最先进的方法。SCOPE-DTI还为用户提供了一个用户友好的界面和数据库,并通过实验验证了其有效性,如实验确定了人参皂苷Rh1的抗肿瘤靶点。
当前挑战
SCOPE-DTI数据集和相关框架在药物-靶标相互作用预测方面面临的主要挑战包括:1)构建大规模、平衡且以人为焦点的DTI数据集,克服数据多样性和建模复杂性不足的问题;2)开发能够有效捕捉跨域相互作用模式的深度学习模型,提高预测准确性;3)在半归纳学习框架下,提高模型对新化合物的预测能力,使其在实际药物发现中更具实用性;4)开发用户友好的界面和数据库,方便研究人员访问和使用;5)提高模型的可解释性,为药物-靶标相互作用的机理提供更深入的洞察。
常用场景
经典使用场景
SCOPE-DTI数据集及其框架在药物靶标相互作用预测领域具有广泛应用。该数据集整合了13个公共数据库,提供了大规模、平衡的半归纳人类药物靶标相互作用数据,相较于常见基准数据集如Human数据集,数据量扩大了100倍。SCOPE模型结合了三维蛋白质和化合物表示、图神经网络以及双线性注意力机制,能够有效捕获跨域交互模式,在多种药物靶标相互作用预测任务中显著优于现有方法。此外,SCOPE-DTI还提供了一个用户友好的界面和数据库,方便用户进行药物发现研究。
解决学术问题
SCOPE-DTI数据集解决了药物靶标相互作用预测中的数据多样性和建模复杂性不足的问题。在药物发现中,准确预测新化合物与可药物靶标之间的相互作用至关重要。然而,现有模型在归纳场景下的预测准确率较低,限制了其在实际应用中的效用。SCOPE-DTI通过构建大规模的半归纳数据集和先进的深度学习模型,有效提升了模型在归纳场景下的预测性能,为药物发现提供了更可靠的理论依据和实践工具。
实际应用
SCOPE-DTI数据集在实际应用中具有广泛的应用前景。例如,SCOPE-DTI框架已被成功应用于预测人参皂苷Rh1的抗肿瘤靶标,并通过实验验证了预测结果的准确性。SCOPE-DTI数据集和框架的提供,为药物发现研究提供了强有力的数据支持和工具,有助于加速新药研发进程,降低研发成本,提高临床成功率。
数据集最近研究
最新研究方向
SCOPE-DTI数据集在深度学习药物-靶标相互作用预测中的应用,旨在解决实际应用中数据多样性和建模复杂性受限的问题。SCOPE-DTI框架结合了大规模、平衡的半归纳人类DTI数据集和先进的深度学习建模技术。该数据集由13个公共数据仓库构建而成,相比Human数据集等常见基准,数据量扩大了100倍。SCOPE模型融合了三维蛋白质和化合物表示、图神经网络和双线性注意力机制,有效地捕捉跨域交互模式,在各种DTI预测任务中显著优于现有方法。SCOPE-DTI提供了用户友好的界面和数据库,并通过实验验证了其有效性,例如通过SCOPE-DTI识别人参皂苷Rh1的抗肿瘤靶标。SCOPE-DTI的提出为药物发现研究提供了全面的数据、先进的建模和易于使用的工具,有助于加速药物发现研究。
相关研究论文
  • 1
    SCOPE-DTI: Semi-Inductive Dataset Construction and Framework Optimization for Practical Usability Enhancement in Deep Learning-Based Drug Target Interaction Prediction香港中文大学(深圳)医学院 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作