five

PDBBind|药物设计数据集|分子对接数据集

收藏
www.pdbbind.org.cn2024-11-01 收录
药物设计
分子对接
下载链接:
http://www.pdbbind.org.cn/
下载链接
链接失效反馈
资源简介:
PDBBind数据集包含了蛋白质-配体复合物的晶体结构及其结合亲和力数据。该数据集主要用于研究蛋白质与小分子配体之间的相互作用,广泛应用于药物设计、分子对接和计算化学等领域。
提供机构:
www.pdbbind.org.cn
AI搜集汇总
数据集介绍
main_image_url
构建方式
PDBBind数据集的构建基于蛋白质数据库(PDB)中的晶体结构,通过系统地收集和整理与蛋白质-配体复合物相关的实验数据而形成。该数据集涵盖了多种蛋白质及其配体的结合亲和力数据,通过实验测定和计算模拟相结合的方式,确保了数据的准确性和可靠性。构建过程中,研究人员对每个复合物进行了详细的结构分析和亲和力测定,从而为后续的生物信息学研究和药物设计提供了坚实的基础。
特点
PDBBind数据集以其广泛的覆盖范围和高质量的数据著称,包含了超过5000个蛋白质-配体复合物的详细信息。其特点在于不仅提供了蛋白质和配体的三维结构数据,还包含了实验测定的结合亲和力值,这为研究蛋白质-配体相互作用提供了全面的数据支持。此外,该数据集还定期更新,以反映最新的实验进展和结构信息,确保其持续的实用性和前沿性。
使用方法
PDBBind数据集在药物发现和生物信息学研究中具有广泛的应用。研究人员可以利用该数据集进行蛋白质-配体相互作用的分子动力学模拟,以预测潜在的药物靶点和优化药物设计。此外,该数据集还可用于机器学习和深度学习模型的训练,以提高对蛋白质结构和功能的理解。通过分析PDBBind中的结合亲和力数据,研究人员能够更准确地评估药物的潜在疗效和副作用,从而加速新药的开发过程。
背景与挑战
背景概述
PDBBind数据集,由Wang等人于2004年创建,是生物信息学领域中用于研究蛋白质-配体相互作用的核心资源。该数据集汇集了来自蛋白质数据库(PDB)的结构信息,涵盖了多种蛋白质及其结合配体的详细数据。PDBBind的构建旨在解决蛋白质与小分子相互作用预测的复杂问题,为药物发现和设计提供了重要的实验数据支持。其影响力不仅限于学术研究,还广泛应用于工业界,推动了基于结构的药物设计方法的发展。
当前挑战
PDBBind数据集在构建和应用过程中面临多项挑战。首先,数据集的更新和维护需要持续投入,以确保包含最新的实验数据和结构信息。其次,蛋白质-配体相互作用的复杂性使得数据集的标注和分类工作异常繁琐,需要高度专业化的知识和技能。此外,数据集的多样性和规模也带来了计算和分析上的挑战,尤其是在处理大规模数据时,如何高效地提取和利用有价值的信息成为一大难题。
发展历史
创建时间与更新
PDBBind数据集最初由O. Trott和A. J. Olson于2004年创建,旨在为蛋白质-配体相互作用提供一个全面的资源。该数据集定期更新,最新版本为2020年发布的PDBBind v2020,显著扩展了其数据量和多样性。
重要里程碑
PDBBind数据集的重要里程碑包括2004年的首次发布,为蛋白质-配体相互作用研究提供了基础数据。2010年,PDBBind v2010引入了精细化的结合亲和力数据,极大地提升了数据集的实用性和研究价值。2016年,PDBBind v2016进一步整合了多种生物物理实验数据,增强了数据集的多样性和可靠性。
当前发展情况
当前,PDBBind数据集已成为药物设计和生物信息学领域的核心资源,广泛应用于分子对接、虚拟筛选和药物发现等研究。其持续的更新和扩展,不仅丰富了数据内容,还提升了数据质量和分析工具的多样性,为相关领域的科学研究和工业应用提供了坚实的基础。
发展历程
  • PDBBind数据集首次发表,包含蛋白质-配体复合物的结合亲和力数据,为药物设计领域提供了重要的实验数据资源。
    2003年
  • PDBBind数据集进行了首次重大更新,增加了更多的蛋白质-配体复合物及其结合亲和力数据,进一步丰富了数据集的内容。
    2005年
  • PDBBind数据集首次应用于机器学习模型的训练,展示了其在预测蛋白质-配体结合亲和力方面的潜力。
    2007年
  • PDBBind数据集再次更新,引入了更多的实验数据和新的数据处理方法,提升了数据集的质量和可靠性。
    2010年
  • PDBBind数据集被广泛应用于多个药物设计研究项目中,成为该领域的重要参考数据集。
    2015年
  • PDBBind数据集进行了最新一次更新,增加了大量新的蛋白质-配体复合物数据,并优化了数据处理流程,以适应不断发展的药物设计需求。
    2019年
常用场景
经典使用场景
在分子生物学领域,PDBBind数据集被广泛应用于蛋白质-配体相互作用的研究。该数据集包含了大量蛋白质与配体的结合亲和力数据,为研究人员提供了丰富的实验数据资源。通过分析这些数据,科学家们能够深入理解蛋白质与配体之间的相互作用机制,进而为药物设计提供理论支持。
解决学术问题
PDBBind数据集在解决蛋白质-配体相互作用预测的学术研究问题中发挥了关键作用。通过提供详细的结合亲和力数据,该数据集帮助研究人员开发和验证了多种计算模型,如分子对接和自由能预测方法。这些模型不仅提高了预测的准确性,还为理解蛋白质功能和药物设计提供了新的视角。
衍生相关工作
基于PDBBind数据集,许多经典工作得以开展。例如,研究人员开发了多种基于机器学习的预测模型,用于预测蛋白质-配体结合亲和力。此外,该数据集还促进了分子动力学模拟和自由能计算方法的发展,为复杂生物系统的研究提供了新的工具。这些衍生工作不仅丰富了分子生物学的研究手段,还为药物设计和开发提供了强有力的支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LEGO数据集

该数据集包含了关于LEGO公司的历史、产品提供以及特定LEGO套装的信息,用于分析LEGO套装的规模、发布年份、主题分布以及套装复杂性的变化。

github 收录

CatMeows

该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。

huggingface 收录

新能源光伏功率预测数据

采集数值天气预报数据、实时环境气象数据、光伏电站实时输出功率数据等信息,通过气象预测模型与功率预测算法,实现对光伏电站未来一段时间内气象数据及功率数据的预测。

安徽省数据知识产权登记平台 收录

PCLT20K

PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。

arXiv 收录

Yahoo Finance

Dataset About finance related to stock market

kaggle 收录