Protein Data Bank (PDB)
收藏www.rcsb.org2024-10-27 收录
下载链接:
https://www.rcsb.org/
下载链接
链接失效反馈官方服务:
资源简介:
PDB数据集包含了蛋白质、核酸和其他生物大分子的三维结构信息。这些数据是通过X射线晶体学、核磁共振(NMR)和其他技术手段获得的。数据集中的每个条目通常包括分子的原子坐标、实验条件、参考文献等信息。
The PDB dataset contains three-dimensional structural information of proteins, nucleic acids, and other biological macromolecules. These data are obtained via X-ray crystallography, nuclear magnetic resonance (NMR), and other technical approaches. Each entry in the dataset typically includes information such as atomic coordinates of the molecules, experimental conditions, and references.
提供机构:
www.rcsb.org
搜集汇总
数据集介绍

构建方式
蛋白质数据库(Protein Data Bank, PDB)的构建基于全球科研机构提交的蛋白质结构数据。这些数据通过X射线晶体学、核磁共振(NMR)光谱学等实验技术获得,并经过严格的验证和标准化处理。PDB采用统一的文件格式(PDB格式)来存储三维蛋白质结构信息,确保数据的准确性和可重复性。
特点
PDB数据集以其高精度和广泛覆盖的蛋白质结构信息著称。它不仅包含蛋白质的三维结构数据,还提供相关的生物学注释,如蛋白质的功能、相互作用和突变信息。此外,PDB支持多种查询和分析工具,便于研究人员进行深入的数据挖掘和结构分析。
使用方法
研究人员可以通过PDB网站或API接口访问和下载蛋白质结构数据。PDB提供了丰富的可视化工具,如Jmol和PyMOL,帮助用户直观地观察和分析蛋白质的三维结构。此外,PDB数据集常用于蛋白质折叠、药物设计、生物信息学算法开发等研究领域,为科学研究提供了坚实的基础数据支持。
背景与挑战
背景概述
蛋白质数据库(Protein Data Bank,简称PDB)是生物信息学领域中一个至关重要的资源,自1971年由Walter Hamilton在布鲁克海文国家实验室创建以来,已成为全球科学家研究蛋白质结构和功能的主要数据来源。PDB由全球多个研究机构共同维护,包括美国国家科学基金会、美国国立卫生研究院和欧洲生物信息学研究所等。其核心研究问题在于通过收集、验证和公开蛋白质及其相关生物大分子的三维结构数据,推动分子生物学、药物设计和生物技术的发展。PDB的影响力不仅限于学术界,还广泛应用于工业界,如新药研发和生物工程领域。
当前挑战
尽管PDB在蛋白质结构研究中发挥了重要作用,但其构建和维护过程中仍面临诸多挑战。首先,数据质量的保证是一个持续的挑战,包括结构数据的准确性和完整性验证。其次,随着高通量实验技术的发展,PDB需要处理和存储的数据量急剧增加,这对数据库的扩展性和计算能力提出了更高要求。此外,数据的标准化和互操作性问题也亟待解决,以确保不同研究团队的数据能够无缝集成和共享。最后,如何有效管理和更新日益增长的结构数据,以保持数据库的实时性和权威性,也是PDB面临的重要挑战。
发展历史
创建时间与更新
Protein Data Bank (PDB) 创建于1971年,由美国布鲁克海文国家实验室的Walter Hamilton博士发起。自那时起,PDB不断更新,截至2023年,已收录超过19万个蛋白质结构数据。
重要里程碑
PDB的第一个重要里程碑是1998年,当时PDB由美国国家科学基金会、能源部和卫生研究院共同管理,标志着其从单一实验室项目转变为国际合作项目。2003年,PDB与欧洲生物信息学研究所和日本大阪大学合作,形成了全球分布式数据库,即wwPDB,进一步提升了数据共享和访问的效率。近年来,PDB引入了自动化数据处理和验证系统,显著提高了数据质量和更新速度。
当前发展情况
当前,PDB已成为全球生物大分子结构研究的核心资源,支持了从基础科学研究到药物开发的广泛应用。PDB的数据不仅用于解析蛋白质功能和相互作用,还为计算机辅助药物设计提供了关键信息。随着新技术如冷冻电镜和人工智能的发展,PDB的数据质量和多样性持续提升,为生命科学领域的突破性研究提供了坚实基础。PDB的持续发展不仅推动了结构生物学的进步,也为全球科研合作和知识共享树立了典范。
发展历程
- Protein Data Bank (PDB) 首次建立,由美国布鲁克海文国家实验室的Walter Hamilton创建,作为蛋白质结构数据的存储库。
- PDB 的管理权转移至结构生物信息学研究合作组织(RCSB),标志着数据管理与维护的专业化。
- PDB 发布了其第一个XML格式的数据文件,促进了数据的标准化和互操作性。
- PDB 推出了PDBj(Protein Data Bank Japan),作为亚洲地区的数据中心,进一步扩展了全球数据共享网络。
- PDB 庆祝其成立50周年,展示了其在生物大分子结构研究中的核心地位和持续影响力。
常用场景
经典使用场景
在生物信息学领域,Protein Data Bank (PDB) 数据集被广泛用于蛋白质结构的研究与分析。该数据集包含了大量蛋白质及其复合物的三维结构信息,为科学家们提供了丰富的实验数据。通过PDB,研究人员可以深入探讨蛋白质的折叠机制、功能位点的定位以及蛋白质间的相互作用,从而推动结构生物学的发展。
实际应用
在实际应用中,PDB数据集被广泛应用于生物医药领域。例如,制药公司利用PDB中的蛋白质结构信息进行药物筛选和设计,以加速新药的研发进程。同时,PDB数据集也为生物技术公司提供了重要的参考,帮助他们优化蛋白质工程产品,如酶和抗体的性能。
衍生相关工作
基于PDB数据集,许多经典工作得以开展。例如,Rosetta和MODELLER等蛋白质结构预测软件利用PDB中的结构数据进行训练和验证,显著提高了预测的准确性。此外,PDB数据集还催生了如CATH和SCOP等蛋白质结构分类数据库,为蛋白质结构和功能的系统研究提供了有力支持。
以上内容由遇见数据集搜集并总结生成



