five

Therapeutics Data Bank (PDB)|生物大分子结构数据集|药物设计数据集

收藏
www.rcsb.org2024-10-26 收录
生物大分子结构
药物设计
下载链接:
https://www.rcsb.org/
下载链接
链接失效反馈
资源简介:
Therapeutics Data Bank (PDB) 是一个包含生物大分子(如蛋白质、核酸等)三维结构的数据库。它提供了详细的结构信息,包括原子坐标、化学键、以及与药物设计相关的其他数据。
提供机构:
www.rcsb.org
AI搜集汇总
数据集介绍
main_image_url
构建方式
Therapeutics Data Bank (PDB) 数据集的构建基于全球范围内生物大分子结构的研究成果。该数据集通过收集和整理来自多个实验室和研究机构的实验数据,包括蛋白质、核酸、多糖等生物大分子的三维结构信息。这些数据经过严格的实验验证和标准化处理,确保其准确性和可靠性。PDB 数据集的构建过程还包括对数据的分类、注释和索引,以便于用户快速检索和分析相关结构信息。
特点
PDB 数据集以其丰富的生物大分子结构信息而著称,涵盖了从简单的小分子到复杂的蛋白质复合物的广泛范围。该数据集不仅提供了高分辨率的结构数据,还包括了详细的实验条件、分子相互作用信息以及相关的生物学功能注释。此外,PDB 数据集还支持多种数据格式和可视化工具,使用户能够方便地进行结构分析和模型构建。
使用方法
PDB 数据集的使用方法多样,适用于生物学、药学、化学等多个领域的研究。用户可以通过 PDB 的官方网站或相关软件平台,如 PyMOL、Chimera 等,进行数据的检索和下载。利用这些工具,研究人员可以对特定分子的结构进行详细分析,探索其功能和相互作用机制。此外,PDB 数据集还支持与其他生物信息学数据库的集成,如 UniProt、GeneBank 等,以实现更全面的生物学研究。
背景与挑战
背景概述
Therapeutics Data Bank (PDB) 是一个专注于生物大分子结构的数据库,由美国国家科学基金会和能源部于1971年共同发起。PDB的建立旨在为科学家提供一个集中存储和共享蛋白质、核酸、多糖等生物大分子三维结构的平台。自成立以来,PDB已成为生物医学研究的重要资源,为药物设计、蛋白质工程和结构生物学等领域提供了关键数据支持。其影响力不仅体现在学术研究中,还对制药工业和生物技术产业产生了深远影响。
当前挑战
PDB在构建过程中面临了诸多挑战。首先,高分辨率结构数据的获取和解析需要先进的实验技术和计算方法,这要求数据库不断更新和优化。其次,随着生物大分子结构的复杂性增加,数据的准确性和完整性成为关键问题。此外,PDB还需要处理海量数据的存储和检索,确保用户能够高效地访问和利用这些信息。最后,数据的标准化和互操作性也是PDB持续面临的挑战,以确保不同研究团队的数据能够无缝集成和共享。
发展历史
创建时间与更新
Therapeutics Data Bank (PDB) 创建于1971年,由美国国家科学基金会资助,旨在存储和共享生物大分子结构数据。自创建以来,PDB不断更新,截至2023年,已包含超过19万个生物大分子结构。
重要里程碑
PDB的重要里程碑包括1998年引入PDBML格式,使数据交换更加标准化;2003年推出RCSB PDB网站,提供更便捷的在线访问和数据分析工具;2012年,PDB与EMDB(电子显微镜数据库)合并,扩展了其数据涵盖范围。这些里程碑事件显著提升了PDB在生物医学研究中的应用价值和影响力。
当前发展情况
当前,PDB已成为全球生物大分子结构数据的主要存储和共享平台,支持多种生物医学研究,如药物设计、蛋白质工程和疾病机制研究。PDB的持续发展不仅促进了结构生物学领域的进步,还为跨学科研究提供了丰富的数据资源。通过不断的技术创新和数据整合,PDB在推动科学发现和应用方面发挥着不可或缺的作用。
发展历程
  • Therapeutics Data Bank (PDB)首次发表,标志着蛋白质结构数据库的诞生。
    1971年
  • PDB数据库被整合到Research Collaboratory for Structural Bioinformatics (RCSB)中,进一步扩展了其功能和应用范围。
    1998年
  • PDB数据库开始提供在线数据提交和查询服务,极大地促进了全球科研人员的合作与数据共享。
    2000年
  • PDB数据库的结构数据量突破100,000个,成为全球最大的蛋白质结构数据库之一。
    2012年
  • PDB数据库与欧洲生物信息学研究所(EMBL-EBI)合作,推出了PDBj平台,进一步提升了数据的可访问性和分析能力。
    2019年
常用场景
经典使用场景
在生物医学领域,Therapeutics Data Bank (PDB) 数据集被广泛用于蛋白质结构的研究与分析。通过提供高分辨率的蛋白质三维结构信息,PDB 数据集使得研究人员能够深入探索蛋白质的功能、相互作用及其在生物过程中的作用机制。这一数据集的经典使用场景包括蛋白质折叠研究、药物设计以及蛋白质-蛋白质相互作用分析,为生物医学研究提供了不可或缺的基础数据。
实际应用
在实际应用中,PDB 数据集被广泛用于药物研发、生物技术和医疗诊断等领域。例如,制药公司利用 PDB 数据集中的蛋白质结构信息,设计新型药物分子,以提高药物的靶向性和疗效。此外,PDB 数据集还支持生物技术公司开发新的生物制品,如酶和抗体,这些产品在工业生产和医疗诊断中具有重要应用。
衍生相关工作
PDB 数据集的广泛应用催生了众多相关的经典研究工作。例如,基于 PDB 数据集的蛋白质结构预测算法,如 Rosetta 和 AlphaFold,极大地推动了蛋白质结构预测技术的发展。此外,PDB 数据集还促进了蛋白质相互作用网络的研究,为理解复杂生物系统提供了新的视角。这些衍生工作不仅深化了对蛋白质结构与功能的理解,还为生物医学研究开辟了新的方向。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录

UniProt

UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。

www.uniprot.org 收录

Office-31, Office-Home, VisDA-2017, DomainNet

Office-31是一个包含31个类别的办公用品图像数据集,Office-Home包含65个类别的日常用品图像数据集,VisDA-2017是一个用于视觉领域自适应挑战的数据集,DomainNet是一个大规模的多领域图像数据集。

github 收录