five

Therapeutics Data Bank (PDB)|生物大分子结构数据集|药物设计数据集

收藏
www.rcsb.org2024-10-26 收录
生物大分子结构
药物设计
下载链接:
https://www.rcsb.org/
下载链接
链接失效反馈
资源简介:
Therapeutics Data Bank (PDB) 是一个包含生物大分子(如蛋白质、核酸等)三维结构的数据库。它提供了详细的结构信息,包括原子坐标、化学键、以及与药物设计相关的其他数据。
提供机构:
www.rcsb.org
AI搜集汇总
数据集介绍
main_image_url
构建方式
Therapeutics Data Bank (PDB) 数据集的构建基于全球范围内生物大分子结构的研究成果。该数据集通过收集和整理来自多个实验室和研究机构的实验数据,包括蛋白质、核酸、多糖等生物大分子的三维结构信息。这些数据经过严格的实验验证和标准化处理,确保其准确性和可靠性。PDB 数据集的构建过程还包括对数据的分类、注释和索引,以便于用户快速检索和分析相关结构信息。
特点
PDB 数据集以其丰富的生物大分子结构信息而著称,涵盖了从简单的小分子到复杂的蛋白质复合物的广泛范围。该数据集不仅提供了高分辨率的结构数据,还包括了详细的实验条件、分子相互作用信息以及相关的生物学功能注释。此外,PDB 数据集还支持多种数据格式和可视化工具,使用户能够方便地进行结构分析和模型构建。
使用方法
PDB 数据集的使用方法多样,适用于生物学、药学、化学等多个领域的研究。用户可以通过 PDB 的官方网站或相关软件平台,如 PyMOL、Chimera 等,进行数据的检索和下载。利用这些工具,研究人员可以对特定分子的结构进行详细分析,探索其功能和相互作用机制。此外,PDB 数据集还支持与其他生物信息学数据库的集成,如 UniProt、GeneBank 等,以实现更全面的生物学研究。
背景与挑战
背景概述
Therapeutics Data Bank (PDB) 是一个专注于生物大分子结构的数据库,由美国国家科学基金会和能源部于1971年共同发起。PDB的建立旨在为科学家提供一个集中存储和共享蛋白质、核酸、多糖等生物大分子三维结构的平台。自成立以来,PDB已成为生物医学研究的重要资源,为药物设计、蛋白质工程和结构生物学等领域提供了关键数据支持。其影响力不仅体现在学术研究中,还对制药工业和生物技术产业产生了深远影响。
当前挑战
PDB在构建过程中面临了诸多挑战。首先,高分辨率结构数据的获取和解析需要先进的实验技术和计算方法,这要求数据库不断更新和优化。其次,随着生物大分子结构的复杂性增加,数据的准确性和完整性成为关键问题。此外,PDB还需要处理海量数据的存储和检索,确保用户能够高效地访问和利用这些信息。最后,数据的标准化和互操作性也是PDB持续面临的挑战,以确保不同研究团队的数据能够无缝集成和共享。
发展历史
创建时间与更新
Therapeutics Data Bank (PDB) 创建于1971年,由美国国家科学基金会资助,旨在存储和共享生物大分子结构数据。自创建以来,PDB不断更新,截至2023年,已包含超过19万个生物大分子结构。
重要里程碑
PDB的重要里程碑包括1998年引入PDBML格式,使数据交换更加标准化;2003年推出RCSB PDB网站,提供更便捷的在线访问和数据分析工具;2012年,PDB与EMDB(电子显微镜数据库)合并,扩展了其数据涵盖范围。这些里程碑事件显著提升了PDB在生物医学研究中的应用价值和影响力。
当前发展情况
当前,PDB已成为全球生物大分子结构数据的主要存储和共享平台,支持多种生物医学研究,如药物设计、蛋白质工程和疾病机制研究。PDB的持续发展不仅促进了结构生物学领域的进步,还为跨学科研究提供了丰富的数据资源。通过不断的技术创新和数据整合,PDB在推动科学发现和应用方面发挥着不可或缺的作用。
发展历程
  • Therapeutics Data Bank (PDB)首次发表,标志着蛋白质结构数据库的诞生。
    1971年
  • PDB数据库被整合到Research Collaboratory for Structural Bioinformatics (RCSB)中,进一步扩展了其功能和应用范围。
    1998年
  • PDB数据库开始提供在线数据提交和查询服务,极大地促进了全球科研人员的合作与数据共享。
    2000年
  • PDB数据库的结构数据量突破100,000个,成为全球最大的蛋白质结构数据库之一。
    2012年
  • PDB数据库与欧洲生物信息学研究所(EMBL-EBI)合作,推出了PDBj平台,进一步提升了数据的可访问性和分析能力。
    2019年
常用场景
经典使用场景
在生物医学领域,Therapeutics Data Bank (PDB) 数据集被广泛用于蛋白质结构的研究与分析。通过提供高分辨率的蛋白质三维结构信息,PDB 数据集使得研究人员能够深入探索蛋白质的功能、相互作用及其在生物过程中的作用机制。这一数据集的经典使用场景包括蛋白质折叠研究、药物设计以及蛋白质-蛋白质相互作用分析,为生物医学研究提供了不可或缺的基础数据。
实际应用
在实际应用中,PDB 数据集被广泛用于药物研发、生物技术和医疗诊断等领域。例如,制药公司利用 PDB 数据集中的蛋白质结构信息,设计新型药物分子,以提高药物的靶向性和疗效。此外,PDB 数据集还支持生物技术公司开发新的生物制品,如酶和抗体,这些产品在工业生产和医疗诊断中具有重要应用。
衍生相关工作
PDB 数据集的广泛应用催生了众多相关的经典研究工作。例如,基于 PDB 数据集的蛋白质结构预测算法,如 Rosetta 和 AlphaFold,极大地推动了蛋白质结构预测技术的发展。此外,PDB 数据集还促进了蛋白质相互作用网络的研究,为理解复杂生物系统提供了新的视角。这些衍生工作不仅深化了对蛋白质结构与功能的理解,还为生物医学研究开辟了新的方向。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CatMeows

该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。

huggingface 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

weibo-comments-v1

该数据集包含多个特征,如id、文本内容、标记的id、用户昵称、评论和标签。数据集被分为训练集和测试集,分别有2325和582个样本。数据集的下载大小为810622字节,数据集大小为1266259.0字节。

huggingface 收录

rule34lol-images-part1

该数据集包含来自rule34.lol图像板的196,000个图像文件的元数据。元数据包括URL、标签、文件信息和点赞数。实际图像文件存储在zip存档中,每个存档包含1000个图像。该数据集是更大集合的一部分,分为Part 1和Part 2。数据集采用CC0许可,允许免费使用、修改和分发,无需署名。

huggingface 收录