Protein-ligand unified metrics benchmark (PLUMB)

github2025-02-26 更新2025-03-02 收录

下载链接：

https://github.com/omsf/plumb

下载链接

链接失效反馈

官方服务：

资源简介：

蛋白质-配体统一度量基准（PLUMB）：一个用于基准测试力场和自由能方法的数据库，该数据库整合了多种蛋白质-配体系统的结构和热动力学数据，优先考虑可重现性。

Protein-Ligand Unified Metric Benchmark (PLUMB): A database dedicated to benchmarking force fields and free energy methods, which integrates structural and thermodynamic data across diverse protein-ligand systems and prioritizes reproducibility.

创建时间：

2025-02-04

原始信息汇总

nf-core/plumb 数据集概述

简介

nf-core/plumb 是一个生成公开可访问数据库的管道，该数据库整合了各种蛋白质-配体系统的结构和热力学数据，优先考虑可重复性。该数据库将由已知的蛋白质-配体复合物构建，并包括一系列配体的对接结果，以代表广泛的化学空间，并通过质量控制过程评估对接姿势的质量。此工作与《计算分子科学活页期刊》上的论文“Best Practices for Constructing, Preparing, and Evaluating Protein-Ligand Binding Affinity Benchmarks [Article v1.0]”一起进行，旨在创建一个完全自我一致、不受任何特定商业供应商影响的开放社区资源和最佳实践集。

使用

在运行管道之前，请确保已经按照 Nextflow 安装指南设置了 Nextflow，并使用 -profile test 对设置进行了测试。

运行管道的基本命令如下：

bash nextflow run nf-core/plumb -profile <docker/singularity/.../institute> --input samplesheet.csv --outdir <OUTDIR>

请注意，除了通过 CLI 或 Nextflow -params-file 选项提供的参数外，自定义配置文件（包括 -c Nextflow 选项提供的配置文件）可用于提供任何配置。

输出

要查看完整数据集的示例运行结果，请参考 nf-core 网站管道页面的结果选项卡。关于输出文件和报告的详细信息，请参考输出文档。

贡献和支持

如果您想为这个管道做出贡献，请查看贡献指南。

引用

使用 nf-core/plumb 进行分析时，请引用以下 doi：10.5281/zenodo.XXXXXX。

关于管道使用的工具和数据的参考文献列表，可以在 CITATIONS.md 文件中找到。

搜集汇总

数据集介绍

构建方式

Protein-ligand unified metrics benchmark (PLUMB)数据集的构建，依托于nf-core/plumb流程，集成结构性与热动力学数据，针对多种蛋白-配体系统。该流程从已知的蛋白-配体复合物出发，纳入系列同源配体的对接结果，以展现广泛的化学空间，并通过质量控制流程评估对接姿势的质量。此构建过程旨在与《计算分子科学实时期刊》上的论文协同，打造一个完全自洽、开放且不受任何特定商业厂商影响的社区资源及最佳实践集。

特点

PLUMB数据集的特点在于其集成性与开放性，它不仅整合了结构与热动力学数据，还注重数据的重现性。数据集涵盖广泛的蛋白-配体系统，并包含同源配体的对接系列，使得化学空间得到充分展现。此外，数据集的质量控制过程确保了对接姿势的高质量，增加了数据集的可靠性与实用性。

使用方法

使用PLUMB数据集前，需确保已正确安装Nextflow及nf-core。数据集的执行需要通过命令行提供输入文件，如样本表，以及指定输出目录等参数。用户可以通过Nextflow的命令行界面运行nf-core/plumb流程，并根据具体需求调整参数配置。详细的使用步骤及参数配置，可参考官方的使用文档和参数文档，以获得最佳的使用体验。

背景与挑战

背景概述

Protein-ligand unified metrics benchmark (PLUMB)数据集，由nf-core团队开发，旨在构建一个集成的、公开可访问的数据库，该数据库汇合了各种蛋白-配体系统的结构性和热力学数据，强调数据的可重现性。该数据库的构建基于已知的蛋白-配体复合物，并包含了一系列配体的对接结果，以表示广泛的化学空间，并通过质量控制流程来评估对接姿势的质量。此项目与《Living Journal of Computational Molecular Sciences》上的一篇论文合作，致力于创建一个完全自洽的、开放的社区资源，并制定不受任何特定商业厂商影响的最佳实践。

当前挑战

PLUMB数据集在构建过程中面临的挑战主要包括：确保数据的质量和一致性，处理大量复杂的生物分子数据，以及开发和实施质量控制流程来评估对接姿势的质量。此外，数据集构建的挑战还包括促进数据的可访问性和可重现性，以及建立一套能够让社区广泛参与和贡献的最佳实践标准。在研究领域问题上，PLUMB数据集面临的挑战是提供精确和全面的蛋白-配体结合亲和力基准，以推动相关领域的研究进展。

常用场景

经典使用场景

在分子生物学与药物设计领域，Protein-ligand unified metrics benchmark (PLUMB) 数据集的经典使用场景在于为研究者提供了一个集成结构性与热动力学数据的公共数据库。该数据库的构建基于已知的蛋白质-配体复合物，并通过质量控制流程评估了对接姿势的质量，从而使得研究者能够在此基础上开展更为精确的药物分子设计与 binding affinity 预测研究。

解决学术问题

PLUMB 数据集解决了学术研究中对于高质量蛋白质-配体结合亲和力基准数据的迫切需求。它通过提供一套完全自洽、开放且不受任何特定商业供应商影响的最佳实践，助力科学家们克服了在构建和评估结合亲和力基准时遇到的挑战，从而推动了计算分子科学领域的进步。

衍生相关工作

基于PLUMB数据集，已经衍生出多项相关工作，包括对现有对接算法的评估、新型对接方法的发展，以及利用该数据集进行机器学习模型的训练，这些工作进一步扩展了PLUMB数据集的应用范围，并在计算生物学和药物化学领域产生了深远的影响。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集