five

OpenADMET, AIRCHECK, Polaris, PLINDER

收藏
github2024-11-03 更新2024-11-28 收录
下载链接:
https://github.com/PatWalters/resources_2024
下载链接
链接失效反馈
官方服务:
资源简介:
OpenADMET项目旨在主动表征与ADMET相关蛋白质(“抗目标”)可访问的化学空间。通过应用最新的实验和计算技术,将生成一个全面的开放实验和结构数据集库。AIRCHECK是一个平台,提供大量高质量的药物发现和发展数据集。这些数据集来自各种来源,并以标准化格式提供。Polaris旨在改善基准测试的状态,以便机器学习能够对现实世界的药物发现场景产生更大的影响。PLINDER是一个学术-工业合作项目,旨在提供一个黄金标准数据集和评估,以推动计算蛋白质-配体相互作用预测领域的发展。

The OpenADMET project aims to actively characterize the chemical space accessible to ADMET-related proteins ("off-targets"). By applying cutting-edge experimental and computational technologies, a comprehensive library of open experimental and structural datasets will be generated. AIRCHECK is a platform that provides a large collection of high-quality drug discovery and development datasets. These datasets originate from diverse sources and are provided in standardized formats. Polaris aims to improve the state of benchmarking so that machine learning can have a greater impact on real-world drug discovery scenarios. PLINDER is an academic-industrial collaborative project aimed at providing a gold-standard dataset and evaluation benchmarks to advance the field of computational protein-ligand interaction prediction.
创建时间:
2024-10-29
原始信息汇总

Machine Learning in Drug Discovery Resources 2024

Datasets

OpenADMET

  • Description: The OpenADMET project aims to characterize the chemical space accessible to ADMET-associated proteins (“anti-targets”). It generates a comprehensive open library of experimental and structural datasets using recent advances in experimental and computational techniques.
  • Website: OpenADMET

AIRCHECK

  • Description: AIRCHECK is a platform that provides access to a large collection of high-quality datasets for drug discovery and development. The datasets are curated from various sources and are available in a standardized format. The current focus is on DNA encoded library (DEL) data.
  • Website: AIRCHECK

Polaris

  • Description: Polaris aims to improve the state of benchmarking so that machine learning can have a greater impact on real-world drug discovery scenarios. It provides a single source of truth that aggregates and provides simple access to datasets and benchmarks.
  • Website: Polaris

PLINDER

  • Description: PLINDER is an academic-industry collaboration driven by VantAI, NVIDIA, the Computational Structural Biology group at the University of Basel & SIB Swiss Institute of Bioinformatics, and MIT. It aims to provide a gold standard dataset and evaluations to push the field of computational protein-ligand interactions prediction forward.
  • Website: PLINDER
搜集汇总
数据集介绍
main_image_url
构建方式
在药物发现领域,OpenADMET项目致力于主动表征与ADMET相关蛋白质(即‘抗靶点’)可及的化学空间。通过整合实验和计算技术的最新进展,该项目旨在生成一个全面的开放式实验和结构数据集库。AIRCHECK平台则通过从多种来源精心筛选,提供高质量的药物发现和开发数据集,当前主要集中在DNA编码库(DEL)数据。Polaris项目旨在提升机器学习在实际药物发现场景中的应用效果,通过整合和简化数据集与基准的访问,提供一个单一的真实来源。PLINDER项目则由学术界和工业界合作推动,旨在提供一个黄金标准的数据集和评估体系,以推动计算蛋白质-配体相互作用预测领域的发展。
使用方法
OpenADMET数据集可用于研究ADMET相关蛋白质的化学空间,支持药物筛选和设计。AIRCHECK数据集适用于DNA编码库数据的分析和药物开发,可通过其平台直接访问。Polaris数据集适用于机器学习模型的训练和评估,通过其提供的单一来源简化数据集的使用。PLINDER数据集则适用于计算蛋白质-配体相互作用预测的研究,支持高标准的模型评估和算法开发。
背景与挑战
背景概述
在药物发现领域,机器学习技术的应用日益广泛,旨在通过数据驱动的方法加速新药的研发进程。OpenADMET项目致力于主动表征与ADMET相关蛋白(即“抗靶点”)可及的化学空间,通过整合实验与计算技术,构建一个全面的开放式实验与结构数据集。AIRCHECK平台则专注于提供高质量的药物发现与开发数据集,特别是DNA编码库(DEL)数据,以标准化格式呈现,促进数据的可访问性与利用率。Polaris项目旨在提升机器学习在真实世界药物发现场景中的影响力,通过提供统一的数据集与基准,改善当前的基准测试状态。PLINDER项目由学术界与工业界合作推动,旨在提供一个黄金标准数据集,以推动计算蛋白质-配体相互作用预测领域的发展。
当前挑战
OpenADMET项目面临的挑战包括如何有效整合实验与计算数据,确保数据的准确性与一致性。AIRCHECK平台需应对数据来源多样性带来的标准化问题,以及如何持续更新与扩充数据集以保持其前沿性。Polaris项目需解决数据集的多样性与复杂性,确保提供的基准能够真实反映药物发现的实际需求。PLINDER项目则需克服蛋白质-配体相互作用预测中的高维数据处理与模型泛化能力问题,以及如何确保数据集的权威性与广泛适用性。
常用场景
经典使用场景
在药物发现领域,OpenADMET数据集的经典使用场景主要集中在ADMET(吸收、分布、代谢、排泄和毒性)相关蛋白质的化学空间表征。通过整合实验和计算技术,该数据集为研究人员提供了一个全面的开放库,用于预测和优化药物分子的ADMET性质。AIRCHECK数据集则聚焦于DNA编码库(DEL)数据,为药物发现和开发提供了高质量的标准化数据,支持从分子筛选到候选药物的快速评估。Polaris数据集致力于提升机器学习在药物发现中的应用效果,通过提供统一的基准数据集,帮助研究人员在实际场景中验证和优化模型。PLINDER数据集则专注于计算蛋白质-配体相互作用预测,为学术界和工业界提供了一个黄金标准数据集,推动该领域的技术进步。
解决学术问题
OpenADMET数据集通过提供ADMET相关蛋白质的化学空间表征,解决了药物发现中分子性质预测的难题,显著提升了药物设计的效率和成功率。AIRCHECK数据集的标准化DNA编码库数据,为药物发现中的分子筛选和优化提供了可靠的数据支持,解决了实验数据不一致和重复性差的问题。Polaris数据集通过提供统一的基准数据集,解决了机器学习模型在药物发现应用中的验证和优化难题,推动了该领域的技术进步。PLINDER数据集则为计算蛋白质-配体相互作用预测提供了黄金标准数据,解决了该领域中模型预测准确性和可靠性不足的问题,具有重要的学术意义和影响。
实际应用
在实际应用中,OpenADMET数据集被广泛用于药物设计和优化,帮助制药公司快速筛选和优化具有良好ADMET性质的候选药物。AIRCHECK数据集的标准化DNA编码库数据,为药物发现中的分子筛选和优化提供了可靠的数据支持,加速了新药的开发进程。Polaris数据集的统一基准数据集,被广泛应用于机器学习模型的验证和优化,提升了药物发现中的模型预测准确性。PLINDER数据集则为计算蛋白质-配体相互作用预测提供了黄金标准数据,被广泛应用于药物设计、蛋白质工程和生物技术领域,推动了相关技术的实际应用和产业化。
数据集最近研究
最新研究方向
在药物发现领域,OpenADMET、AIRCHECK、Polaris和PLINDER等数据集的最新研究方向主要集中在利用机器学习技术来优化药物的ADMET(吸收、分布、代谢、排泄和毒性)特性。这些数据集通过整合实验和计算技术,致力于构建一个全面的开放式化学空间数据库,以支持药物发现过程中的反目标识别。此外,AIRCHECK平台专注于DNA编码库(DEL)数据的收集和标准化,为药物开发提供高质量的数据支持。Polaris则致力于通过提供统一的基准数据集,增强机器学习在实际药物发现场景中的应用效果。PLINDER则通过学术与工业界的合作,旨在提供一个金标准数据集,推动计算蛋白质-配体相互作用预测领域的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作