ZINC

Name: ZINC
Creator: OpenScienceLab
Published: 2026-05-31 09:30:23
License: 暂无描述

OpenDataLab2026-05-31 更新2024-05-09 收录

下载链接：

https://opendatalab.org.cn/OpenScienceLab/ZINC

下载链接

链接失效反馈

官方服务：

资源简介：

ZINC 是用于虚拟筛选的商用化合物的免费数据库。 ZINC 包含超过 2.3 亿种可购买的即用型 3D 格式化合物。 ZINC 还包含超过 7.5 亿种可购买的化合物，可用于搜索类似物。

ZINC is a free database of commercially available compounds for virtual screening. It contains over 230 million purchasable, ready-to-use 3D-format compounds. Additionally, it includes more than 750 million purchasable compounds that support analog searches.

提供机构：

OpenScienceLab

创建时间：

2022-08-19

搜集汇总

数据集介绍

构建方式

ZINC数据集的构建基于大规模的化学分子数据库，涵盖了超过250万个有机小分子。这些分子通过系统化的筛选和过滤，确保其化学结构和性质的多样性。构建过程中，采用了先进的化学信息学工具，对分子进行了详细的结构解析和属性计算，包括但不限于分子量、氢键供体和受体数量、可旋转键数等关键参数。此外，数据集还包含了分子的二维和三维结构表示，为分子模拟和药物设计提供了丰富的数据支持。

特点

ZINC数据集以其庞大的规模和多样性著称，为药物发现和化学研究提供了广泛的数据资源。其特点之一是包含了详细的分子属性信息，这些信息对于评估分子的生物活性和物理化学性质至关重要。此外，数据集中的分子结构以多种格式呈现，便于不同研究工具和平台的应用。ZINC数据集还定期更新，确保数据的时效性和准确性，使其成为化学和生物学领域研究的重要基石。

使用方法

ZINC数据集广泛应用于药物发现、化学合成和分子模拟等领域。研究人员可以通过访问ZINC数据库，筛选符合特定条件的分子，进行虚拟筛选和先导化合物优化。数据集的多样性使得其适用于各种研究需求，从基础的分子属性分析到复杂的药物设计。此外，ZINC数据集还支持与其他化学信息学工具的集成，如分子对接软件和机器学习算法，进一步提升了其在科学研究中的应用价值。

背景与挑战

背景概述

ZINC数据集，由美国国家卫生研究院（NIH）于2015年发布，旨在为药物发现领域提供一个大规模、高质量的化学分子库。该数据集包含了超过25万个小分子化合物的详细信息，包括其化学结构、物理化学性质以及生物活性数据。ZINC数据集的发布极大地推动了计算机辅助药物设计（CADD）的发展，使得研究人员能够更高效地筛选潜在的药物候选分子，从而加速新药的研发进程。

当前挑战

尽管ZINC数据集在药物发现领域具有重要意义，但其构建过程中也面临诸多挑战。首先，数据集的规模庞大，如何确保数据的准确性和一致性是一个巨大的挑战。其次，化学分子的多样性和复杂性使得数据的标准化和处理变得异常困难。此外，生物活性数据的获取和验证也是一个耗时且成本高昂的过程。这些挑战不仅影响了数据集的质量，也限制了其在实际应用中的效率和效果。

发展历史

创建时间与更新

ZINC数据集由John J. Irwin和Brian K. Shoichet于2005年创建，旨在为药物发现领域提供一个大规模的虚拟筛选库。该数据集定期更新，最近一次重大更新发生在2020年，以确保其内容的时效性和多样性。

重要里程碑

ZINC数据集的创建标志着虚拟筛选技术在药物发现中的重要突破。2005年，其首次发布即包含了超过13万个化合物，极大地扩展了研究者可用的化学空间。2012年，ZINC15的推出进一步提升了数据集的规模和质量，包含了超过1亿个化合物，成为全球最大的公共化合物库之一。这一里程碑事件不仅推动了药物发现的速度和效率，还促进了多学科交叉研究的发展。

当前发展情况

当前，ZINC数据集已成为药物发现和化学信息学领域的基石，支持了众多创新药物的研发。其持续的更新和扩展，确保了数据集在现代药物发现流程中的核心地位。ZINC不仅为学术界提供了丰富的资源，还通过与工业界的合作，推动了新药候选物的快速筛选和优化。此外，ZINC的开放获取政策促进了全球范围内的科研合作，为解决复杂疾病提供了新的可能性。

发展历程

ZINC数据集首次发表，由Irwin和Shoichet在Journal of Chemical Information and Modeling期刊上提出，旨在为虚拟筛选提供一个免费的、大规模的化合物库。
2005年
ZINC数据集首次应用于药物发现领域，特别是在虚拟筛选和分子对接研究中，显著提高了筛选效率和成功率。
2007年
ZINC数据集的规模扩展至超过13亿个化合物，成为当时全球最大的公开可用化合物库之一。
2012年
ZINC数据集引入了新的子集，如ZINC15，专门用于高通量筛选和机器学习模型的训练，进一步推动了药物发现的前沿研究。
2015年
ZINC数据集与多个国际研究机构合作，发布了多个特定领域的子集，如天然产物和药物类似物，丰富了数据集的应用范围。
2019年
ZINC数据集的最新版本ZINC20发布，包含超过23亿个化合物，继续保持其在虚拟筛选和药物发现领域的领先地位。
2021年

常用场景

经典使用场景

在药物发现领域，ZINC数据集被广泛用于虚拟筛选和分子设计。该数据集包含了超过2.3亿个有机小分子化合物的三维结构信息，为研究人员提供了一个丰富的资源库，用于探索潜在的药物候选分子。通过结合计算化学和机器学习技术，研究人员可以高效地筛选出具有特定生物活性的化合物，从而加速新药的研发进程。

衍生相关工作

ZINC数据集的广泛应用催生了众多相关研究工作。例如，基于ZINC数据集的分子指纹和描述符被用于开发新的机器学习模型，以预测化合物的生物活性和毒性。此外，ZINC数据集还促进了分子对接和分子动力学模拟技术的发展，使得研究人员能够更准确地模拟药物与靶标之间的相互作用。这些衍生工作不仅丰富了药物发现的方法学，还推动了计算化学和生物信息学领域的进步。

数据集最近研究