five

maomlab/B3DB

收藏
Hugging Face2025-08-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/maomlab/B3DB
下载链接
链接失效反馈
官方服务:
资源简介:
血脑屏障数据库(B3DB)是一个经过整理的数据库,包含了50个已发表资源中关于血脑屏障穿透的分类和数值测量数据。该数据集适用于表格分类和回归任务,涵盖了与化合物化学和生物学特性相关的各种配置和特征。

血脑屏障数据库(B3DB)是一个经过整理的数据库,包含了50个已发表资源中关于血脑屏障穿透的分类和数值测量数据。该数据集适用于表格分类和回归任务,涵盖了与化合物化学和生物学特性相关的各种配置和特征。
提供机构:
maomlab
原始信息汇总

Blood-Brain Barrier Database (B3DB)

数据集概述

B3DB 是一个从 50 个已发表资源中整理的关于血脑屏障渗透性的分类和数值测量数据集。

任务类别

  • 表格分类
  • 表格回归

标签

  • 化学
  • 生物学
  • 医学

数据集名称

Blood-Brain Barrier Database (B3DB)

数据集摘要

整理了 50 个已发表资源的血脑屏障渗透性的分类和数值测量数据。

引用

@article{ Meng_A_curated_diverse_2021, author = {Meng, Fanwang and Xi, Yang and Huang, Jinfeng and Ayers, Paul W.}, doi = {10.1038/s41597-021-01069-5}, journal = {Scientific Data}, number = {289}, title = {A curated diverse molecular database of blood-brain barrier permeability with chemical descriptors}, volume = {8}, year = {2021}, url = {https://www.nature.com/articles/s41597-021-01069-5}, publisher = {Springer Nature} }

数据集大小

  • 1K<n<10K

配置名称

  • B3DB_classification
  • B3DB_classification_extended
  • B3DB_regression
  • B3DB_regression_extended

配置详情

B3DB_classification

  • 特征:
    • NO. (int64)
    • compound_name (string)
    • IUPAC_name (string)
    • SMILES (string)
    • CID (float64)
    • logBB (float64)
    • BBB+/BBB- (class_label)
    • Inchi (string)
    • threshold (float64)
    • reference (string)
    • group (string)
    • comments (string)
    • ClusterNo (int64)
    • MolCount (int64)
  • 分割:
    • train: 5856 个样本, 656000 字节
    • test: 1951 个样本, 218640 字节

B3DB_classification_extended

  • 分割:
    • train: 5856 个样本, 76221824 字节
    • test: 1951 个样本, 25394344 字节

B3DB_regression

  • 特征:
    • NO. (int64)
    • compound_name (string)
    • IUPAC_name (string)
    • SMILES (string)
    • CID (string)
    • logBB (float64)
    • Inchi (string)
    • reference (string)
    • smiles_result (string)
    • group (string)
    • comments (float64)
    • ClusterNo (int64)
    • MolCount (int64)
  • 分割:
    • train: 795 个样本, 82808 字节
    • test: 263 个样本, 27480 字节

B3DB_regression_extended

  • 分割:
    • train: 795 个样本, 10347848 字节
    • test: 263 个样本, 3423336 字节
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集由50个已发表的资源组成,这些资源包含了对血脑屏障渗透性的分类和数值测量。数据集的构建方式是通过精心挑选和整合这些资源,以提供丰富多样的分子数据库。每个资源都经过严格的筛选和验证,以确保数据的准确性和可靠性。构建过程中,数据集被分为不同的配置,包括分类和回归任务,以满足不同研究的需求。
使用方法
使用B3DB数据集的方法相对简单。首先,用户可以根据自己的需求选择合适的配置,包括分类或回归任务。然后,用户可以通过提供的CSV文件访问训练集和测试集。每个CSV文件都包含了化合物的相关信息,包括化学描述符和渗透性标签。用户可以使用这些数据进行模型训练、验证和测试。此外,数据集还提供了详细的文档和说明,帮助用户更好地理解和使用数据集。
背景与挑战
背景概述
在药物研发领域,血脑屏障(BBB)是决定药物是否能够进入中枢神经系统并发挥作用的关键因素。B3DB(Blood-Brain Barrier Database)数据集的创建旨在为研究者提供一组关于药物化合物能否穿过BBB的详细数据。该数据集由Meng等人于2021年发表在《Scientific Data》期刊上,汇集了50个已发表的关于BBB渗透性的分类和数值测量资源。B3DB数据集的核心研究问题是如何利用化学描述符预测药物分子穿过BBB的能力,这对于药物设计和新药开发具有重要意义。该数据集的发布为相关领域的研究提供了宝贵资源,极大地推动了药物透过BBB的预测模型的研究进展。
当前挑战
B3DB数据集所面临的挑战主要在于如何准确预测药物分子穿过血脑屏障的能力。这一挑战不仅涉及到对药物分子的化学结构和性质的理解,还需要考虑BBB本身的复杂性和动态变化。此外,数据集构建过程中也遇到了如何整合不同来源的数据、确保数据一致性和准确性的挑战。为了应对这些挑战,研究人员采用了多种化学描述符,并利用了机器学习算法来预测药物分子的BBB渗透性。尽管如此,由于BBB的复杂性以及药物分子的多样性,预测模型仍需不断地优化和验证。
常用场景
经典使用场景
该数据集在药物发现和开发领域具有广泛的应用价值,尤其在评估药物分子是否能穿过血脑屏障方面。研究人员可以利用B3DB数据集训练模型,预测新分子是否能够穿透血脑屏障,从而在药物设计的早期阶段筛选出有潜力的候选药物。
解决学术问题
B3DB数据集为学术界提供了一个丰富的资源,用于研究影响血脑屏障渗透性的因素,并探索新的预测模型。通过分析数据集中的化学描述符和渗透性数据,研究者能够更好地理解分子结构和渗透性之间的关系,为设计具有更好穿透性的药物分子提供理论依据。
实际应用
在药物开发过程中,B3DB数据集可以帮助制药公司快速筛选出能够穿过血脑屏障的药物分子,从而提高药物开发的效率。此外,该数据集还可以用于教育和培训,帮助学生和专业人士更好地理解药物设计的原则和挑战。
数据集最近研究
最新研究方向
在神经科学和药物开发领域,血脑屏障的渗透性研究是至关重要的。B3DB数据集的发布为这一领域提供了丰富的资源,通过整合50个已发表的关于血脑屏障渗透性的分类和数值测量数据。这一数据集不仅为研究者提供了深入的化学和生物信息,而且也为开发预测模型以评估药物分子能否通过血脑屏障提供了基础。目前的研究方向主要集中在利用B3DB数据集构建和优化机器学习模型,以预测分子的血脑屏障渗透性。这些模型不仅有助于药物设计,而且在理解血脑屏障的功能机制方面具有重要意义。此外,结合B3DB数据集的最新研究还涉及到分子对接和虚拟筛选技术,以寻找新的药物候选物。这些研究不仅推动了药物传递系统的创新,而且对于治疗神经系统疾病和癌症等疾病具有深远的影响。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作