DrugBank dataset
收藏github2024-05-04 更新2024-05-31 收录
下载链接:
https://github.com/Dainanahan/dbdataset
下载链接
链接失效反馈官方服务:
资源简介:
包含从DrugBank XML数据库解析出的不同tibbles的数据包,用于方便地探索和分析DrugBank数据库的内容,并协助药物发现工作。
This dataset package contains various tibbles parsed from the DrugBank XML database, designed to facilitate the exploration and analysis of DrugBank database content, and to assist in drug discovery efforts.
创建时间:
2019-04-23
原始信息汇总
数据集概述
dbdataset 是一个数据集包,包含多个tibble,这些tibble是从DrugBank数据库解析得到的。数据集通过dbparser R包从DrugBank的XML数据库中提取。
该数据集主要用于方便地探索和分析DrugBank数据库的内容,并辅助利用DrugBank数据库进行药物发现的研究。此外,它还适用于机器学习领域的多个子领域,包括:
- 自然语言处理(NLP)
- 网络爬虫
- 数据可视化
安装方法
由于包的大小超过了CRAN设定的限制,目前仅在Github上托管。可以通过以下命令进行安装:
r devtools::install_github("interstellar-Consultation-Services/dbdataset")
安装后,通过运行以下命令可以访问数据集:
r library(dbdataset)
使用版本
- dbparser: 2.0.3
- Drugbank: 5.1.12
搜集汇总
数据集介绍

构建方式
DrugBank数据集通过dbparser R包从DrugBank XML数据库中解析而来,构建过程依赖于自动化工具对原始数据进行提取和整理。该数据集包含了多个tibble表格,涵盖了DrugBank数据库中的各类信息,为研究者提供了便捷的数据访问途径。
特点
该数据集的主要特点在于其全面性和结构化,涵盖了药物的详细信息,包括化学性质、药理作用、临床应用等。此外,数据集的格式便于在R环境中直接使用,支持多种数据分析和机器学习任务,如自然语言处理、网页抓取和数据可视化。
使用方法
用户可通过devtools包从GitHub安装dbdataset,并在R环境中加载该包以访问数据集。安装完成后,用户可直接调用数据集中的tibble表格进行数据探索、分析或机器学习模型的构建。该数据集特别适用于药物发现和相关领域的研究。
背景与挑战
背景概述
DrugBank数据集源自于DrugBank数据库,该数据库是一个全面且权威的药物信息资源,涵盖了药物的化学、药理学、生物学等多方面信息。该数据集通过dbparser R包从DrugBank XML数据库中解析而来,旨在为药物发现研究提供便捷的数据访问途径。其创建时间可追溯至DrugBank数据库的早期版本,主要研究人员或机构包括DrugBank团队及相关的生物信息学研究者。该数据集的核心研究问题涉及药物的分类、作用机制、相互作用等,对药物研发、机器学习等领域具有深远的影响力。
当前挑战
DrugBank数据集在构建过程中面临诸多挑战。首先,数据解析的复杂性源于DrugBank XML数据库的庞大结构和多样化的信息类型,这要求高效的解析工具和算法。其次,数据集的规模和多样性为机器学习应用带来了挑战,尤其是在自然语言处理(NLP)和数据可视化领域,如何有效地提取和利用这些信息成为一个关键问题。此外,由于数据集的体积较大,其在存储和分发上也面临技术限制,目前仅通过GitHub进行托管。
常用场景
经典使用场景
DrugBank数据集在药物发现领域中具有广泛的应用,尤其是在药物信息分析和探索方面。该数据集通过解析DrugBank XML数据库,提供了丰富的药物相关信息,包括药物的化学结构、作用机制、适应症等。这些信息为研究人员提供了便捷的工具,用于深入分析药物的特性及其潜在的临床应用。此外,该数据集还可用于机器学习领域,如自然语言处理(NLP)、网络爬虫和数据可视化,从而支持更复杂的药物相关研究。
解决学术问题
DrugBank数据集解决了药物发现过程中信息获取和处理的难题。通过提供结构化的药物数据,该数据集帮助研究人员快速获取和分析药物的详细信息,从而加速药物筛选和设计过程。此外,该数据集在机器学习领域的应用,如通过NLP技术分析药物文献或通过可视化技术展示药物作用机制,进一步推动了药物发现和开发的学术研究。
衍生相关工作
基于DrugBank数据集,许多相关研究工作得以展开。例如,研究人员利用该数据集开发了药物相互作用预测模型,通过机器学习算法分析药物之间的潜在相互作用,从而提高药物使用的安全性。此外,该数据集还促进了药物靶点识别和药物设计算法的发展,为新药研发提供了重要的数据支持。在自然语言处理领域,DrugBank数据集也被用于药物文献的自动摘要和信息提取,进一步推动了药物信息学的发展。
以上内容由遇见数据集搜集并总结生成



