HODDI (High-Order Drug-Drug Interaction Dataset)
收藏arXiv2025-02-10 更新2025-02-12 收录
下载链接:
https://github.com/TIML-Group/HODDI
下载链接
链接失效反馈官方服务:
资源简介:
HODDI是一个专注于高阶药物相互作用的数据集,由美国食品药品监督管理局(FDA)的不良事件报告系统(FAERS)记录构建而成,包含过去十年的109,744条记录,涉及2,506种独特药物和4,569种独特不良反应。数据集通过严谨的数据清洗和条件过滤,专门针对并发用药情况,旨在研究多种药物组合对不良反应的联合影响。HODDI数据集为药物安全性和个性化医疗领域的研究提供了宝贵资源。
HODDI is a dataset dedicated to high-order drug-drug interactions. It is constructed using records from the Adverse Event Reporting System (FAERS) of the U.S. Food and Drug Administration (FDA), encompassing 109,744 records collected over the past decade, involving 2,506 distinct drugs and 4,569 unique adverse reactions. Following rigorous data cleaning and conditional filtering, this dataset specifically targets concurrent medication scenarios, with the goal of investigating the combined impacts of multi-drug combinations on adverse reactions. The HODDI dataset serves as a valuable resource for research in the domains of drug safety and personalized medicine.
提供机构:
伊利诺伊理工学院, 北卡罗来纳大学教堂山分校, 哈佛医学院
创建时间:
2025-02-10
搜集汇总
数据集介绍

构建方式
HODDI数据集构建于美国食品药品监督管理局(FDA)的不良事件报告系统(FAERS)记录,跨越了过去十年的数据。数据集包含了109,744条记录,涉及2,506种独特的药物和4,569种独特的副作用。构建过程中,研究者从FAERS数据库中提取了关键信息,包括报告ID、副作用名称和标准化的药物名称及其药物角色。随后,通过条件筛选,研究者专注于共给药的药物案例,以便研究它们对不良反应的组合影响。为了消除数据冗余,研究者移除了重复记录并检查了超集关系。此外,为了维持数据集中药物组合的最小完整集表示,研究者采用了减少策略,从而提高了计算效率并降低了数据集中的噪声。
使用方法
HODDI数据集的使用方法包括多模型评估和特征构建。为了验证数据集的适用性和泛化能力,研究者测试了包括多层感知器(MLP)、传统图神经网络(GCN、GAT)和超图架构在内的不同深度学习架构。特征构建方面,药物使用SMILES2Vec模型进行编码,而副作用则使用SapBERT模型进行编码。数据结构方面,MLP模型的输入数据由平均药物特征和相应的副作用特征向量组成。对于传统图神经网络,研究者构建了由药物-药物相互作用边和药物-副作用因果关系边组成的异构图。对于超图神经网络,研究者构建了超边,每个超边连接多个与同一副作用相关的药物节点,从而有效地捕获药物共现关系。通过这些方法,HODDI数据集可以用于研究和预测复杂的药物-药物相互作用。
背景与挑战
背景概述
药物副作用研究对于理解复杂多药治疗中出现的副作用至关重要。然而,缺乏能够捕捉多种药物组合效应的高阶数据集严重限制了该领域的研究进展。现有的资源,如TWOSIDES,主要关注成对相互作用。为了填补这一关键空白,我们介绍了HODDI,这是第一个高阶药物-药物相互作用数据集,它由美国食品药品监督管理局(FDA)不良事件报告系统(FAERS)过去十年的记录构建而成,以推动计算药物警戒。HODDI包含109,744条记录,涉及2,506种独特的药物和4,569种独特的副作用,专门设计用于捕捉多药物相互作用及其对副作用的整体影响。全面的统计分析证明了HODDI的广泛覆盖和稳健的统计分析指标,使其成为研究高阶药物关系的宝贵资源。使用多种模型评估HODDI,我们发现简单的多层感知器(MLP)可以优于图模型,而超图模型在捕捉复杂的多药物相互作用方面表现出色,进一步验证了HODDI的有效性。我们的研究结果强调了高阶信息在药物副作用预测中的内在价值,并将HODDI定位为推动药物警戒、药物安全和个性化医疗研究进展的基准数据集。数据集和代码可在https://github.com/TIML-Group/HODDI上获得。
当前挑战
HODDI数据集面临的挑战包括:1)所解决的领域问题(例如:ImageNet数据集解决的领域问题是图像分类)的挑战;2)构建过程中所遇到的挑战。HODDI旨在捕捉高阶药物-药物相互作用,这在药物警戒和药物安全性研究中是一个复杂的领域,需要精确的数据和强大的分析工具。构建这样的数据集需要从大量的原始数据中提取和过滤出有用的信息,这是一个耗时的过程。此外,由于药物组合的数量随着药物种类的增加呈指数级增长,数据稀疏性是一个关键问题。现有的大多数数据集和计算方法主要关注单一药物或两种药物的相互作用,而在多药治疗场景中,捕捉高阶药物相互作用的能力仍然有限。为了克服这些挑战,研究人员需要开发新的计算方法,这些方法能够有效地处理高维数据并捕捉药物之间复杂的非线性关系。此外,需要进一步的研究来评估HODDI数据集在不同药物警戒和药物安全性研究中的应用,以确保其准确性和可靠性。
常用场景
经典使用场景
HODDI数据集主要用于计算药理学的药效监护,特别是研究药物之间的复杂相互作用及其对不良反应的集体影响。该数据集从美国食品药品监督管理局(FDA)的不良事件报告系统(FAERS)记录中构建,包含10年来的109,744条记录,涉及2,506种独特的药物和4,569种独特的副作用。通过使用HODDI数据集,研究人员可以更深入地了解药物之间的相互作用,以及它们如何共同影响不良反应,从而为药物安全性评估和个性化医疗提供支持。
解决学术问题
HODDI数据集解决了当前药物副作用研究中高阶药物-药物相互作用数据稀缺的问题。现有的资源如TWOSIDES主要关注成对相互作用,而HODDI数据集则专注于捕捉多药物相互作用及其对不良反应的集体影响。通过使用HODDI数据集,研究人员可以更全面地了解药物之间的相互作用,以及它们如何共同影响不良反应,从而为药物安全性评估和个性化医疗提供支持。
实际应用
HODDI数据集的实际应用场景包括药物开发、药效监护、药物安全性评估和个性化医疗。通过使用HODDI数据集,研究人员可以更深入地了解药物之间的相互作用,以及它们如何共同影响不良反应,从而为药物安全性评估和个性化医疗提供支持。
数据集最近研究
最新研究方向
在药物副作用研究这一重要领域中,HODDI数据集的推出填补了高阶药物相互作用数据集的空白。HODDI数据集的构建基于美国食品药品监督管理局(FDA)不良事件报告系统(FAERS)记录,旨在促进计算药物警戒的发展。该数据集包含109,744条记录,涉及2,506种独特药物和4,569种独特副作用,旨在捕捉多药物相互作用及其对不良反应的集体影响。通过对HODDI的全面统计分析,展示了其广泛的覆盖范围和强大的分析指标,使其成为研究高阶药物关系的重要资源。使用多种模型评估HODDI,我们发现简单的多层感知器(MLP)可以优于图模型,而超图模型在捕捉复杂的多药物相互作用方面表现出色,进一步验证了HODDI的有效性。我们的研究强调了高阶信息在药物副作用预测中的内在价值,并将HODDI定位为推动药物警戒、药物安全和个性化医疗研究的基准数据集。
相关研究论文
- 1HODDI: A Dataset of High-Order Drug-Drug Interactions for Computational Pharmacovigilance伊利诺伊理工学院, 北卡罗来纳大学教堂山分校, 哈佛医学院 · 2025年
以上内容由遇见数据集搜集并总结生成



