Pharmacovigilance Dataset
收藏github2024-08-23 更新2024-08-24 收录
下载链接:
https://github.com/niuniular/MDDC
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于模拟药物警戒场景,包含不良事件和药物的配对信息,以及相关的报告案例数。数据集以$I imes J$的列联表形式呈现,其中$I$表示不良事件总数,$J$表示药物总数,$n_{ij}$表示对应于第$j$种药物和第$i$种不良事件的报告案例总数。
This dataset is developed for simulating pharmacovigilance scenarios, and contains paired information between adverse events and drugs as well as the number of associated reported cases. It is presented in the form of an $I imes J$ contingency table, where $I$ denotes the total number of adverse events, $J$ denotes the total number of drugs, and $n_{ij}$ represents the total number of reported cases corresponding to the $j$-th drug and the $i$-th adverse event.
创建时间:
2024-08-08
原始信息汇总
数据集概述
简介
- 本数据集包含Modified Detecting Deviating Cells (MDDC)算法,用于识别不良事件。
- 数据集提取自安全数据库中的自发报告,并表示为一个$I imes J$的列联表,其中:
- $I$表示不良事件(AEs)的总数
- $J$表示药物的总数
- $n_{ij}$表示对应于第$j$种药物和第$i$种不良事件的报告病例总数
- 数据集关注哪些(AE, 药物)对是信号,这些信号指的是可能由药物引起的潜在不良事件。
- 在列联表设置中,信号指的是$n_{ij}$异常高于预期值的单元格。
- 本数据集基于Rousseeuw和Bossche (2018)提出的Detecting Deviating Cells (DDC)算法,并针对药物警戒中不良事件数据的离散性质进行了修改。
算法特点
- 易于计算。
- 考虑不良事件关系。
- 依赖数据驱动的截止值。
算法步骤
- MDDC算法包括五个步骤,前两个步骤通过截止值识别单变量异常值,后三个步骤通过使用不良事件相关性评估信号。
作者
-
Anran Liu Email: anranliu@buffalo.edu
-
Raktim Mukhopadhyay Email: raktimmu@buffalo.edu
-
Marianthi Markatou Email: markatou@buffalo.edu
维护者
-
Anran Liu Email: anranliu@buffalo.edu
-
Raktim Mukhopadhyay Email: raktimmu@buffalo.edu
文档
资助信息
- 本工作得到Kaleida Health Foundation、Food and Drug Administration和University at Buffalo的Department of Biostatistics的支持。
参考文献
- Rousseeuw, P. J., & Bossche, W. V. D. (2018). Detecting deviating data cells. Technometrics, 60(2), 135-145.
搜集汇总
数据集介绍

构建方式
在药理学领域,Pharmacovigilance Dataset的构建基于Modified Detecting Deviating Cells (MDDC)算法,该算法旨在识别药物或疫苗与不良事件之间的潜在关联。数据集通过从安全数据库中提取特定时间段内的自发报告,形成一个$I imes J$的列联表,其中$I$表示不良事件的总数,$J$表示药物或疫苗的总数。每个单元格$n_{ij}$代表对应药物或疫苗与不良事件的报告案例数。MDDC算法经过修改,以适应不良事件数据的离散性,通过五个步骤识别异常高的$n_{ij}$值,从而标记潜在的信号。
特点
Pharmacovigilance Dataset的显著特点在于其基于MDDC算法的创新性应用,该算法不仅易于计算,还考虑了不良事件之间的关系,并依赖于数据驱动的截止值。此外,该数据集独立于本体论的使用,确保了其广泛的适用性和灵活性。通过识别列联表中的异常单元格,数据集能够有效捕捉药物或疫苗与不良事件之间的潜在关联,为药理学研究提供了宝贵的资源。
使用方法
使用Pharmacovigilance Dataset时,研究者首先需访问其GitHub页面,获取数据集和相关算法文档。数据集以列联表形式呈现,研究者可通过MDDC算法进行分析,识别潜在的不良事件信号。具体步骤包括加载数据、应用MDDC算法进行信号检测,并根据结果进行进一步的药理学分析。为确保算法的正确应用,建议参考提供的文档和示例代码,同时遵循数据集的许可协议进行引用和使用。
背景与挑战
背景概述
在药物警戒领域,识别药物或疫苗引起的潜在不良事件(Adverse Events, AEs)是至关重要的。Pharmacovigilance Dataset由Anran Liu、Raktim Mukhopadhyay和Marianthi Markatou等研究人员于2024年创建,旨在通过Modified Detecting Deviating Cells (MDDC)算法,从自发报告的安全数据库中提取并分析不良事件数据。该数据集的核心研究问题是如何有效识别与特定药物或疫苗相关的不良事件信号,从而为药物安全性评估提供科学依据。此数据集的开发不仅提升了药物警戒领域的数据分析能力,还为相关研究提供了新的工具和方法。
当前挑战
Pharmacovigilance Dataset在构建过程中面临多项挑战。首先,不良事件数据的离散性和非正态分布特性使得传统的多元正态分布假设下的异常检测算法难以适用。其次,数据集需要处理大量的自发报告,这些报告可能包含噪声和冗余信息,增加了信号识别的复杂性。此外,数据集的构建还需考虑不良事件之间的相关性,以确保识别出的信号具有高度的准确性和可靠性。最后,数据集的实际应用中,如何有效地将算法应用于大规模数据处理,以及如何确保算法的计算效率和可扩展性,也是亟待解决的问题。
常用场景
经典使用场景
在药物警戒领域,Pharmacovigilance Dataset 主要用于识别药物或疫苗与不良事件(AE)之间的潜在关联。通过构建一个 $I imes J$ 的列联表,其中 $I$ 表示不良事件的总数,$J$ 表示药物或疫苗的总数,数据集能够量化每种药物或疫苗与特定不良事件的关联强度。利用 Modified Detecting Deviating Cells (MDDC) 算法,研究者可以识别出那些报告数量异常高于预期的单元格,从而发现潜在的药物不良反应信号。
衍生相关工作
Pharmacovigilance Dataset 的引入催生了一系列相关研究和工作。例如,Liu 等人(2024)基于该数据集开发了 MDDC 算法,进一步优化了不良事件的识别过程。此外,该数据集还被用于验证其他信号检测算法的性能,推动了药物警戒领域的技术进步。这些衍生工作不仅丰富了药物警戒的研究工具,也为未来的算法改进和应用拓展提供了坚实的基础。
数据集最近研究
最新研究方向
在药物警戒领域,Pharmacovigilance Dataset的最新研究方向聚焦于通过改进的异常细胞检测(MDDC)算法来识别潜在的不良事件信号。该算法通过分析药物与不良事件之间的关联性,识别出那些报告数量异常高于预期的组合,从而揭示可能的药物副作用。这一研究不仅提升了药物安全监测的效率,还为药物开发和监管提供了重要的数据支持,有助于及时发现和预防潜在的药物风险。
以上内容由遇见数据集搜集并总结生成



