five

anthonyyazdaniml/CT-ADE-PT

收藏
Hugging Face2024-05-29 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/anthonyyazdaniml/CT-ADE-PT
下载链接
链接失效反馈
官方服务:
资源简介:
CT-ADE-PT是一个多标签分类数据集,旨在使用临床试验数据在MedDRA本体的首选术语(PT)级别预测药物不良事件(ADEs)。数据集包含15,640个实例,涉及2,497种唯一药物,并在MedDRA的PT级别进行注释。数据集被划分为12,736个训练实例、1,509个验证实例和1,395个测试实例。

The CT-ADE-PT is a multilabel classification dataset designed for predicting adverse drug events (ADEs) at the Preferred Term (PT) level of the MedDRA ontology using clinical trial data. The dataset consists of 15,640 instances, involving 2,497 unique drugs, and is annotated at the PT level. It is split into a training set (12,736 instances), a validation set (1,509 instances), and a test set (1,395 instances).
提供机构:
anthonyyazdaniml
搜集汇总
数据集介绍
main_image_url
构建方式
在药物安全监测领域,精准预测药物不良事件至关重要。CT-ADE-PT数据集基于临床试验数据构建,通过提取大量临床试验记录,并依据国际医学用语词典(MedDRA)的首选术语层级进行多标签标注,形成了包含15,640个实例的标准化语料。其构建过程严格遵循科学规范,确保了数据来源的可靠性与标注的一致性,为后续模型训练提供了高质量的基础。
使用方法
在应用层面,CT-ADE-PT数据集主要用于训练和评估多标签分类模型,以预测药物可能引发的不良事件。研究人员可加载预划分的数据分割,利用训练集进行模型参数学习,并通过验证集调整超参数,最终在测试集上评估模型性能。该数据集可直接通过HuggingFace平台或关联的GitHub仓库获取,支持标准化流程,助力药物安全领域的算法创新与实证研究。
背景与挑战
背景概述
在药物安全监测领域,精准预测药物不良反应(ADEs)是保障临床用药安全的核心议题。由Anthony Yazdani等人于2025年构建的CT-ADE-PT数据集,依托《Scientific Data》期刊发布,旨在利用临床试验数据,在医学词典MedDRA的优选术语(PT)层级实现多标签分类。该数据集由15,640个实例组成,涵盖2,497种独特药物,其构建工作由多机构研究团队完成,核心目标是通过结构化数据推动药物警戒的自动化分析,为药物安全评估提供标准化基准,显著提升了该领域模型训练的可靠性与可复现性。
当前挑战
CT-ADE-PT数据集致力于解决药物不良反应预测中的多标签分类挑战,其难点在于MedDRA术语体系层级复杂,需精准映射临床描述至PT层级,同时处理药物与多种不良反应间的高度不平衡关联。在构建过程中,研究团队面临临床试验数据非结构化、标注一致性维护以及跨药物类别样本代表性均衡等难题,这些因素共同构成了数据质量与模型泛化能力提升的关键障碍。
常用场景
经典使用场景
在药物安全监测领域,CT-ADE-PT数据集为预测临床试验中药物不良事件提供了关键资源。该数据集基于MedDRA本体论的优选术语级别,通过多标签分类任务,支持研究者从结构化临床数据中自动识别和归类特定药物可能引发的多种不良反应。其经典应用场景包括构建机器学习模型,以分析药物与不良事件之间的复杂关联,从而辅助早期风险预警系统的开发。
解决学术问题
该数据集有效解决了药物警戒研究中数据稀缺与标注标准不统一的学术挑战。通过提供大规模、高质量且基于MedDRA标准术语的标注数据,它促进了计算模型在不良事件预测任务上的可重复性与可比性。其意义在于为跨药物、跨临床试验的标准化评估建立了基准,推动了药物安全人工智能方法从理论探索向实证验证的过渡,对提升公共卫生决策的科学性具有深远影响。
实际应用
在实际应用中,CT-ADE-PT数据集被制药企业和监管机构用于增强药物安全监测流程。例如,它可以集成到自动化药物警戒平台中,帮助快速筛查临床试验报告中的潜在风险信号,优化药物上市后安全监测策略。此外,该数据集支持开发辅助工具,为临床医生和研究人员提供数据驱动的见解,以更高效地评估药物安全性,从而降低患者风险并加速安全药物的研发进程。
数据集最近研究
最新研究方向
在药物安全监测领域,基于临床试验数据的药物不良事件预测正成为前沿热点。CT-ADE-PT数据集通过MedDRA本体学中的首选术语层级标注,为多标签分类任务提供了精准的基准。当前研究聚焦于利用深度学习模型,如Transformer架构,从结构化临床数据中自动识别潜在的不良反应模式,以提升预测的准确性与泛化能力。这一方向不仅响应了监管机构对药物安全性的强化要求,也推动了人工智能在医疗决策支持系统中的实际应用,为早期风险预警和个性化用药策略的开发奠定了数据基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作