five

DRAGON benchmark

收藏
github2025-02-25 更新2025-02-21 收录
下载链接:
https://github.com/DIAGNijmegen/dragon_sample_reports
下载链接
链接失效反馈
官方服务:
资源简介:
DRAGON benchmark是基于真实案例的开发数据集,经过人工匿名化处理以保护患者隐私。报告中的保护健康信息(PHI)已被替代,因此报告中的信息看起来可能是真实的,但与现实人物(无论生死)的相似性纯粹是巧合。如果报告在诊断上看起来不合理,这可能是匿名化过程的结果。

The DRAGON benchmark is a development dataset based on real clinical cases, which has undergone manual anonymization to protect patient privacy. Protected Health Information (PHI) in the reports has been replaced, so although the information in the reports may appear realistic, any similarity to real individuals, living or deceased, is purely coincidental. If a report appears diagnostically unreasonable, this may be a consequence of the anonymization process.
创建时间:
2025-02-20
原始信息汇总

DRAGON Sample Reports

数据集概述

  • 数据集名称:DRAGON Sample Reports
  • 数据集描述:该数据集包含基于DRAGON开发数据中的真实案例制作的样本报告。这些报告经过手动匿名化处理,以保护患者隐私。
  • 隐私保护:报告中的受保护健康信息(PHI)已被替代,报告内容看起来可能真实,但与现实个人的相似性完全是巧合。如果报告在诊断上显得不可信,可能是匿名化过程的结果。

数据集内容

  • 样本报告类型
    • T1:Adhesion presence
    • T2:Pulmonary nodule presence
    • T3:Kidney abnormality identification
    • T4:Skin histopathology case selection
    • T5:RECIST timeline
    • T6:Histopathology cancer origin
    • T7:Pulmonary nodule size presence
    • T8:PDAC size presence
    • T9:PDAC diagnosis
    • T10:Prostate radiology suspicious lesions
    • T11:Prostate histopathology significant cancers
    • T12:Histopathology tissue type
    • T13:Histopathology tissue origin
    • T14:Entailment diagnostic sentences
    • T15:Colon histopathology diagnosis
    • T16:RECIST lesion size presence
    • T17:PDAC attributes
    • T18:Hip Kellgren-Lawrence scoring
    • T19:Prostate volume measurement
    • T20:Prostate specific antigen measurement
    • T21:Prostate specific antigen density measurement
    • T22:PDAC size measurement
    • T23:Pulmonary nodule size measurement
    • T24:RECIST lesion size measurements
    • T25:Anonymization
    • T26:Medical terminology recognition
    • T27:Prostate biopsy sampling
    • T28:Skin histopathology diagnosis

联系方式

  • 联系人:Joeran.Bosma@radboudumc.nl
搜集汇总
数据集介绍
main_image_url
构建方式
DRAGON Sample Reports数据集的构建,基于DRAGON开发数据中的实际案例。这些案例经过人工匿名化处理,以保护患者隐私,同时对报告中的受保护健康信息(PHI)进行了替换,确保报告中信息的真实性,同时避免了与真实个人的巧合相似。
特点
该数据集的特点在于其涵盖了多种医疗影像诊断任务,包括但不限于粘连存在、肺结节、肾脏异常、皮肤组织病理学案例选择等。每项任务均有相应的样本报告,且所有报告均经过匿名化处理,以保护患者隐私。此外,数据集中的信息经过了严格的脱敏处理,确保了隐私安全。
使用方法
使用DRAGON Sample Reports数据集时,用户可以通过访问提供的链接获取各个任务的样本报告。数据集适用于多种机器学习任务,包括分类、实体识别等。用户需根据具体的任务需求,对报告内容进行相应的处理和标注,以训练和评估模型性能。
背景与挑战
背景概述
DRAGON Sample Reports数据集,是由荷兰拉德堡德大学医学中心的研究团队所构建,旨在为医学影像分析及报告生成领域提供基准测试。该数据集的创建时间是近年,其核心研究问题聚焦于如何通过自动化的方式准确识别和处理医学影像报告中的各类信息,包括病患的病变特征、肿瘤诊断等。数据集基于真实病例,经过人工匿名化处理,以保护患者隐私,对相关领域如医学影像诊断、自然语言处理等产生了重要影响。
当前挑战
该数据集在构建和应用过程中面临的挑战包括:确保数据隐私和匿名化的有效性,以避免泄露患者个人信息;提高数据标注的准确性,确保各类病变和诊断信息的正确提取和分类;以及如何设计更为精确的算法来处理复杂多变的医学语言和术语。此外,数据集在解决领域问题,如病变检测、肿瘤诊断等时,还需克服模型泛化能力不足、数据处理和解释的透明度等挑战。
常用场景
经典使用场景
在医学影像解析与临床决策支持系统中,DRAGON Sample Reports数据集的典型应用场景在于,其提供了标注详尽的医疗报告样本,这些样本为研究者构建和训练自然语言处理模型提供了基准。通过该数据集,研究者能够开发出自动化解析医疗报告、提取关键诊断信息的算法,进而辅助医生进行病情评估和治疗方案制定。
衍生相关工作
基于DRAGON Sample Reports数据集,学术界衍生出了一系列相关研究工作。这些工作不仅包括对数据集本身的进一步标注和扩充,还涉及开发新的算法模型以应对数据集中的挑战,如深度学习在医疗报告解析中的应用,以及跨语言和跨模态的医疗信息融合等。
数据集最近研究
最新研究方向
在医学影像解析与报告中,DRAGON Sample Reports数据集为研究人员提供了一个宝贵的资源。该数据集最新研究方向集中于深度学习在放射学报告生成、诊断决策支持以及医疗实体识别中的应用。前沿研究正致力于提高对肺结节、肾脏异常、皮肤病例选择、肿瘤起源、PDAC诊断、前列腺病变检测等方面的自动化识别与准确度。此外,通过RECIST标准的病变时间线追踪、病变大小测量等任务,研究推动着精准医疗的发展。在自然语言处理领域,该数据集促进了医疗术语识别、匿名化实体识别等技术的进步,对于提升医疗报告的质量和患者隐私保护具有重要意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作