five

Endoscopy artifact detection (EAD 2019) challenge dataset

收藏
arXiv2019-05-09 更新2024-06-21 收录
下载链接:
https://ead2019.grand-challenge.org
下载链接
链接失效反馈
官方服务:
资源简介:
EAD 2019挑战数据集是由牛津大学等六个国际机构合作创建的大型多模态内窥镜视频数据集,旨在解决内窥镜视频中常见的多种图像伪影问题,如像素饱和、运动模糊等。数据集包含2147个标注帧,覆盖多种组织类型和成像模式,通过随机混合收集的数据确保了多样性。创建过程中,专家临床医生进行了详细的标注,确保了数据的质量和准确性。该数据集的应用领域广泛,包括但不限于提高内窥镜视频的质量,辅助疾病诊断和治疗,以及支持计算机辅助工具的开发,从而提升患者护理质量。

The EAD 2019 Challenge Dataset is a large-scale multimodal endoscopic video dataset co-created by six international institutions including the University of Oxford. It is designed to address various common image artifacts in endoscopic videos, such as pixel saturation and motion blur. The dataset contains 2147 annotated frames covering multiple tissue types and imaging modalities, with diversity ensured by randomly mixing the collected data. During its creation, expert clinicians performed detailed annotations to guarantee the quality and accuracy of the dataset. This dataset has a wide range of applications, including but not limited to improving the quality of endoscopic videos, assisting disease diagnosis and treatment, supporting the development of computer-aided tools, and thereby enhancing patient care quality.
提供机构:
牛津大学
创建时间:
2019-05-09
搜集汇总
数据集介绍
main_image_url
构建方式
在医学内窥镜影像分析领域,高质量的数据集对于推动计算机辅助诊断工具的发展至关重要。EAD 2019数据集的构建始于对临床实际需求的深入识别,由两位临床专家初步标注了七类常见内窥镜影像伪影的边界框,以此作为参考标准。随后,两位经验丰富的博士后研究员将标注扩展至整个训练与测试集,并最终由临床内镜专家进行验证以确保标注的准确性。数据来源于全球六个医疗中心,涵盖了多种组织类型、成像模式及患者群体,通过随机混合采集的视频帧构建而成,确保了数据的多样性与代表性。
特点
该数据集的核心特征在于其全面性与临床针对性。它不仅覆盖了像素饱和、运动模糊、镜面反射、气泡及碎屑等多种内窥镜影像中常见的伪影类型,还提供了详尽的边界框与语义分割标注。数据集的多元性体现在其多中心、多组织、多模态的来源,以及跨患者、跨人群的样本构成,这为算法在不同临床场景下的泛化能力评估提供了坚实基础。此外,数据集特别设计了泛化测试集,使用来自未参与训练的中心数据,专门用于评估模型在新环境下的适应能力。
使用方法
该数据集主要服务于三个核心任务:多类别伪影检测、语义分割以及算法泛化能力评估。研究者可利用提供的训练集开发机器学习模型,并通过在线评估平台对模型在独立测试集上的性能进行量化。评估指标综合了交并比(IoU)与平均精度均值(mAP)等经典度量,旨在全面衡量检测与分割的准确性。对于泛化任务,模型需在未见过的机构数据上进行测试,其性能差距被用于排名,鼓励开发具有强泛化能力的稳健算法。开源工具的支持进一步便利了数据的访问与处理。
背景与挑战
背景概述
内窥镜影像分析在癌症早期诊断与微创手术中扮演关键角色,然而视频帧中普遍存在的多种成像伪影严重阻碍了后续定量分析的准确性。为应对这一瓶颈问题,牛津大学等六家国际机构的研究团队于2019年共同构建了内窥镜伪影检测挑战数据集。该数据集汇集了来自不同国家、多组织类型与成像模态的内窥镜视频帧,旨在通过精准检测像素饱和、运动模糊、镜面反射等七类常见伪影,推动高质量帧恢复技术的发展,从而为计算机辅助诊断工具的实现奠定基础。
当前挑战
该数据集致力于解决内窥镜影像中多类别伪影的检测与分割问题,其核心挑战在于伪影形态的多样性与不规则性,例如镜面反射区域分散且边界模糊,导致传统矩形检测框难以精确刻画。构建过程中的挑战主要体现在标注一致性维护上,不同专家对模糊、对比度等主观性较强的伪影类别存在标注差异,需通过精细化协议与加权评分机制予以调和。此外,数据集的跨中心泛化要求算法能够适应不同设备与采集协议带来的分布差异,这对模型的鲁棒性与泛化能力提出了更高要求。
常用场景
经典使用场景
在医学影像分析领域,内窥镜视频帧常受多种伪影干扰,如像素饱和、运动模糊和镜面反射等,严重影响诊断质量。EAD 2019数据集通过提供多中心、多模态的内窥镜图像,成为评估和开发伪影检测算法的基准平台。该数据集广泛应用于计算机视觉任务,特别是多类别伪影的检测与分割,为研究人员提供了标准化的训练与测试环境,推动了内窥镜图像质量自动评估技术的发展。
解决学术问题
该数据集解决了内窥镜影像中多类别伪影同时检测与定位的核心学术难题。传统方法往往仅针对单一伪影类别,难以应对实际视频帧中多种伪影共存的情况。通过提供精确的边界框标注和语义分割掩码,EAD 2019促进了机器学习模型在复杂场景下的性能优化,为视频帧恢复、三维重建等定量分析任务奠定了数据基础,显著提升了计算机辅助诊断系统的可靠性。
衍生相关工作
基于EAD 2019数据集,学术界涌现了一系列经典研究工作。例如,结合深度学习的多任务网络被开发用于同时完成伪影检测与分割,提升了模型的综合性能。此外,迁移学习与域自适应方法利用该数据集的多中心特性,增强了算法在不同医疗机构数据上的泛化能力。这些衍生工作进一步拓展了内窥镜影像分析的边界,为后续大规模临床部署奠定了算法基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作