five

ChestX-Det10

收藏
arXiv2020-10-19 更新2024-06-21 收录
下载链接:
https://github.com/Deepwise-AILab/ChestX-Det10-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
ChestX-Det10是由深度求索人工智能基础技术研究有限公司创建的胸部X光数据集,专注于胸部异常的实例级检测。该数据集包含约3,500张图像,每张图像都有10种常见疾病的框级标注。数据集从NIH ChestX-14中精选而出,并由三位认证放射科医生进行标注,确保覆盖广泛的疾病表现。ChestX-Det10旨在推动胸部X光疾病分类和定位的研究,特别适用于临床环境中的自动诊断需求。

ChestX-Det10 is a chest X-ray dataset developed by DeepSeek AI Basic Technology Research Co., Ltd., which focuses on instance-level detection of thoracic abnormalities. This dataset comprises approximately 3,500 images, each with bounding-box annotations for 10 common diseases. Curated from the NIH ChestX-14 dataset, it was annotated by three board-certified radiologists to ensure comprehensive coverage of diverse disease presentations. ChestX-Det10 is designed to promote research on chest X-ray disease classification and localization, and is particularly tailored to meet automated diagnostic requirements in clinical environments.
提供机构:
深度求索人工智能基础技术研究有限公司
创建时间:
2020-06-17
搜集汇总
数据集介绍
main_image_url
构建方式
ChestX-Det10数据集的构建基于NIH ChestX-14数据集,精选了3,543张胸片图像,并由三位经过认证的放射科医生进行标注。这些医生分为两组:委员会和裁判。委员会由两位医生组成,他们独立地对每张图像进行标注,彼此之间互不知晓对方的标注结果。裁判则是最有经验的放射科医生,负责从委员会的标注中选择并可能添加额外的标注。这种多层次的标注过程确保了数据集的高质量,并生成了用于训练和测试的‘黄金标准’标注。
特点
ChestX-Det10数据集的显著特点在于其包含了10种常见胸腔异常的实例级标注,涵盖了从肺不张到气胸等多种疾病。数据集不仅在图像数量上具有规模,而且在疾病表现的多样性上也进行了广泛的覆盖,确保了模型训练的全面性。此外,数据集的划分包括3,001张训练图像和542张测试图像,这种划分方式有助于评估模型在实际应用中的性能。
使用方法
ChestX-Det10数据集主要用于胸片图像中胸腔异常的检测研究。研究者可以使用该数据集训练基于深度学习的检测模型,如Faster R-CNN与FPN结合的模型。在训练过程中,建议采用随机梯度下降(SGD)优化算法,并根据数据集提供的详细统计信息调整模型参数。测试阶段,可以通过AP50等指标评估模型的检测性能,并根据实际需求调整模型的召回率和假阳性率。
背景与挑战
背景概述
在医学影像分析领域,胸部X光图像的自动诊断技术日益受到重视。ChestX-Det10数据集由Deepwise AI Lab的Jingyu Liu、Jie Lian和Yizhou Yu创建,旨在推动胸部X光图像中胸腔异常的实例级检测研究。该数据集包含了约3,500张图像,涵盖10种常见疾病或异常的边界框标注,这些标注由三位认证放射科医生独立完成,并经过资深放射科医生的审核,确保了标注的高质量。ChestX-Det10的发布填补了胸部X光图像实例级检测数据集的空白,为相关研究提供了新的基准,有望显著提升胸部疾病自动诊断的准确性和实用性。
当前挑战
尽管ChestX-Det10数据集在胸部X光图像的实例级检测方面取得了显著进展,但仍面临若干挑战。首先,数据集的标注过程复杂且耗时,涉及多位放射科医生的独立标注和资深医生的审核,这增加了数据集构建的成本和时间。其次,胸部X光图像中疾病或异常的多样性和复杂性使得检测任务极具挑战性,尤其是在不同角度、亮度和扫描条件下,疾病的外观变化较大。此外,数据集的规模相对较小,可能限制了深度学习模型在实际应用中的泛化能力。最后,尽管数据集提供了详细的标注和统计信息,但如何在临床环境中有效利用这些信息,仍需进一步研究和验证。
常用场景
经典使用场景
在医学影像分析领域,ChestX-Det10数据集因其丰富的实例级标注和多样的疾病类别而成为研究胸部X光片中胸腔异常检测的经典工具。该数据集包含约3,500张胸部X光图像,每张图像均标注了10种常见的胸腔疾病或异常,如肺不张、钙化、实变等。研究者常利用此数据集训练和评估深度学习模型,特别是基于Faster R-CNN和FPN的检测算法,以提高胸部X光片中疾病定位和分类的准确性。
实际应用
在实际应用中,ChestX-Det10数据集被广泛用于开发和验证胸部X光片自动诊断系统。这些系统能够快速且准确地识别和定位多种胸腔疾病,从而辅助放射科医生进行初步诊断。例如,在医院和诊所中,这些系统可以用于大规模的胸部X光片筛查,帮助早期发现潜在的健康问题,提高诊断效率和准确性。
衍生相关工作
基于ChestX-Det10数据集,研究者们开展了一系列相关工作,包括改进的检测算法、多模态数据融合以及临床决策支持系统等。例如,有研究通过结合其他类型的医学影像数据,如CT扫描,来进一步提升胸部疾病的检测精度。此外,还有工作探索了如何利用该数据集训练的模型进行实时诊断,以及如何将这些模型集成到现有的医疗信息系统中,以实现更高效的临床应用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作