Chest X-ray Images (Pneumonia)|医学影像数据集|深度学习数据集
收藏肺炎检测使用深度学习
概述
本项目利用深度学习技术,特别是VGG16卷积神经网络,从胸部X光图像中检测肺炎。模型在一个由“正常”或“肺炎”标签的图像组成的数据集上进行训练。
数据集
本项目使用的数据集来自Kaggle [https://www.kaggle.com/datasets/paultimothymooney/chest-xray-pneumonia]。它包含两个主要类别:
- 正常:没有肺炎的患者的胸部X光图像。
- 肺炎:被诊断为肺炎的患者的胸部X光图像。
数据集被分为训练集和测试集,并使用Keras的ImageDataGenerator
进行适当的预处理。
模型架构
采用在ImageNet上预训练的VGG16模型作为基础模型。VGG16的顶层被调整以适应肺炎检测的二分类任务。通过冻结卷积基并仅训练自定义分类器层来微调模型。
训练
模型编译时使用:
- 损失函数:适用于多类分类的分类交叉熵。
- 优化器:用于有效权重更新的Adam优化器。
- 指标:在训练期间监控模型性能的准确度指标。
训练过程涉及通过ImageDataGenerator
生成的增强图像批次进行迭代,优化模型参数以最小化损失函数。
评估
模型性能在单独的测试集上进行评估,以评估其对未见数据的泛化能力。评估指标包括训练和验证集在各个时期的准确度和损失。
预测
训练完成后,模型可以对新的胸部X光图像进行预测,将它们分类为正常或指示肺炎。预测基于模型softmax层的最高概率输出。
文件结构
- Pneumonia.py:包含模型定义、训练和保存的Python脚本。
- Test.py:用于加载训练好的模型并对新图像进行预测的Python脚本。
- Requirements.txt:运行项目所需的Python包列表。
- LossVal_loss.png:显示模型训练期间训练和验证损失的图表。
- AccVal_acc.png:显示模型训练期间训练和验证准确度的图表。
- pneumonia_model.keras:包含训练好的权重和架构的保存模型文件。
使用
使用本项目的步骤:
- 安装
requirements.txt
中列出的必要依赖项。 - 使用
Pneumonia.py
训练模型。 - 使用生成的图表评估模型性能并可视化训练历史。
- 使用
Test.py
对新图像进行预测。
依赖项
确保安装以下依赖项:
- Keras
- TensorFlow
- Matplotlib
- NumPy
未来改进
- 纳入更高级的架构,如ResNet或DenseNet,以可能提高性能。
- 尝试不同的增强技术,以进一步提高模型的泛化能力。

HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
UIEB, U45, LSUI
本仓库提供了水下图像增强方法和数据集的实现,包括UIEB、U45和LSUI等数据集,用于支持水下图像增强的研究和开发。
github 收录
NWPU VHR-10 dataset
NWPU VHR-10数据集是一个包含10个类别地理空间目标检测的挑战性数据集。该数据集共包含800张VHR光学遥感图像,其中715张彩色图像来自Google Earth,空间分辨率在0.5至2米之间,85张全色锐化彩色红外图像来自Vaihingen数据,空间分辨率为0.08米。数据集分为两部分:a) 正图像集,包含至少一个目标的650张图像;b) 负图像集,包含150张不包含任何目标的图像。从正图像集中,手动标注了757架飞机、302艘船只、655个储罐、390个棒球场、524个网球场、159个篮球场、163个田径场、224个港口、124座桥梁和477辆车辆,使用边界框和实例掩码作为地面实况。
github 收录
Nexdata/chinese_dialect
该数据集包含25,000小时的中文方言语音数据,收集自多个方言区域的本地方言使用者,涵盖闽南语、粤语、四川话、河南话、东北话、上海话、维吾尔语和藏语等。数据格式为16kHz、16bit、未压缩的wav文件,单声道。句子准确率超过95%。数据集支持的任务包括自动语音识别(ASR)和音频说话人识别。
hugging_face 收录
UAV123
从低空无人机捕获的视频与流行的跟踪数据集 (如OTB50,OTB100,VOT2014,VOT2015,TC128和ALOV300) 中的视频本质上不同。因此,我们提出了一个新的数据集 (UAV123),其序列来自空中视点,其子集用于长期空中跟踪 (UAV20L)。我们新的UAV123数据集包含总共123个视频序列和超过110K帧,使其成为仅次于ALOV300的第二大对象跟踪数据集。所有序列都用直立的边界框完全注释。数据集可以很容易地与视觉跟踪器基准集成。它包括无人机数据集的所有边界框和属性注释。还请使用包含序列和跟踪器配置的修改后的文件 “configSeqs.m” 和 “configTrackers.m” 下载修改后的跟踪器基准。另外,请注意,文件 “perfPlot.m” 已根据本文中描述的属性进行了修改以进行评估。
OpenDataLab 收录