flipwooyoung/classlabeltest

Name: flipwooyoung/classlabeltest
Creator: flipwooyoung
Published: 2024-06-04 14:00:26
License: 暂无描述

Hugging Face2024-06-04 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/flipwooyoung/classlabeltest

下载链接

链接失效反馈

官方服务：

资源简介：

CPPE - 5（医疗个人防护装备）是一个新的具有挑战性的数据集，旨在允许研究医疗个人防护装备的次级分类，这是其他专注于广泛类别的主流数据集所无法实现的。该数据集的一些特点包括：高质量图像和标注（每张图像约4.6个边界框）、真实生活图像（与当前类似数据集不同）、大多数非标志性图像（便于部署到现实世界环境中）。数据集包含训练集和测试集，训练集有1000张图像，测试集有29张图像。

提供机构：

flipwooyoung

原始信息汇总

数据集概述

数据集名称: CPPE - 5

数据集描述: CPPE - 5是一个专注于医疗个人防护装备检测的数据集，旨在支持对医疗个人防护装备的次级分类研究。该数据集包含高质量的实际场景图像和详细的标注信息。

语言: 英语

许可证: 未知

多语言性: 单语

大小类别: 1K<n<10K

源数据集: 原始数据

任务类别: 物体检测

数据集结构:

数据实例: 每个数据点包含一个图像及其对象标注。
数据字段:
- image_id: 图像ID，数据类型为int64。
- image: 图像文件，数据类型为图像。
- width: 图像宽度，数据类型为int32。
- height: 图像高度，数据类型为int32。
- objects: 包含对象的元数据，如ID、区域、边界框和类别。
数据分割:
- train: 包含1000个图像，总字节数为240463364.0。
- test: 包含29个图像，总字节数为4172164.0。

数据集创建:

标注过程: 数据集通过两阶段标注完成，使用众包方式由志愿者进行标注。标注过程中，志愿者需独立标注图像，并通过第三方志愿者验证以确保标注的准确性。
源数据: 图像主要从Flickr和Google Images收集，经过筛选和去重处理。

数据集使用注意事项:

社会影响: 待补充
偏见讨论: 待补充
其他已知限制: 待补充

数据集贡献者: Dagli, Rishit, and Ali Mustufa Shaikh.

许可证信息: 待补充

引用信息:

@misc{dagli2021cppe5, title={CPPE-5: Medical Personal Protective Equipment Dataset}, author={Rishit Dagli and Ali Mustufa Shaikh}, year={2021}, eprint={2112.09569}, archivePrefix={arXiv}, primaryClass={cs.CV} }

搜集汇总

数据集介绍

构建方式

在医疗影像分析领域，构建高质量数据集对于推动个人防护装备自动检测技术至关重要。CPPE-5数据集的构建过程体现了严谨的学术规范，其图像主要来源于Flickr平台，辅以少量Google Images资源，确保了数据的多样性与真实性。通过提取原始图像及其元数据，并采用GIST描述符过滤近似重复样本，有效提升了数据集的独特性。标注工作分为两个阶段，由志愿者借助LabelImg工具进行，采用双重独立标注与第三方仲裁机制，确保了边界框与类别标注的准确性与一致性，最终形成了包含1029张高质量图像的数据集。

使用方法

该数据集适用于目标检测任务，研究者可通过HuggingFace平台直接加载，利用其训练集与测试集进行模型开发与评估。使用时应优先通过样本索引访问图像列，以优化解码效率，避免大规模图像处理时的性能瓶颈。数据遵循COCO标注格式，包含图像ID、尺寸及对象边界框与类别信息，便于集成至主流检测框架。模型性能可参考Papers with Code平台的排行榜，采用平均精度均值等指标进行评估，推动医疗防护装备自动识别技术的进步。

背景与挑战

背景概述

在计算机视觉领域，医疗个人防护装备的自动检测对于公共卫生安全具有重要价值。CPPE-5数据集由Rishit Dagli和Ali Mustufa Shaikh于2021年创建，旨在解决现有数据集中医疗防护装备子类别识别不足的问题。该数据集专注于五种关键防护装备的精细检测，包括防护服、面罩、手套、护目镜和口罩，其高质量的真实场景图像为模型在现实环境中的部署提供了坚实基础，推动了医疗场景下目标检测技术的应用与发展。

当前挑战

CPPE-5数据集致力于解决医疗个人防护装备的细粒度目标检测问题，其挑战在于装备间视觉相似性高、遮挡频繁以及非标准姿态导致的识别困难。在构建过程中，数据收集面临真实场景图像稀缺与版权合规的双重压力；标注环节则需通过多志愿者协作与交叉验证来确保边界框的精确性与类别的一致性，同时避免因图像来源差异引入的分布偏差，这些因素共同增加了数据集的构建复杂度与质量控制难度。

常用场景

经典使用场景

在计算机视觉领域，医疗个人防护装备的自动识别是公共卫生安全的关键环节。CPPE-5数据集以其高质量的真实场景图像和精细标注，为对象检测模型提供了理想的训练与评估平台。该数据集通过涵盖防护服、面罩、手套、护目镜和口罩五类子类别，支持研究者深入探索医疗防护装备的细粒度识别，尤其在非典型视角图像上的丰富样本，显著提升了模型在复杂现实环境中的泛化能力。

解决学术问题

该数据集有效应对了医疗防护装备细粒度分类的研究空白，弥补了现有通用数据集在子类别识别上的不足。通过提供大量非标志性图像，它解决了模型在真实场景中因视角多变、遮挡复杂而导致的识别精度下降问题。其标注遵循COCO标准，促进了对象检测领域评价体系的一致性，为开发鲁棒性强的自动化监测系统奠定了数据基础，推动了视觉技术在医疗安全领域的学术进展。

实际应用

在实际应用中，CPPE-5数据集为医疗机构、公共场所的智能监控系统提供了核心支持。基于该数据集训练的模型可部署于医院、实验室等环境，实时检测医护人员防护装备的穿戴合规性，从而降低交叉感染风险。此外，在疫情管控或工业安全场景中，该系统能自动化审核防护措施，辅助提升整体安全运营效率，体现了人工智能技术在社会公共卫生管理中的实用价值。

数据集最近研究