five

Chula-ParasiteEgg-11

收藏
arXiv2022-10-18 更新2024-06-21 收录
下载链接:
https://ieee-dataport.org/open-access/chula-parasiteegg-11
下载链接
链接失效反馈
官方服务:
资源简介:
Chula-ParasiteEgg-11数据集由泰国朱拉隆功大学临床显微镜系创建,包含11种寄生虫卵的13,750张显微镜图像,是目前同类数据集中最大的。数据集内容丰富,覆盖从小至22×11 µm到大至140×85 µm的卵类型。创建过程中,通过多种设备和不同条件采集图像,并人工标记卵的位置。数据集主要用于自动化检测和识别肠道寄生虫卵,以辅助非专家进行临床诊断,解决传统手动检测耗时且依赖专家的问题。

Chula-ParasiteEgg-11 dataset was developed by the Department of Clinical Microscopy, Chulalongkorn University, Thailand. It contains 13,750 microscopic images of 11 species of parasite eggs, making it the largest existing dataset in this category. The dataset covers a wide range of egg sizes, from as small as 22×11 µm up to 140×85 µm. During its construction, images were collected using multiple devices under various conditions, and the locations of parasite eggs were manually annotated. This dataset is mainly utilized for automated detection and recognition of intestinal parasite eggs, aiming to assist non-specialists in clinical diagnosis and solve the issues of traditional manual detection, which is time-consuming and relies heavily on professional expertise.
提供机构:
布里斯托大学视觉信息实验室
创建时间:
2022-08-12
搜集汇总
数据集介绍
main_image_url
构建方式
Chula-ParasiteEgg-11数据集的构建旨在解决肠道寄生虫感染的快速诊断问题。该数据集由来自泰国朱拉隆功大学的临床微生物学系的粪便样本中的11种寄生虫卵组成,总计13,750张显微镜图像。数据集的构建过程包括收集粪便样本,在实验室条件下进行固定和储存,然后使用不同设备(包括不同品牌和型号的显微镜、相机和手机)进行显微拍摄。为了模拟真实场景,部分图像经过了随机裁剪、高斯模糊、运动模糊、高斯噪声、泊松噪声、图像饱和度调整和对比度调整等图像质量退化处理。
特点
Chula-ParasiteEgg-11数据集具有以下特点:1)包含11种不同类型的寄生虫卵,是目前同类数据集中规模最大的;2)数据集在类别之间均衡分布,便于模型的训练和测试;3)图像大小和分辨率各异,从22×11微米到140×85微米不等,涵盖了从非常小到非常大的寄生虫卵;4)数据集包含了真实的和合成的退化图像,如散焦、噪声、运动模糊、颜色和光照不平衡,这有助于提高检测模型的鲁棒性。
使用方法
Chula-ParasiteEgg-11数据集适用于肠道寄生虫卵的检测和分类研究。用户可以下载训练和测试数据集,并进行模型的训练和测试。数据集的标签形式为边界框,便于进行目标检测和定位。此外,数据集还提供了原始质量图像,可供图像恢复、图像增强等研究使用。在模型训练过程中,用户可以采用深度学习技术,如基于ResNet块的卷积神经网络和特征金字塔网络,并结合预训练权重和交叉验证等方法来提高模型性能。
背景与挑战
背景概述
Chula-ParasiteEgg-11数据集的创建是为了应对全球范围内,特别是在热带和亚热带地区,肠道寄生虫感染的高发病率问题。这一挑战性的健康问题需要快速、准确的诊断方法,而传统的实验室直接检查方法耗时且灵敏度低。因此,自动化的系统成为了解决这一问题的迫切需求。Chula-ParasiteEgg-11数据集由英国布里斯托尔大学视觉信息实验室、泰国朱拉隆功大学计算机工程系和临床显微学系的专家团队于2022年创建,旨在促进寄生虫卵的自动检测和分类技术的发展。该数据集是目前同类数据集中规模最大的,包含了11种不同类型的寄生虫卵,共13,750张显微图像,其规模和多样性为相关研究提供了宝贵资源。
当前挑战
Chula-ParasiteEgg-11数据集在构建过程中面临的主要挑战包括:1)所解决的领域问题:该数据集旨在解决肠道寄生虫感染的诊断问题,特别是寄生虫卵的自动检测和分类。由于寄生虫卵的大小、形状和颜色各不相同,且在显微图像中可能出现不同程度的退化,因此,如何提高检测算法的鲁棒性和准确性是一个挑战。2)构建过程中的挑战:数据集的构建过程中,团队需要克服图像质量退化的问题,以模拟真实环境中图像采集时的各种条件。这包括图像的裁剪、高斯模糊、运动模糊、噪声添加、饱和度和对比度调整等。此外,数据集的标签需要经过专家的准确标注,以确保数据的可靠性和有效性。
常用场景
经典使用场景
在微观图像中自动检测和分类寄生虫卵,特别是针对粪便涂片样本。这一场景是肠道寄生虫感染诊断的关键步骤,旨在通过自动化系统替代耗时且依赖专家的手动检测方法。Chula-ParasiteEgg-11数据集为这一应用提供了大量数据,包含了11种不同类型的寄生虫卵,具有从极小到极大的尺寸范围,以及真实和合成的退化特征,如散焦、噪声、运动模糊、色彩和光线不平衡。这些特性使得数据集能够增强检测模型的鲁棒性,并提高在实际临床应用中的诊断准确性和效率。
衍生相关工作
Chula-ParasiteEgg-11数据集的发布促进了相关领域的研究和发展。基于该数据集,研究者们开发了一系列先进的深度学习模型,如基于YOLOv5、FastRCNN、EfficientDet等的架构,以及使用Transformer-based架构和Feature Pyramid Network (FPN)进行特征提取的方法。这些模型在检测和分类寄生虫卵方面取得了显著的成果,为后续的研究和应用奠定了坚实的基础。此外,数据集中的图像退化处理技术也为图像恢复和增强领域的研究提供了新的思路和方法,推动了相关技术的发展。
数据集最近研究
最新研究方向
基于Chula-ParasiteEgg-11数据集的寄生卵检测与分类研究,正聚焦于利用深度学习技术,特别是卷积神经网络(CNNs)及其变体,以提高检测的准确性和鲁棒性。该数据集的多样性,包括不同大小、形状和图像质量,为训练能够适应实际临床环境中复杂情况的模型提供了可能。研究团队正在探索各种模型架构,如YOLOv5、FastRCNN、EfficientDet等,并利用预训练模型和跨验证技术来优化模型性能。此外,伪标签策略和小物体检测机制也被采用,以进一步提高检测模型的准确性和召回率。通过这些研究,寄生卵的检测和分类准确率已达到前所未有的高度,有望在未来实现自动化检测,从而辅助临床诊断,减轻医务工作者的负担,并为发展中国家提供更有效的寄生虫病诊断工具。
相关研究论文
  • 1
    ICIP 2022 Challenge on Parasitic Egg Detection and Classification in Microscopic Images: Dataset, Methods and Results布里斯托大学视觉信息实验室 · 2022年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作