five

EMDS-7

收藏
arXiv2021-10-28 更新2024-06-21 收录
下载链接:
https://figshare.com/articles/dataset/EMDS-7_DataSet/16869571
下载链接
链接失效反馈
官方服务:
资源简介:
EMDS-7是由东北大学创建的环境微生物图像数据集,包含2365张原始环境微生物图像及其对应的XML格式标注文件。该数据集涵盖41种环境微生物,共标注了13216个对象,主要用于多目标检测评估。数据来源于2018至2019年间,东北大学的环境生物学家在东北中国不同湖泊和河流使用400倍光学显微镜拍摄的图像。随后,生物信息科学家于2020至2021年间手动准备了标注文件。EMDS-7数据集的应用领域包括环境微生物的分类、检测和分析,旨在提高环境微生物研究的准确性和效率。

EMDS-7 is an environmental microbial image dataset developed by Northeastern University. It contains 2,365 raw environmental microbial images and their corresponding XML-formatted annotation files. This dataset covers 41 species of environmental microorganisms, with a total of 13,216 annotated objects, and is primarily intended for multi-object detection evaluation. The data was collected between 2018 and 2019 by environmental biologists from Northeastern University, who captured the images using a 400× optical microscope in various lakes and rivers across Northeast China. Subsequently, bioinformaticians manually curated the annotation files between 2020 and 2021. The application fields of the EMDS-7 dataset include classification, detection and analysis of environmental microorganisms, aiming to improve the accuracy and efficiency of environmental microbial research.
提供机构:
东北大学
创建时间:
2021-10-11
搜集汇总
数据集介绍
main_image_url
构建方式
在环境微生物图像分析领域,数据采集与标注的规范性直接影响模型性能。EMDS-7数据集的构建始于2018年至2019年间,研究团队从中国沈阳不同湖泊与河流中采集样本,通过400倍光学显微镜获取原始图像。随后,四位生物信息学专家于2020年至2021年期间,依据两项标注规则对图像进行人工标注:完全可见或自身超过60%的可识别微生物被赋予41种已知类别标签;而可见部分不足40%的未知微生物及明显杂质则标记为“未知”。最终形成包含2365幅图像、13216个标注对象的标准化数据集,所有标注文件均以XML格式保存,确保了数据结构的一致性与可扩展性。
使用方法
在计算机视觉应用于环境微生物检测的实践中,EMDS-7数据集为模型训练与评估提供了标准化流程。研究者首先将数据集按6:2:2的比例划分为训练集、验证集与测试集,确保每个类别在三个子集中均有分布。训练阶段可采用Faster R-CNN、YOLO系列、SSD及RetinaNet等主流检测架构,利用数据集中提供的XML标注文件直接进行模型训练。评估时设定预测框置信度阈值为0.5,交并比阈值为0.3,通过计算各类别的平均精度与整体均值平均精度来量化模型性能。这种标准化使用方法使不同检测算法能在统一基准下进行比较,为环境微生物自动检测技术的优化提供了实证依据。
背景与挑战
背景概述
环境微生物图像数据集第七版(EMDS-7)由东北大学显微图像与医学图像分析团队于2021年发布,旨在为环境微生物的多目标检测任务提供标准化评估基准。该数据集聚焦于环境微生物的识别与分析,涵盖41类微生物共计2365幅图像与13216个标注对象,数据源自2018至2019年间沈阳地区湖泊河流的显微采样。其核心研究问题在于通过计算机视觉技术提升环境微生物检测的自动化水平,以辅助生态监测与污染评估,为环境微生物学与人工智能交叉领域提供了关键数据支撑。
当前挑战
EMDS-7所针对的环境微生物多目标检测任务面临显著挑战:微生物形态多样、尺度差异大,且图像中常存在粘连、遮挡及复杂背景干扰,导致传统检测模型难以兼顾精度与鲁棒性。在数据集构建过程中,挑战主要体现在微生物样本采集受环境条件限制,图像标注需依赖专业生物学知识进行精细划分,同时需平衡类别样本数量以应对数据分布不均问题。此外,标注规则需兼顾微生物完整性(如60%可见阈值)与未知类别处理,增加了标注一致性与质量控制难度。
常用场景
经典使用场景
在环境微生物图像分析领域,EMDS-7数据集为多目标检测算法的性能评估提供了标准化测试平台。该数据集包含41类环境微生物的2365张显微图像及13216个标注对象,其经典应用场景在于为计算机视觉研究者提供统一的基准数据,用以训练和验证各类深度学习检测模型。通过系统比较Faster RCNN、YOLO系列、SSD和RetinaNet等主流算法的检测精度,研究者能够客观评估不同网络架构在复杂微生物图像中的识别能力,为算法优化提供可靠依据。
解决学术问题
该数据集有效解决了环境微生物图像分析中标注数据稀缺、标准不统一的核心学术难题。传统微生物识别依赖人工显微观察,存在主观偏差和效率瓶颈,EMDS-7通过提供大规模精细标注的显微图像,使自动化检测成为可能。其意义在于建立了首个面向多目标检测的环境微生物开源数据集,推动了计算机视觉技术与环境科学的交叉融合,为水质监测、生态评估等研究提供了可量化的分析工具,显著提升了微生物识别的客观性与可重复性。
实际应用
在实际环境监测中,EMDS-7数据集支撑了城市水体污染的快速评估系统。基于该数据集训练的检测模型可部署于显微成像设备,实现对振荡藻、栅藻等指示性微生物的自动识别与计数。例如,通过监测振荡藻的种群密度变化,能够预警水体富营养化趋势;而栅藻的丰度则反映了水体的自净能力。这种自动化监测手段大幅降低了人工鉴定的时间成本,为环保部门提供了实时、连续的水质动态数据,助力于河流湖泊的生态治理与保护。
数据集最近研究
最新研究方向
在环境微生物图像分析领域,EMDS-7数据集正推动多目标检测技术向更精细化的方向发展。当前研究聚焦于利用深度学习模型解决微生物图像中因尺度差异、形态多变及背景复杂带来的检测挑战,特别是针对小目标微生物的识别精度提升。前沿探索涉及改进特征金字塔网络与注意力机制的结合,以增强模型对微观特征的捕捉能力,同时研究数据增强策略以缓解类别不平衡问题。该数据集的应用已延伸至城市水体污染监测与生态健康评估,为环境微生物的自动化识别提供了关键基准,促进了计算机视觉与环境科学的交叉融合。
相关研究论文
  • 1
    EMDS-7: Environmental Microorganism Image Dataset Seventh Version for Multiple Object Detection Evaluation东北大学 · 2021年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作