five

CellFMCount

收藏
arXiv2025-11-25 更新2025-11-26 收录
下载链接:
https://doi.org/10.5281/zenodo.17088532
下载链接
链接失效反馈
官方服务:
资源简介:
CellFMCount是由爱荷华州立大学研发的大规模荧光显微镜细胞计数数据集,包含3,023张免疫细胞化学实验图像及43万余个手动标注的细胞定位点。该数据集涵盖成年海马祖细胞和视网膜祖细胞等多种细胞类型,图像分辨率介于600×447至1600×1200像素,呈现细胞密度差异显著(单图细胞数10-2126个)、形态多样且存在重叠的特点。数据集通过系统化的干细胞分化实验采集,采用ImageJ工具进行人工点标注并经过严格数据清洗流程,主要应用于生物医学领域的自动细胞计数研究,旨在解决高密度细胞计数、细胞形态多样性及染色方案变异等关键挑战。

CellFMCount is a large-scale fluorescent microscopy cell counting dataset developed by Iowa State University. It contains 3,023 immunocytochemistry experimental images and more than 430,000 manually annotated cell localization points. This dataset covers multiple cell types including adult hippocampal progenitor cells and retinal progenitor cells. The image resolutions range from 600×447 to 1600×1200 pixels, and it exhibits significant variations in cell density (with 10 to 2126 cells per image), diverse cell morphologies, and overlapping cells. The dataset was collected through systematic stem cell differentiation experiments, with manual point annotations performed using ImageJ and underwent rigorous data cleaning procedures. It is primarily applied to automatic cell counting research in the biomedical field, aiming to address key challenges such as high-density cell counting, cell morphological diversity, and variations in staining protocols.
提供机构:
爱荷华州立大学
创建时间:
2025-11-25
原始信息汇总

CellFMCount Dataset

基本信息

  • DOI: 10.5281/zenodo.17088532
  • 发布日期: 2025年9月9日
  • 版本: 1.0.0
  • 资源类型: 数据集
  • 访问权限: 开放获取

创作者

  • Mohammed, Abdurahman Ali (研究员)
  • Fonder, Catherine (研究员)
  • Wei, Ying (研究员)
  • Tavanapong, Wallapak (导师)
  • Sakaguchi, Donald (导师)
  • Li, Qi (导师)
  • Mallapragada, Surya (导师)

所属机构: 爱荷华州立大学

数据集描述

CellFMCount是一个大规模荧光显微镜数据集,旨在支持稳健且可推广的自动化细胞计数。该数据集包含来自神经祖细胞免疫细胞化学实验的3,023张图像,具有超过430,000个手动标注的细胞位置。每个细胞都用一个标记其近似中心的点进行标注。

文件信息

  • 文件名: cellfmcount.zip
  • 文件大小: 1.7 GB
  • MD5校验值: e87d6247e6459268f5cf4535ec25e709
  • 下载地址: https://doi.org/10.5281/zenodo.17088532

使用统计

  • 总浏览量: 52
  • 总下载量: 34
  • 总数据量: 63.5 GB

关键词

  • 关键词: 细胞计数
  • MeSH主题词: 荧光显微镜

权利信息

  • 许可证: 知识共享署名相同方式共享4.0国际许可协议
  • 许可证说明: 允许几乎任何用途,但需提供署名和许可声明。常用于媒体资源和教育材料,是开放获取科学出版物最常见的许可证,不建议用于软件。

引用格式

Mohammed, A. A., Fonder, C., Wei, Y., Tavanapong, W., Sakaguchi, D., Li, Q., & Mallapragada, S. (2025). CellFMCount Dataset (1.0.0) [Data set]. IEEE International Conference on Data Mining 2025 (ICDM), Washington DC. Zenodo. https://doi.org/10.5281/zenodo.17088532

技术元数据

  • 创建日期: 2025年9月10日
  • 修改日期: 2025年9月10日

外部资源

  • 索引于: OpenAIRE

会议信息

  • 关联会议: IEEE International Conference on Data Mining 2025 (ICDM), Washington DC, 11月12-15日
搜集汇总
数据集介绍
main_image_url
构建方式
在荧光显微镜细胞计数研究领域,CellFMCount数据集通过严谨的生物学实验流程构建而成。研究团队采用免疫细胞化学技术对小鼠视网膜祖细胞和大鼠海马祖细胞进行分化实验,通过系统性采集不同抗体标记的荧光图像,涵盖DAPI、Cy3和AF488三种染色通道。专业人员在ImageJ平台使用CellCounter插件对细胞核中心进行点标注,经过数据清洗与标准化处理,最终形成包含3,023幅图像、43万余个标注细胞的高质量数据集。
特点
该数据集展现出显著的生物学多样性特征,图像中细胞密度分布呈现长尾特性,单帧细胞数量从个位数延伸至两千余个。数据集涵盖六种免疫标记物,包括表征神经元、胶质细胞和增殖细胞的特异性抗体,同时包含20倍与40倍两种显微放大倍数。细胞形态呈现高度异质性,从密集排列的细胞核到延展的神经元结构,为模型训练提供了丰富的空间特征变化。
使用方法
该数据集支持回归计数与密度图估计两种主流方法。回归方法通过端到端网络直接预测细胞数量,密度图方法则通过高斯卷积生成空间分布图并积分求和。研究团队已建立标准化评估框架,将DAPI染色子集按细胞数量分层划分为训练测试集,采用MAE、MSE、RMSE、MAPE和ACP五项指标进行性能评估。数据集特别适配基于Segment Anything模型的密度图估计方法,通过微调视觉编码器与轻量级卷积头实现精准计数。
背景与挑战
背景概述
CellFMCount作为荧光显微细胞计数领域的重要数据集,由爱荷华州立大学跨学科团队于2025年发布,旨在解决生物医学研究中细胞定量分析的瓶颈问题。该数据集聚焦于神经再生研究中的细胞分化过程,包含3,023幅免疫细胞化学实验图像及43万余个手工标注的细胞位置,覆盖成年海马祖细胞与视网膜祖细胞等关键细胞类型。其创新性体现在首次系统整合了不同抗体标记策略、成像放大倍数和细胞密度变化,为深度学习模型在癌症诊断、干细胞治疗等领域的应用提供了标准化评估基准。
当前挑战
该数据集面临双重挑战:在领域问题层面,需应对荧光显微图像中细胞高密度聚集、形态多样性及染色协议差异导致的计数偏差,同时克服细胞数量长尾分布对模型泛化能力的影响;在构建过程中,需解决手工标注430,000个细胞位置时的工作量瓶颈,并通过多轮专家校验确保标注一致性,此外还需协调不同显微镜型号与成像参数带来的数据异构性问题。
常用场景
经典使用场景
在荧光显微镜图像分析领域,CellFMCount数据集最经典的使用场景是作为细胞计数算法的基准测试平台。该数据集包含3,023张免疫细胞化学实验图像,涵盖超过43万个手动标注的细胞位置,其细胞密度分布范围从每张图像10个到2,126个细胞不等。这种广泛的密度变化使其成为评估算法在稀疏到高度密集细胞场景下性能的理想测试床,特别是在处理细胞重叠、形态多样性等实际挑战时具有显著优势。
衍生相关工作
基于CellFMCount数据集衍生出多项经典研究工作,其中最具代表性的是SAM-Counter模型。该工作创新性地将分割基础模型SAM重新用于密度图估计,通过将预训练的视觉变换器编码器与轻量级密度估计头相结合,在细胞计数任务中实现了22.12的MAE,显著优于传统方法。此外,数据集还促进了CSRNet、MAN等人群计数模型在细胞分析领域的迁移应用,推动了跨域适应性研究的发展。
数据集最近研究
最新研究方向
在荧光显微镜细胞计数领域,CellFMCount数据集正推动基于密度图估计的深度学习模型发展。前沿研究聚焦于通用基础模型的迁移应用,特别是将Segment Anything Model(SAM)的视觉编码器与轻量级密度估计头结合,形成SAM-Counter架构。这一方向突破了传统回归模型在细胞重叠和高密度场景下的局限性,通过端到端微调显著提升了计数精度。当前热点集中于探索样本高效学习范式,如弱监督与主动学习,以应对细胞形态多样性和染色协议差异带来的挑战。该数据集通过提供大规模标注数据和标准化评估框架,为神经再生研究与癌症诊断中的自动化细胞分析奠定了可靠基础。
相关研究论文
  • 1
    CellFMCount: A Fluorescence Microscopy Dataset, Benchmark, and Methods for Cell Counting爱荷华州立大学 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作