自动对焦显微镜图像数据集
收藏arXiv2025-02-10 更新2025-02-26 收录
下载链接:
http://arxiv.org/abs/2502.06452v1
下载链接
链接失效反馈官方服务:
资源简介:
本研究构建了一个大规模的自动对焦显微镜图像数据集,包含数百万张标记失焦图像,涵盖密集、稀疏和极其稀疏的场景。数据集由病理组织和细胞样本组成,包括来自肺部、肝脏、前列腺以及宫颈脱落细胞等样本,采用Papanicolaou染色和苏木精-伊红(H&E)染色。数据集通过自动显微镜成像平台收集,并分为训练集、验证集和测试集,用于训练和评估提出的SparseFocus方法,该方法能够有效处理不同内容稀疏度的自动对焦问题。
This study constructed a large-scale autofocus microscopy image dataset containing millions of labeled out-of-focus images covering dense, sparse, and extremely sparse scenarios. The dataset comprises pathological tissue and cell specimens, including samples sourced from lung, liver, prostate, and cervical exfoliated cells, which were stained with both Papanicolaou stain and hematoxylin-eosin (H&E) stain. Collected via an automated microscopy imaging platform, the dataset is partitioned into training, validation, and test subsets, and is utilized to train and evaluate the proposed SparseFocus method, which effectively addresses the autofocus problem across varying content sparsity levels.
提供机构:
国防科技大学
创建时间:
2025-02-10
搜集汇总
数据集介绍

构建方式
SparseFocus数据集的构建方式采用了自动化显微成像平台,该平台能够自动收集带有标签的散焦图像。为了提高样本多样性,研究人员收集了大量的病理组织和细胞样本,包括来自肺、肝、前列腺和宫颈细胞的样本。这些样本经过染色后,使用Papanicolaou染料和Hematoxylin和Eosin染料进行处理。每个样本随机选取了100个视野,每个视野的分辨率为2016×2016像素。为了收集散焦数据,研究人员在101个不同的散焦距离上捕获了一系列z堆叠图像,步长为0.5µm,范围从-25µm到+25µm。最终,研究人员获得了1324,211个带有散焦距离标签的病理显微图像。
特点
SparseFocus数据集的特点在于其涵盖了丰富多样的散焦图像,包括密集、稀疏和极稀疏的场景。该数据集的构建旨在验证SparseFocus方法的性能,该方法是针对显微镜图像中内容稀疏性对自动对焦性能的影响而提出的。实验结果表明,SparseFocus在处理所有内容稀疏程度方面均优于现有方法。此外,SparseFocus还被集成到WSI系统中,在实际应用中表现出良好的对焦能力。
使用方法
SparseFocus数据集的使用方法是通过将散焦图像输入到Region Importance Network (RIN)中,该网络会预测图像中所有均匀分割的块的重要性权重。然后,选择重要性得分最高的Top-k块,并将它们输入到Defocus Prediction Network (DPN)中,以预测每个块的对焦距离。最后,使用聚合操作(例如,中值滤波)来获得最终的对焦距离估计。这个估计结果可以用于控制系统的精确对焦,使物镜定位在最佳图像清晰度的焦平面上。
背景与挑战
背景概述
在微观成像领域,自动对焦是实现高吞吐量和实时扫描的关键技术。传统的自动对焦方法依赖于复杂的硬件或迭代爬山算法,而基于学习的方法在单次设置中展现出显著的效能,避免了硬件修改或迭代机械镜头调整。然而,本文中提出的方法——SparseFocus,通过一种新颖的两阶段流程解决了图像内容丰富性对自动对焦性能的显著影响。该方法首先测量图像内区域的重要性,然后从选定的区域中计算散焦距离。为了验证该方法并惠及研究社区,我们收集了一个包含数百万个标签散焦图像的大规模数据集,涵盖了密集、稀疏和极其稀疏的场景。实验结果表明,SparseFocus在处理所有级别的内容稀疏性方面优于现有方法。
当前挑战
自动对焦显微镜图像数据集面临的主要挑战是图像内容的丰富性对自动对焦性能的影响。当图像内容稀疏时,传统的爬山算法或基于学习的方法往往无法正常工作。为了解决这个问题,我们提出了一种基于内容重要性的解决方案,名为SparseFocus,它具有一个新颖的两阶段流程。第一阶段测量图像内区域的重要性,而第二阶段则从选定的区域中计算散焦距离。此外,构建过程中遇到的挑战还包括如何确保数据集的多样性和代表性,以及如何设计有效的评估指标来衡量自动对焦算法的性能。
常用场景
经典使用场景
在微观成像领域,自动对焦显微镜图像数据集广泛应用于高吞吐量和实时扫描场景。传统方法依赖复杂的硬件或迭代爬山算法,而基于学习的单次自动对焦方法在避免硬件修改或迭代机械镜头调整方面展现出显著优势。然而,图像内容的丰富性对自动对焦性能有显著影响。当图像内容稀疏时,现有的自动对焦方法往往失效。SparseFocus 提出了基于内容重要性的解决方案,通过新颖的两阶段流程,有效解决了这一问题。该数据集包含了数百万个带标签的失焦图像,涵盖了密集、稀疏和极稀疏场景,为研究社区提供了宝贵的资源。
衍生相关工作
基于 SparseFocus 的研究成果,衍生出了许多相关的经典工作,如基于深度学习的单次自动对焦方法、基于物理引导的深度级联网络自动对焦方法等。这些相关工作进一步推动了微观成像自动对焦技术的发展,为病理诊断、细胞追踪等领域提供了更高效、更准确的自动对焦解决方案。
数据集最近研究
最新研究方向
在微观成像领域,自动对焦技术对于高吞吐量和实时扫描至关重要。传统的自动对焦方法依赖于复杂的硬件或迭代 hill-climbing 算法,而近年来基于学习的方法在 one-shot 设置中展现出显著的效果,避免了硬件修改或迭代机械镜头调整。然而,图像内容的丰富性对自动对焦性能有显著影响,尤其是在图像内容稀疏的情况下,传统的爬山法或基于学习的方法往往会失败。为了解决这一问题,我们提出了一种基于内容重要性的解决方案,名为 SparseFocus,它采用了一种新颖的两阶段流程。第一阶段测量图像中区域的重要性,而第二阶段则从选定的关键区域计算离焦距离。为了验证我们的方法并惠及研究社区,我们收集了一个包含数百万个标记离焦图像的大型数据集,涵盖了密集、稀疏和极稀疏的场景。实验结果表明,SparseFocus 超越了现有方法,有效地处理了所有内容稀疏程度。此外,我们将 SparseFocus 集成到我们的 Whole Slide Imaging (WSI) 系统中,该系统在现实世界的应用中表现出良好的聚焦能力。
相关研究论文
- 1SparseFocus: Learning-based One-shot Autofocus for Microscopy with Sparse Content国防科技大学 · 2025年
以上内容由遇见数据集搜集并总结生成



