five

AMi-Br

收藏
arXiv2025-01-08 更新2025-01-10 收录
下载链接:
https://github.com/DeepMicroscopy/AMi-Br/
下载链接
链接失效反馈
官方服务:
资源简介:
AMi-Br数据集是由维也纳兽医大学等多个研究机构合作创建的,专注于人类乳腺癌中的正常和异常有丝分裂图像。该数据集包含3720个有丝分裂图像,其中832个为异常有丝分裂,2888个为正常有丝分裂。数据来源于TUPAC和MIDOG 2021两个公开数据集,并通过三位专家的多数投票进行分类。数据集创建过程中,专家们对每个有丝分裂图像进行了独立分类,最终形成了具有高一致性的标签。该数据集旨在通过深度学习模型提高有丝分裂分类的准确性和可重复性,特别是在乳腺癌预后评估中的应用。

The AMi-Br dataset was collaboratively created by multiple research institutions including the University of Veterinary Medicine Vienna, focusing on normal and abnormal mitotic images in human breast cancer. It contains a total of 3720 mitotic images, among which 832 are abnormal mitoses and 2888 are normal mitoses. The dataset is sourced from two public datasets, TUPAC and MIDOG 2021, and its labels were generated via majority voting by three experts. During the dataset construction process, each mitotic image was independently classified by the experts, ultimately resulting in highly consistent labels. This dataset is intended to enhance the accuracy and reproducibility of mitotic classification using deep learning models, especially for applications in breast cancer prognosis evaluation.
提供机构:
维也纳兽医大学, 施瓦茨曼动物医疗中心, 弗伦斯堡应用科学大学, 柏林自由大学, 维也纳医科大学, 因戈尔施塔特技术大学
创建时间:
2025-01-08
搜集汇总
数据集介绍
main_image_url
构建方式
AMi-Br数据集的构建基于两个广泛使用的有丝分裂图像数据集——MIDOG 2021和TUPAC。研究人员从这两个数据集中提取了所有有丝分裂图像,并通过三位专家的多数投票对这些图像进行了分类,将其划分为典型有丝分裂(NMF)和非典型有丝分裂(AMF)。最终数据集包含3,720个有丝分裂图像,其中832个被归类为非典型有丝分裂,2,888个为典型有丝分裂。所有图像均来自223个乳腺癌病例,确保了数据的多样性和代表性。
使用方法
AMi-Br数据集的使用方法主要包括两个步骤:首先,通过对象检测算法在大图像中定位所有有丝分裂图像;其次,使用深度学习模型对这些图像进行分类,区分典型和非典型有丝分裂。研究人员提供了基线分类实验的代码和结果,用户可以参考这些实验进行模型开发和验证。数据集以CSV文件形式提供,包含文件名、坐标、专家标签及多数投票结果,便于用户直接应用于深度学习模型的训练和测试。
背景与挑战
背景概述
AMi-Br数据集是由维也纳兽医大学、纽约施瓦茨曼动物医疗中心、弗伦斯堡应用科学大学、柏林自由大学、维也纳医科大学和因戈尔施塔特技术大学的研究团队共同创建的一个关于人类乳腺癌中正常和异常有丝分裂图像的病理学数据集。该数据集于2025年发布,旨在通过提供公开可用的异常有丝分裂图像数据,推动基于模式识别的乳腺癌预后研究。AMi-Br数据集整合了TUPAC和MIDOG 2021两个广泛使用的有丝分裂数据集,并通过三位专家的多数投票对3720个有丝分裂图像进行了分类,其中832个被标记为异常有丝分裂(AMFs),2888个为正常有丝分裂(NMFs)。该数据集为乳腺癌细胞增殖的定量分析提供了重要支持,并为深度学习模型在病理学中的应用奠定了基础。
当前挑战
AMi-Br数据集在构建和应用过程中面临多重挑战。首先,异常有丝分裂(AMFs)与正常有丝分裂(NMFs)在形态学上存在高度重叠,导致分类任务极为复杂。其次,数据集中AMFs的比例较低(22.4%),类别不平衡问题显著,这对深度学习模型的训练和评估提出了更高要求。此外,专家间对AMFs的分类一致性较低,进一步增加了数据标注的难度。在构建过程中,研究团队通过引入三位专家的多数投票机制来提升标注的可靠性,但仍需应对形态学多样性和标注主观性带来的挑战。未来研究需进一步优化数据标注流程,并通过更大规模的数据集和更精细的形态学定义来提升模型的分类性能。
常用场景
经典使用场景
AMi-Br数据集在乳腺癌病理学研究中具有重要应用,特别是在评估肿瘤细胞增殖的定量分析中。通过提供正常和有丝分裂异常(AMFs)的详细标注,该数据集为研究人员提供了一个标准化的工具,用于开发和验证深度学习模型,以自动识别和分类有丝分裂图像。这一过程不仅提高了诊断的准确性,还减少了病理学家之间的评估差异。
解决学术问题
AMi-Br数据集解决了乳腺癌病理学中关于有丝分裂异常(AMFs)的定量和定性分析问题。通过提供大量标注数据,该数据集支持了深度学习模型在识别和分类AMFs方面的研究,从而帮助研究人员更好地理解AMFs在肿瘤进展中的作用。此外,该数据集还为解决类不平衡问题提供了实验基础,推动了相关算法的优化和改进。
实际应用
在实际应用中,AMi-Br数据集被广泛用于开发自动化病理诊断工具。这些工具能够辅助病理学家快速准确地识别和计数肿瘤切片中的有丝分裂异常,从而提高诊断效率和一致性。此外,该数据集还为临床研究提供了宝贵的数据资源,支持了乳腺癌预后评估模型的开发,有助于个性化治疗方案的制定。
数据集最近研究
最新研究方向
近年来,AMi-Br数据集在乳腺癌病理学领域的研究方向主要集中在利用深度学习技术对正常和有丝分裂异常(AMFs)进行分类。AMFs作为细胞周期调控基因突变的标志,其数量与乳腺癌患者的预后密切相关。尽管已有研究表明AMFs的计数具有独立的预后价值,但由于其形态复杂且与正常有丝分裂(NMFs)高度重叠,分类任务极具挑战性。AMi-Br数据集的发布为这一领域的研究提供了首个公开的AMFs和NMFs标注数据,推动了基于模式识别的算法开发。当前研究热点包括通过改进数据增强策略、优化模型架构以及探索跨肿瘤类型的AMFs分类方法,以提升模型的泛化能力和分类精度。此外,AMi-Br数据集还为研究AMFs在肿瘤进展中的作用及其在多种癌症类型中的预后意义提供了重要基础。
相关研究论文
  • 1
    A Histologic Dataset of Normal and Atypical Mitotic Figures on Human Breast Cancer (AMi-Br)维也纳兽医大学, 施瓦茨曼动物医疗中心, 弗伦斯堡应用科学大学, 柏林自由大学, 维也纳医科大学, 因戈尔施塔特技术大学 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作