five

Breast Cancer Immunohistochemical (BCI) 1

收藏
arXiv2023-09-22 更新2024-06-21 收录
下载链接:
https://bupt-ai-cz.github.io/BCI
下载链接
链接失效反馈
官方服务:
资源简介:
BCI数据集是由北京朝阳医院和首都医科大学合作创建的,专注于乳腺癌免疫组化图像生成。该数据集包含4872对已结构级对齐的H&E和IHC染色图像,用于研究从H&E到IHC染色图像的转换算法。数据集的构建过程包括切片准备、扫描、投影变换、elastix注册、图像精化和补丁选择。BCI数据集的应用领域主要集中在通过深度学习技术生成高质量的IHC染色图像,以辅助乳腺癌的诊断和治疗计划制定。

The BCI dataset was co-developed by Beijing Chaoyang Hospital and Capital Medical University, focusing on breast cancer immunohistochemical (IHC) image generation. It includes 4872 pairs of structurally aligned Hematoxylin-Eosin (H&E) and IHC-stained images, intended for developing translation algorithms that convert H&E-stained images to IHC-stained ones. The dataset construction workflow covers slide preparation, scanning, projective transformation, elastix registration, image refinement, and patch selection. The primary applications of the BCI dataset center on generating high-quality IHC-stained images via deep learning technologies to support breast cancer diagnosis and treatment planning.
提供机构:
北京朝阳医院,首都医科大学
创建时间:
2023-05-05
搜集汇总
数据集介绍
main_image_url
构建方式
在构建乳腺癌免疫组化(BCI)1数据集的过程中,研究团队采用了多步骤的方法。首先,从患者的肿瘤组织中连续切割出两层切片,分别进行苏木精-伊红(H&E)染色和免疫组化(IHC)染色。随后,使用Hamamatsu NanoZoomer S60扫描仪对这些切片进行高倍率扫描,生成全切片图像(WSI)。为了处理计算资源和内存的限制,原始图像被降采样至原尺寸的一半。接着,通过投影变换和elastix注册两种操作,对H&E和IHC图像进行全局轮廓和内部细节的对齐。最后,对对齐后的图像进行后处理,包括填充黑色区域和分割成1024×1024像素的正方形补丁,筛选出包含肿瘤组织且对齐良好的图像对。
特点
BCI 1数据集的主要特点在于其结构级别的对齐和高质量的图像对。每对图像都经过了严格的注册过程,确保H&E和IHC图像在全局和局部细节上的一致性。此外,数据集包含了来自300多名患者的4872对图像,涵盖了HER2表达的四个等级(0, 1+, 2+, 3+),为研究HER2表达水平的检测和治疗提供了丰富的资源。数据集的设计旨在促进深度学习技术在病理图像生成中的应用,特别是从H&E图像直接生成IHC图像的研究。
使用方法
BCI 1数据集主要用于训练和验证深度学习模型,以实现从H&E染色图像到IHC染色图像的转换。研究者可以使用数据集中的图像对来训练图像翻译模型,目标是生成能够准确反映HER2表达水平的IHC图像。数据集分为训练集、验证集和测试集,分别包含3396对、500对和977对图像。训练集和验证集的图像对完全开放,而测试集仅开放H&E图像,用于模型的最终评估。评估指标包括峰值信噪比(PSNR)和结构相似性(SSIM),以确保生成的IHC图像在质量和结构上与真实图像高度一致。
背景与挑战
背景概述
乳腺癌是全球女性中最常见的癌症之一,早期诊断对于制定治疗方案和改善患者预后至关重要。免疫组化(IHC)技术常用于检测乳腺癌组织中人表皮生长因子受体2(HER2)的表达水平,以制定精准治疗方案。然而,传统的IHC染色过程耗时且成本高昂。为了解决这一问题,研究人员开发了乳腺癌免疫组化图像生成(BCI)数据集,旨在通过深度学习技术直接从苏木精-伊红(H&E)染色图像生成IHC染色图像,从而节省人力、物力和时间成本。该数据集由北京邮电大学人工智能学院等机构的研究人员于2017年创建,提供了注册的H&E和IHC染色图像对,为病理图像生成算法的研究奠定了基础。
当前挑战
BCI数据集的构建和应用面临多重挑战。首先,从H&E染色图像生成IHC染色图像需要克服图像间的结构和颜色差异,确保生成的图像能够准确反映HER2的表达水平。其次,数据集的构建过程中,图像对的配准和质量控制是关键步骤,任何配准误差或图像质量问题都可能影响模型的训练效果。此外,深度学习模型在生成IHC图像时,如何保持细胞结构的完整性和避免模式崩溃,是一个亟待解决的问题。最后,尽管已有多种图像翻译算法,但如何在弱监督或无监督的情况下实现高质量的图像生成,仍然是一个开放的研究领域。
常用场景
经典使用场景
在乳腺癌的诊断与治疗中,免疫组化(IHC)技术常用于检测人表皮生长因子受体2(HER2)的表达水平,以制定精准的治疗方案。BCI 1数据集通过提供配对的H&E染色和IHC染色图像,使得研究人员能够训练模型,直接从H&E染色图像生成IHC染色图像,从而节省人力、物力和时间成本。这一经典应用场景不仅推动了深度学习技术在病理图像生成领域的研究,也为乳腺癌的早期诊断和治疗提供了新的工具。
衍生相关工作
基于BCI 1数据集,研究者们开发了多种图像生成和翻译模型,如Pyramid Pix2pix、CUT和U-GAT-IT等。这些模型不仅在乳腺癌HER2表达评估中表现出色,还推动了图像翻译技术在其他病理图像分析任务中的应用,如肿瘤细胞分类、肿瘤分割和病理图像染色标准化等。此外,该数据集还激发了多任务学习和弱监督学习在病理图像分析中的研究,为计算机辅助诊断技术的发展提供了新的思路和方法。
数据集最近研究
最新研究方向
在乳腺癌诊断领域,Breast Cancer Immunohistochemical (BCI) 1数据集的最新研究方向主要集中在利用深度学习技术从H&E染色图像生成免疫组化(IHC)染色图像。这一研究方向旨在通过直接生成IHC染色图像来减少人力、物力和时间成本,同时提高HER2表达水平的检测精度。前沿研究不仅关注图像生成算法的创新,还强调了数据集的构建和挑战赛的设计,以推动该领域的技术进步。通过这些研究,期望能够激发更多学者共同探索更高质量的IHC染色图像生成方法,从而为乳腺癌的精准治疗提供有力支持。
相关研究论文
  • 1
    Breast Cancer Immunohistochemical Image Generation: a Benchmark Dataset and Challenge Review北京朝阳医院,首都医科大学 · 2023年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作