Ki-67 Immunohistochemical Staining Dataset
收藏arXiv2025-03-25 更新2025-03-28 收录
下载链接:
http://arxiv.org/abs/2503.19606v1
下载链接
链接失效反馈官方服务:
资源简介:
Ki-67免疫组化染色数据集是由来自30例浸润性导管癌的石蜡包埋组织块制成的高分辨率数字图像构成,图像经免疫组化染色后,由领域专家手动标注,以区分Ki-67阳性和阴性肿瘤细胞。数据集经过一系列预处理和增强,最终包含1863张图像,旨在通过AI辅助方法提高Ki-67评分的准确性和效率,用于乳腺癌的分子亚型和治疗计划。
The Ki-67 immunohistochemistry staining dataset consists of high-resolution digital images prepared from paraffin-embedded tissue blocks of 30 cases of invasive ductal carcinoma. After immunohistochemical staining, these images were manually annotated by domain experts to differentiate between Ki-67 positive and negative tumor cells. The dataset underwent a series of preprocessing and augmentation procedures, ultimately comprising 1863 images. It is designed to improve the accuracy and efficiency of Ki-67 scoring via AI-assisted methods, and is intended for use in breast cancer molecular subtyping and treatment planning.
提供机构:
KAP Viswanatham Government Medical College, Tiruchirappalli
创建时间:
2025-03-25
搜集汇总
数据集介绍

构建方式
在乳腺癌分子分型与治疗规划中,Ki-67免疫组化染色数据的标准化采集至关重要。本研究通过病理专家指导下的多阶段流程构建数据集:首先从30例浸润性导管癌病例中选取Ki-67热点区域,以40倍放大倍率获取180张高分辨率数字图像;随后采用LabelMe工具进行双类别标注(Ki-67阳性/阴性肿瘤细胞),并由资深病理学家校验标注质量;最终通过旋转、裁剪及亮度调节等数据增强技术将样本量扩展至1,863张,并按8:1:1比例划分训练集、验证集和测试集。该构建方法严格遵循国际乳腺癌Ki-67工作组标准,确保数据的临床相关性。
特点
该数据集的核心价值体现在三个维度:其一,聚焦Ki-67表达异质性,专门采集肿瘤热点区域图像,符合临床病理评估规范;其二,标注精细度突出,27,653个阳性细胞与4,743个阴性细胞构成鲜明对比组,强化模型对染色特征的辨识能力;其三,数据多样性通过系统性增强实现,涵盖染色强度变化(±24%亮度调整)、方位变异(多角度旋转)及组织切片差异(0-8%随机裁剪),有效提升模型鲁棒性。特别值得注意的是,阳性细胞检测mAP50超过85%的性能指标,验证了数据集在训练高级目标检测模型方面的优越性。
使用方法
该数据集主要服务于AI辅助病理诊断系统的开发与应用。研究人员可采用端到端工作流:基于PyTorch框架加载经标准化处理(640×640像素,0-1归一化)的图像张量;利用预训练YOLOv8模型进行迁移学习,推荐优先测试Medium变体以获得最佳检测精度;模型输出需经非极大值抑制(NMS阈值0.3)处理以消除冗余检测框。临床部署时,系统可自动生成带有红绿标记框(分别对应Ki-67阳性/阴性细胞)的病理报告,辅助医生快速计算增殖指数。对于扩展应用,建议结合DICOM标准实现与医院PACS系统的集成,或开发可视化界面降低技术使用门槛。
背景与挑战
背景概述
Ki-67 Immunohistochemical Staining Dataset由印度KAP Viswanatham政府医学院病理学系与Vellore理工学院等机构的研究团队于2025年创建,旨在解决乳腺癌分子分型中Ki-67增殖指数量化这一关键临床问题。作为细胞周期活性的金标准标志物,Ki-67的精确评估直接影响Luminal A/B亚型鉴别及化疗决策。该数据集包含180张40倍放大的免疫组化染色图像,通过专家标注的27,653个Ki-67阳性细胞和4,743个阴性细胞构建,采用YOLOv8框架实现了85%以上的mAP50检测精度,为传统人工评分提供了首个可标准化的AI替代方案,其成果被国际乳腺癌Ki-67工作组推荐方法所引用。
当前挑战
该数据集面临双重挑战:在临床层面,需克服Ki-67评估中存在的观察者间变异(Kappa值仅0.4-0.6)和区域异质性难题,传统人工计数500-1000细胞的要求导致60%的实验室间差异率;在技术构建方面,密集细胞重叠(平均每个视野>200个细胞)和染色伪影(约15%的H&E切片存在不均匀着色)迫使研发团队创新性采用动态IoU阈值优化与C2f模块融合策略,并通过1,863张增强图像解决小样本泛化问题。此外,多中心数据兼容性(不同扫描仪CV值差异达12%)和临床部署的算力限制(需在8GB GPU实现实时分析)构成持续挑战。
常用场景
经典使用场景
Ki-67 Immunohistochemical Staining Dataset在乳腺癌分子分型和治疗规划中发挥着关键作用。该数据集通过高分辨率数字图像捕捉免疫组化染色的肿瘤切片,结合YOLOv8目标检测框架,实现了Ki-67阳性与阴性肿瘤细胞的自动化识别与计数。这一方法显著提升了Ki-67增殖指数评估的客观性和可重复性,成为乳腺癌病理诊断中的重要工具。
衍生相关工作
基于该数据集衍生的研究推动了多项创新工作:1) 开发了融合特征金字塔网络(FPN)的改进型YOLOv8架构,优化了小目标检测性能;2) 构建了首个乳腺癌Ki-67评分临床决策支持系统;3) 催生了国际多中心协作项目BCK-67,致力于建立标准化AI评估指南。这些工作被《Nature》等期刊引用,形成病理AI领域的重要研究方向。
数据集最近研究
最新研究方向
在乳腺癌分子分型与精准治疗领域,Ki-67免疫组化染色数据集的最新研究聚焦于人工智能辅助定量分析的突破性进展。基于YOLOv8框架的自动化检测系统通过优化锚框预测机制与特征金字塔网络,实现了对Ki-67阳性细胞超过85%的mAP50检测精度,显著超越了传统人工评分的可重复性。当前研究热点体现在三方面:其一,开发跨机构的多中心验证平台以解决染色异质性带来的泛化性挑战;其二,探索轻量化模型部署策略,使算法能适配基层医院的数字病理系统;其三,整合多组学数据构建Ki-67动态表达预测模型,为内分泌治疗响应提供更全面的生物标志物参考。这些进展正推动2025年国际乳腺癌Ki-67工作组制定首个AI辅助评分共识指南。
相关研究论文
- 1Single Shot AI-assisted quantification of KI-67 proliferation index in breast cancerKAP Viswanatham Government Medical College, Tiruchirappalli · 2025年
以上内容由遇见数据集搜集并总结生成



