HS-CMU
收藏arXiv2024-06-05 更新2024-06-21 收录
下载链接:
https://openxlab.org.cn/datasets/jiyuanmedical/HS-CMU/
下载链接
链接失效反馈官方服务:
资源简介:
HS-CMU数据集由首都医科大学附属北京朝阳医院创建,专注于通过宫腔镜诊断良恶性疾病。该数据集包含175名患者的3385张高质量宫腔镜检查图像,涵盖8种不同类型的子宫内膜病变。数据采集自2023年8月至2024年1月,使用Karl Storz TC200内窥镜相机系统,分辨率为1920×1080像素。数据集创建过程中,图像由两位经验丰富的妇产科医生使用lableme软件进行标注。HS-CMU数据集旨在辅助诊断子宫内良恶性疾病,特别是在缺乏经验丰富的医生的情况下,通过深度学习算法提高诊断准确性。
HS-CMU dataset was developed by Beijing Chaoyang Hospital Affiliated to Capital Medical University, focusing on the diagnosis of benign and malignant diseases via hysteroscopy. This dataset comprises 3385 high-quality hysteroscopic images from 175 patients, covering 8 distinct types of endometrial lesions. The data was collected between August 2023 and January 2024 using the Karl Storz TC200 endoscopic camera system with a resolution of 1920×1080 pixels. During the dataset construction process, the images were annotated by two experienced obstetricians and gynecologists using the LabelMe software. The HS-CMU dataset aims to assist in the diagnosis of benign and malignant intrauterine diseases, particularly in situations where experienced clinicians are scarce, to improve diagnostic accuracy via deep learning algorithms.
提供机构:
首都医科大学附属北京朝阳医院
创建时间:
2024-06-05
搜集汇总
数据集介绍

构建方式
在妇科内镜诊断领域,宫腔镜技术凭借其直观可视化优势,已成为筛查与诊断宫内良恶性病变的关键手段。HS-CMU数据集的构建依托于首都医科大学附属北京朝阳医院在2023年8月至2024年1月期间采集的175例患者宫腔镜手术视频。采用卡尔史托斯TC200内窥镜摄像系统,以1920×1080像素分辨率录制并存储为MP4格式。研究人员从视频中以每10帧提取一帧的方式,筛选出3385张高质量图像,涵盖黏膜下肌瘤、子宫内膜癌、子宫内膜息肉等八类病变。所有图像均由两位资深妇产科医师使用lableme软件进行病灶区域的边界框标注,确保标注的准确性与一致性。
特点
该数据集的核心特点在于其临床实用性与标注专业性。图像均来源于真实临床场景,每张图像均对应组织病理学确诊结果,确保了数据的临床可靠性。数据集涵盖八类常见宫内良恶性病变,其中子宫内膜息肉图像数量达1059张,黏膜下肌瘤、子宫内膜癌等类别亦具有充分代表性,整体包含4185个标注边界框,为模型训练提供了丰富的形态学变异样本。图像分辨率统一为高清格式,病灶标注由临床专家完成,标注信息包含精确的边界框位置与类别标签,支持目标检测与分类任务,为宫腔镜影像的智能辅助诊断研究奠定了高质量数据基础。
使用方法
该数据集主要应用于宫腔镜影像的计算机辅助诊断算法开发。研究者可通过公开平台获取数据压缩包,其中包含图像文件夹与标注文件夹,图像以“病变缩写_病例编号_帧序号.jpg”格式命名,对应标注文件为同名的文本格式。数据已划分为训练集与验证集,用户可直接用于深度学习模型训练,如基于YOLOv5等框架进行病变检测与分类。在实际应用中,该数据集能够支持构建宫腔镜影像的自动分析模型,辅助临床医生识别宫内病变区域,尤其适用于基层医疗机构缺乏病理诊断资源的场景,有望提升诊断效率并减少漏误诊风险。
背景与挑战
背景概述
宫腔镜技术作为子宫内膜病变筛查、诊断与治疗的关键手段,其直观性与准确性使其成为子宫腔病变诊断的金标准。然而,子宫形态的复杂性与多变性增加了疾病良恶性识别的难度,导致漏诊与误诊现象频发,亟需经验丰富的妇科专家与病理学家参与。在此背景下,首都医科大学附属北京朝阳医院与江苏济源医疗科技有限公司的研究团队于2024年联合发布了HS-CMU数据集,该数据集收录了2023年8月至2024年1月期间175例患者的宫腔镜手术视频,并从中精选出3385张高质量图像,涵盖黏膜下肌瘤、子宫内膜癌、子宫内膜息肉等八类常见良恶性病变。这些图像由资深妇产科医师通过专业软件进行标注,旨在为基于深度学习的宫腔镜图像辅助诊断算法提供数据基础,推动人工智能在妇科医学影像领域的应用,缓解基层医疗机构病理诊断资源匮乏的困境。
当前挑战
HS-CMU数据集致力于解决宫腔镜图像中良恶性病变自动识别的核心挑战,其难点在于病变形态的多样性与相似性,例如子宫内膜息肉与息肉样增生在视觉特征上极易混淆,而早期子宫内膜癌的镜下表现常与良性增生难以区分,这要求模型具备极高的特征判别能力。在数据集构建过程中,研究团队面临诸多实际困难:宫腔镜视频中常因出血、组织遮挡或镜头移动导致图像模糊或视野不全,需严格筛选以保障数据质量;不同病变类别的样本分布不均,如子宫内膜息肉图像多达1059张,而非典型增生仅83张,这种不平衡可能影响模型的泛化性能;此外,医学标注高度依赖专家经验,即便由两位资深医师独立完成,仍可能存在主观判断差异,需通过一致性校验确保标注的可靠性。
常用场景
经典使用场景
在妇科医学影像分析领域,HS-CMU数据集为宫腔镜图像识别提供了关键资源。该数据集通过收集175例患者的3385张高质量宫腔镜图像,涵盖子宫内膜息肉、子宫内膜癌等八类常见良恶性病变,为深度学习模型训练奠定了数据基础。其经典应用场景在于构建计算机辅助诊断系统,利用YOLOv5等目标检测算法对宫腔镜图像中的病变区域进行自动化定位与分类,辅助医生在临床实践中快速识别病灶形态特征。
实际应用
在实际临床场景中,该数据集可赋能宫腔镜手术实时辅助诊断系统。通过集成训练后的检测模型,系统能在手术过程中实时标注可疑病变区域,提示医生重点关注病理样本采集位置。这种技术尤其适用于医疗资源薄弱地区,帮助初级医师缩短经验积累周期,提升子宫内膜癌等恶性疾病的早期检出率,实现从影像筛查到病理验证的高效衔接。
衍生相关工作
基于该数据集衍生的研究已拓展至多模态诊断框架构建。部分工作将宫腔镜影像与患者临床病理信息融合,开发出端到端的预后预测模型;另有研究通过迁移学习策略,将HS-CMU的标注知识迁移至其他妇科内镜数据集,增强了模型泛化能力。这些探索进一步推动了智能宫腔镜在个性化诊疗、手术导航等前沿方向的应用深化。
以上内容由遇见数据集搜集并总结生成



