five

HQColon

收藏
arXiv2025-02-28 更新2025-03-04 收录
下载链接:
http://arxiv.org/abs/2502.21183v1
下载链接
链接失效反馈
官方服务:
资源简介:
HQColon数据集是由哥本哈根大学计算机科学系创建的高分辨率结肠标注数据集。该数据集通过使用基于规则的传统分割方法和交互式机器学习相结合的半自动化管道生成,旨在为nnU-Net模型提供训练数据,以实现从CT结肠造影图像中全自动分割出高分辨率的结肠结构。数据集包含了825名50岁及以上患者的3451个CT扫描,经过筛选和专家验证,最终形成了包含435个高质量标注的CT扫描数据集。该数据集可应用于临床和研究领域,如数字孪生和个性化医疗,有助于推进结肠分割技术的准确性。

The HQColon dataset is a high-resolution colon annotation dataset developed by the Department of Computer Science, University of Copenhagen. It was constructed via a semi-automated pipeline combining rule-based traditional segmentation methods and interactive machine learning, with the goal of providing training data for the nnU-Net model to enable fully automatic segmentation of high-resolution colon structures from CT colonography images. The dataset initially contains 3451 CT scans from 825 patients aged 50 years or older. After screening and expert validation, a final dataset consisting of 435 high-quality annotated CT scans was obtained. This dataset can be applied in clinical and research fields such as digital twins and personalized medicine, helping to advance the accuracy of colon segmentation technologies.
提供机构:
哥本哈根大学
创建时间:
2025-02-28
搜集汇总
数据集介绍
main_image_url
构建方式
HQColon数据集的构建采用了半自动化标注流程,首先利用区域生长算法与交互式机器学习相结合的方式,生成高质量的高分辨率结肠标注数据集。具体而言,该流程包括使用TotalSegmentator进行空气填充结肠区域的快速标注,随后通过RootPainter进行流体填充区域的交互式标注,最终生成用于训练nnU-Net模型的结肠分割数据集。
特点
HQColon数据集的特点在于其高分辨率、高质量的结肠标注,以及包含空气和流体填充区域的详细标注。该数据集是首个开源的高分辨率结肠分割数据集,为全自动结肠分割提供了基础。此外,数据集的构建考虑了不同患者位置和性别的平衡分布,确保了模型的泛化能力。
使用方法
使用HQColon数据集时,首先需要确保数据集已正确加载并预处理。随后,可以使用该数据集训练nnU-Net模型进行全自动的结肠分割。训练过程中,可以将数据集分为训练集和测试集,以便于模型的训练和验证。最终,通过评估指标如平均对称表面距离和95th百分位数豪斯多夫距离来衡量模型的分割精度。
背景与挑战
背景概述
HQColon数据集是由Martina Finocchiaro等人于2025年创建,旨在解决高分辨率结肠分割的挑战。该数据集结合了区域生长和交互式机器学习技术,以高效准确地标注结肠,进而训练出能够全自动进行高分辨率结肠分割的nnU-Net模型。这一研究背景源于CT结肠造影技术在临床和个性化医疗应用中的重要性,如数字双胞胎和体外临床试验等。HQColon是首个开源的高分辨率结肠分割工具,其研究成果为相关领域提供了重要影响。
当前挑战
该数据集在构建过程中遇到的挑战主要包括:1) 如何实现高效准确的结肠标注,以解决传统方法中手动标注耗时过长的问题;2) 如何处理结肠复杂的形状和位置变化,以及周围充满空气的结构对分割的影响;3) 如何在保证分割精度的同时,处理collapsed colon等特殊情况。研究团队通过创新的标注流程和深度学习模型,有效应对了这些挑战。
常用场景
经典使用场景
HQColon数据集的使用场景主要集中于医学影像分析领域,特别是在高分辨率结肠标注和分割任务中。该数据集通过结合区域生长与交互式机器学习技术,生成高质量结肠标注,进而训练出能够实现全自动结肠分割的nnU-Net模型。其经典应用场景包括对CT结肠造影图像进行精确的结肠分割,以便于在临床诊断、数字孪生、个性化医疗以及AI辅助诊断工具中发挥作用。
衍生相关工作
基于HQColon数据集的研究已经衍生出一系列相关工作,包括但不限于对结肠分割算法的改进、对数据集的扩展以及将该数据集应用于更广泛的医学图像分析任务中。这些衍生工作进一步推动了医学影像分析领域的发展,提高了临床诊断的效率和准确性。
数据集最近研究
最新研究方向
在医学影像分析领域,结肠分割是临床和研究中的重要应用,如数字孪生和个性化医疗。HQColon数据集的构建,旨在解决传统方法和现有开源工具在结肠分割精度上的不足。该研究提出了一种半自动的交互式机器学习管道,结合区域生长和交互式机器学习,高效准确地标注结肠,进而训练出具有高分辨率结肠分割能力的nnU-Net模型。研究结果表明,HQColon在平均对称表面距离和95th百分位数豪斯多夫距离两个指标上,显著优于现有的TotalSegmentator工具。这一进展不仅推动了结肠分割技术的精确化,也为数字孪生、个性化医疗和AI辅助诊断工具等应用提供了有力支撑。
相关研究论文
  • 1
    HQColon: A Hybrid Interactive Machine Learning Pipeline for High Quality Colon Labeling and Segmentation哥本哈根大学 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作