five

FreeTumor

收藏
github2024-12-31 更新2025-01-01 收录
下载链接:
https://github.com/Luffy03/FreeTumor
下载链接
链接失效反馈
官方服务:
资源简介:
FreeTumor是一个用于大规模肿瘤合成的简单基线,支持多种肿瘤/病变,包括肝脏肿瘤、胰腺肿瘤、肾脏肿瘤和COVID-19。数据集的组织结构包括多个子数据集,如肝脏、胰腺、肾脏等,标签定义明确,用于肿瘤位置模拟。

FreeTumor is a simple baseline for large-scale tumor synthesis, which supports a wide range of tumors and lesions including liver tumors, pancreatic tumors, kidney tumors and COVID-19. The dataset is structured with multiple sub-datasets such as those for liver, pancreas, kidney and other organs, with well-defined labels tailored for tumor location simulation.
创建时间:
2024-12-30
原始信息汇总

FreeTumor 数据集概述

数据集简介

FreeTumor 是一个用于通过大规模肿瘤合成来扩展肿瘤分割数据集的基线工具。它支持多种肿瘤/病变的分割,包括肝肿瘤、胰腺肿瘤、肾肿瘤和COVID-19。

数据集内容

  • 训练数据集标签:可在 Hugging face 找到,包含用于肿瘤合成的器官标签。
  • 器官标签定义
    • 腹部
      • 0: 背景
      • 1: 肝脏
      • 2: 肝肿瘤
      • 3: 胰腺
      • 4: 胰腺肿瘤
      • 5: 肾脏
      • 6: 肾肿瘤
    • 胸部
      • 0: 背景
      • 1: 肺
      • 2: 病变

数据集路径结构

├── /data/FreeTumor ├── Dataset003_Liver ├── Dataset007_Pancreas ├── Dataset220_KiTS2023 ├── Covid19_20 ├── BTCV ├── Flare22 ├── Flare23 ├── Amos2022 ├── WORD ├── PANORAMA ├── AbdomenCT-1K ├── CHAOS ├── Dataset082_TCIA_Pancreas-CT ├── Dataset009_Spleen ├── Dataset010_Colon ├── Dataset224_AbdomenAtlas1.0 ├── MELA ├── 3Dircadb1_convert ├── TCIAcovid19 ├── stoic21 └── LIDC

实现方法

  • 基线分割模型:用于合成训练的判别器,位于 ./baseline/ 目录下。
  • 训练命令
    • 合成训练:sh Syn_train.sh
    • 分割训练:sh Free_train.sh
  • 训练参数
    • data: lits, panc, kits,用于训练不同类型的分割模型。
    • task: onlylabeled 或 freesyn,onlylabeled 表示仅使用真实肿瘤进行训练。
    • use_ssl_pretrained: 是否使用预训练模型。
    • baseline_seg_dir: 基线分割模型的路径。
    • TGAN_checkpoint: 生成模型的路径。

合成可视化

合成可视化代码位于 /Syn_data 目录下,需修改数据路径和保存结果的路径。

引用

  • FreeTumor 论文@article{wu2024freetumor, title={FreeTumor: Advance Tumor Segmentation via Large-Scale Tumor Synthesis}, author={Wu, Linshan and Zhuang, Jiaxin and Ni, Xuefeng and Chen, Hao}, journal={arXiv preprint arXiv:2406.01264}, year={2024}}
  • 其他相关论文:包括 @article{wu2024large, title={Large-Scale 3D Medical Image Pre-training with Geometric Context Priors}, author={Wu, Linshan and Zhuang, Jiaxin and Chen, Hao}, journal={arXiv preprint arXiv:2410.09890}, year={2024}} 等。
搜集汇总
数据集介绍
main_image_url
构建方式
FreeTumor数据集的构建基于大规模肿瘤合成技术,旨在扩展肿瘤分割数据集。该数据集通过整合多种来源的医学影像数据,包括肝脏、胰腺、肾脏肿瘤以及COVID-19病变的标签数据。具体而言,腹部器官标签主要来源于原始数据集,部分由CT基础模型VoCo生成,而肺部标签则通过lungmask工具生成。这些标签虽不完全精确,但足以用于肿瘤位置的模拟。数据集的组织结构清晰,涵盖了多个公开的医学影像数据集,如BTCV、Flare22、Amos2022等,确保了数据的多样性和广泛性。
使用方法
使用FreeTumor数据集时,用户首先需要训练一个基线分割模型作为合成训练的判别器,或直接下载提供的模型。合成训练通常在8个H800 GPU上进行,而分割训练则可以在单个3090 GPU上完成。用户可以通过简单的命令启动合成训练和分割训练。数据集还支持训练通用模型和专用模型,用户可以根据需求修改标签和训练参数。训练完成后,生成模型可用于肿瘤合成,进一步提升分割模型的性能。此外,数据集还提供了可视化代码,便于用户保存和查看合成结果。
背景与挑战
背景概述
FreeTumor数据集由Linshan Wu等人于2024年提出,旨在通过大规模肿瘤合成技术扩展肿瘤分割数据集的应用范围。该数据集支持多种肿瘤类型的分割,包括肝脏肿瘤、胰腺肿瘤、肾脏肿瘤以及COVID-19相关病变。FreeTumor的构建基于一系列公开的医学影像数据集,并借助CT基础模型VoCo和lungmask生成器官标签。该数据集的研究背景源于医学影像分析领域对高质量、大规模肿瘤分割数据的迫切需求,尤其是在深度学习模型训练中,数据的多样性和规模直接影响模型的泛化能力。FreeTumor的发布为肿瘤分割研究提供了新的数据资源,推动了相关领域的技术进步。
当前挑战
FreeTumor数据集在构建和应用过程中面临多重挑战。首先,肿瘤分割任务本身具有高度复杂性,不同肿瘤类型在影像中的表现差异显著,且边界模糊,导致分割精度难以保证。其次,数据集的构建依赖于多个公开数据集,这些数据集在采集标准、分辨率和标注质量上存在差异,增加了数据整合和预处理的难度。此外,肿瘤合成技术的应用虽然扩展了数据规模,但合成数据的真实性和多样性仍需进一步验证,以确保其在模型训练中的有效性。最后,大规模数据的存储和计算需求对硬件资源提出了较高要求,尤其是在合成训练和分割训练过程中,多GPU并行计算成为必要手段。
常用场景
经典使用场景
FreeTumor数据集在医学影像分析领域具有广泛的应用,特别是在肿瘤分割任务中。通过大规模肿瘤合成技术,该数据集能够生成多样化的肿瘤样本,涵盖肝脏、胰腺、肾脏等多种器官的肿瘤类型。研究人员可以利用这些合成数据训练和验证分割模型,提升模型在真实临床数据上的泛化能力。
解决学术问题
FreeTumor数据集有效解决了医学影像分析中肿瘤分割数据稀缺的问题。传统的肿瘤分割研究往往受限于真实数据的获取难度和标注成本,而FreeTumor通过合成技术生成了大量高质量的肿瘤样本,显著扩展了数据集规模。这不仅为研究人员提供了丰富的训练资源,还推动了肿瘤分割算法的创新与优化。
实际应用
在实际应用中,FreeTumor数据集为临床诊断和治疗提供了重要支持。通过训练基于该数据集的分割模型,医生可以更准确地定位和识别肿瘤区域,辅助制定个性化的治疗方案。此外,该数据集还可用于开发智能医疗系统,提升肿瘤检测的自动化水平和诊断效率。
数据集最近研究
最新研究方向
在医学影像分析领域,肿瘤分割技术一直是研究的核心焦点之一。FreeTumor数据集的推出,为大规模肿瘤合成与分割提供了新的研究范式。该数据集通过生成多样化的肿瘤影像,显著扩展了现有肿瘤分割数据集的规模与多样性,涵盖了肝脏、胰腺、肾脏以及COVID-19等多种肿瘤类型。其创新之处在于利用CT基础模型和生成对抗网络(GAN)技术,实现了肿瘤位置的高效模拟与合成,为训练更精准的分割模型提供了丰富的数据支持。这一研究方向不仅推动了肿瘤分割算法的性能提升,还为医学影像的自动化分析与诊断提供了新的可能性。FreeTumor的发布,标志着肿瘤合成技术在医学影像领域的应用迈出了重要一步,为未来的研究奠定了坚实的基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作