F3Seg

Hugging Face2026-02-09 更新2026-02-10 收录

下载链接：

https://huggingface.co/datasets/yulin225/F3Seg

下载链接

链接失效反馈

官方服务：

资源简介：

F3Seg项目使用了多个医学图像分割数据集来验证其零样本泛化模型。这些数据集包括：1) CXR（胸部X光）数据集，用于肺部区域分割；2) ISIC数据集，专注于黑色素瘤和皮肤病变分割；3) PH2数据集，用于皮肤镜图像分析；4) WBC（白细胞）数据集，用于血细胞分割；5) BUSI（乳腺超声图像）数据集，用于乳腺肿瘤分割。这些数据集涵盖了不同的医学成像模态（X光、皮肤镜、显微镜、超声）和多种解剖结构/病变类型，为医学图像分割任务提供了多样化的测试基准。

The F3Seg project utilizes multiple medical image segmentation datasets to validate its zero-shot generalization model. These datasets include: 1) The CXR (Chest X-ray) dataset for lung region segmentation; 2) The ISIC dataset focusing on melanoma and skin lesion segmentation; 3) The PH2 dataset for dermoscopic image analysis; 4) The WBC (White Blood Cell) dataset for blood cell segmentation; 5) The BUSI (Breast Ultrasound Image) dataset for breast tumor segmentation. These datasets cover diverse medical imaging modalities (X-ray, dermoscopy, microscopy, ultrasound) and multiple anatomical structures/lesion types, providing a diversified test benchmark for medical image segmentation tasks.

创建时间：

2026-02-08

原始信息汇总

F3Seg数据集概述

数据集基本信息

数据集名称：F3Seg
许可证：Apache 2.0
核心用途：用于医学图像分割的零样本泛化模型

数据集支持的具体医学图像分割任务

CXR (Chest X-Ray)：胸部X光片的肺部分割
ISIC：黑色素瘤和皮肤病变分割
PH2：皮肤镜图像分析
WBC：白细胞分割
BUSI：乳腺超声成像

数据集关联的外部数据源链接

CXR数据集：https://www.kaggle.com/datasets/score42/chest-x-ray-dataset
ISIC数据集：https://challenge.isic-archive.com/data/#2018
PH2数据集：https://www.kaggle.com/datasets/athina123/ph2dataset?select=trainy
WBC数据集：https://github.com/zxaoyou/segmentation_WBC/tree/master
BUSI数据集：https://www.kaggle.com/datasets/aryashah2k/breast-ultrasound-images-dataset

模型方法概述

基础模型：结合SAM（Segment Anything Model）和CLIP（Contrastive Language-Image Pre-training）
关键技术：自适应过滤，基于统计测量进行动态阈值处理
处理流程：
1. 自动掩码生成
2. 裁剪提取
3. CLIP排序
4. 自适应阈值处理
5. SAM细化

使用配置

主要脚本：main.py
关键参数：
- --config：数据集配置文件路径（必需）
- --data：使用的数据集：cxr, isic, ph2, wbc, busi, clinicdb（必需）
- --mode：推理模式 - "sam_clip" 或 "sam_prompted"
- --prompt_mode：视觉提示模式 - crops, crop_expand, bbox, contour, reverse_box_mask
- --seed：随机种子

依赖资源

SAM检查点需从 https://github.com/facebookresearch/segment-anything?tab=readme-ov-file#model-checkpoints 下载
CLIP模型（ViT-L/14）在首次使用时自动下载

致谢

SAM项目：https://github.com/facebookresearch/segment-anything
SaLIP项目：https://github.com/aleemsidra/SaLIP
CLIP项目：https://github.com/openai/CLIP

搜集汇总

数据集介绍

构建方式

在医学影像分析领域，F3Seg数据集的构建体现了零样本泛化模型的创新设计。该数据集整合了多种医学影像资源，包括胸部X光、皮肤病变、超声图像等，通过自动掩码生成技术提取候选区域，并利用视觉-语言预训练模型进行语义筛选。构建过程中，采用自适应阈值策略动态选择最相关的分割掩码，确保了数据标注的准确性与多样性，为模型训练提供了高质量的基准测试集。

使用方法

使用F3Seg数据集时，研究人员可通过配置参数灵活调整推理流程。主要入口脚本接受数据集配置文件、模态选择及提示模式等参数，支持自动掩码生成与CLIP排序的集成。用户需预先下载模型检查点并设置环境依赖，随后运行命令即可执行分割任务，实现从原始图像到精细化掩码的端到端处理，适用于疾病检测与影像分析等多种应用场景。

背景与挑战

背景概述

医学图像分割领域长期面临标注数据稀缺与模型泛化能力不足的挑战，尤其在处理多模态、多中心的临床影像时。F3Seg数据集应运而生，其构建于2023年前后，由研究团队整合了包括CXR胸片、ISIC皮肤镜图像、BUSI乳腺超声在内的六类公开医学影像数据集，旨在探索零样本泛化分割技术。该数据集的核心研究问题聚焦于如何利用预训练基础模型（如SAM和CLIP）实现无需目标域标注的跨模态医学图像分割，为临床辅助诊断提供了可扩展的解决方案，推动了自适应医学人工智能的发展。

当前挑战

F3Seg数据集所针对的领域挑战在于医学图像分割中存在的显著域差异与标注成本高昂问题，具体表现为不同成像设备、解剖结构及病理特征导致的分布偏移，使得传统监督模型难以直接迁移。在构建过程中，研究团队需克服多源数据标准化、异质模态对齐以及提示工程优化等难题，例如如何设计有效的文本提示以引导CLIP模型准确识别病变区域，并利用自适应阈值策略在候选掩码中筛选出最具语义相关性的分割结果，从而在零样本设定下实现稳健的性能。

常用场景

经典使用场景

在医学影像分析领域，F3Seg数据集为零样本泛化分割任务提供了关键支持。该数据集整合了多种模态的医学图像，如胸部X光、皮肤镜图像和超声影像，通过结合SAM的自动掩码生成与CLIP的语义对齐能力，实现了无需特定训练即可跨疾病类型进行精确分割。这一场景典型应用于研究新型分割模型的泛化性能，尤其在数据稀缺或标注成本高昂的医疗环境中，为探索零样本学习机制奠定了实验基础。

解决学术问题

F3Seg数据集主要解决了医学图像分割中模型泛化能力不足的学术难题。传统分割方法往往依赖于大量标注数据，难以适应未见过的疾病类型或成像设备。该数据集通过引入文本提示与视觉特征的对比学习，使模型能够理解语义描述与图像区域的关联，从而在零样本设置下实现准确分割。这不仅推动了自适应阈值选择与多模态融合方法的发展，也为小样本学习、领域自适应等研究方向提供了可验证的基准。

实际应用

在实际医疗诊断中，F3Seg数据集支持多种临床应用场景。例如，在胸部X光影像中自动分割肺部区域以辅助肺炎检测，在皮肤镜图像中识别黑色素瘤病变边界，或在乳腺超声中勾勒肿瘤轮廓。这些应用显著提升了诊断效率与一致性，尤其适用于资源有限的医疗机构，通过减少对专家标注的依赖，使自动化分割技术更易于部署到多样化的临床环境中。

数据集最近研究