VessShape

Name: VessShape
Creator: 圣卡洛斯联邦大学计算机科学系
Published: 2025-11-01 01:19:33
License: 暂无描述

arXiv2025-11-01 更新2025-11-04 收录

下载链接：

https://github.com/galvaowesley/vess-shape-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

VessShape是一个为预训练形状感知血管分割模型而设计的合成数据集生成方法。该数据集包含由贝塞尔曲线生成的管状几何形状，并结合了广泛的前景和背景纹理。通过在保持几何先验的同时多样化纹理，数据集明确鼓励模型学习形状特征而不是表面的纹理。VessShape旨在通过使用合成数据显式地注入强烈的形状偏置，同时系统地多样化纹理，以训练神经网络分割任何血管组织，这些组织遵循从VessShape获得的形状先验。数据集适用于解决在医学图像分析中由于缺乏大型标注数据集和模型在不同成像模态上的泛化能力差而导致的血管分割问题。

VessShape is a synthetic dataset generation method designed for pre-trained shape-aware vascular segmentation models. This dataset comprises tubular geometric shapes generated via Bezier curves, combined with a wide range of foreground and background textures. By diversifying textures while preserving geometric priors, the dataset explicitly encourages models to learn shape features rather than superficial texture ones. VessShape aims to explicitly inject a strong shape bias using synthetic data while systematically diversifying textures, to train neural networks to segment any vascular tissues that follow the shape priors derived from VessShape. This dataset is applicable to addressing vascular segmentation issues in medical image analysis caused by the shortage of large-scale annotated datasets and the poor generalization ability of models across different imaging modalities.

提供机构：

圣卡洛斯联邦大学计算机科学系

创建时间：

2025-11-01

原始信息汇总

Vess-Shape-Dataset 数据集概述

数据集简介

Vess-Shape-Dataset是一个用于自动生成模拟血管外观和结构的合成数据集的Python工具包。主要目标是为图像分割模型的训练和评估提供真实数据，特别是在血管分割领域。

核心特性

合成血管生成：使用随机贝塞尔曲线创建真实的血管状掩码
纹理转换：将数据集（如ImageNet）中的纹理应用于前景（血管）和背景
融合处理：使用高斯模糊平滑融合血管和背景纹理，避免硬过渡
灵活参数：可控制复杂度、曲率、半径和每张图像中的血管数量
元数据生成：为每个生成的图像生成元数据，包括纹理来源和类别标签
网格生成：可选生成图像网格以便于可视化和比较

技术背景

该项目受"IMAGENET-TRAINED CNNS ARE BIASED TOWARDS TEXTURE; INCREASING SHAPE BIAS IMPROVES ACCURACY AND ROBUSTNESS"研究启发，通过生成血管状曲线并应用不同纹理，促使模型关注形状而非纹理特征。

使用示例

python from vessel_shape import VesselShape

vs = VesselShape( image_size=256, n_control_points=5, max_vd=100, radius=2, num_curves=3, texture_dir="imagenet_val_sample", annotation_csv="imagenet_val_sample/ILSVRC2012_img_val_annotation.csv" )

results = vs.generate(grid_dir=True, n_samples=3)

系统要求

Python 3.8+
numpy
pandas
pillow
matplotlib
tqdm
scipy

项目结构

vess_shape_dataset/：核心包代码
notebooks/：实验性笔记本和使用示例
example_imgs/：示例图像
imagenet_val_sample/：纹理样本和标注

数据集准备

将纹理图像（如ImageNet样本）放置在目录中
提供包含图像ID和类别标签的标注CSV文件

参考文献

Stylized-ImageNet
Geirhos, R. et al. "ImageNet-trained CNNs are biased towards texture; increasing shape bias improves accuracy and robustness." ICLR 2019.

搜集汇总

数据集介绍

构建方式

在血管分割领域，数据稀缺与模型泛化能力不足是长期存在的挑战。VessShape数据集通过程序化生成方法构建，利用贝塞尔曲线灵活控制血管几何形态，生成多样化的管状结构。每个血管段由随机采样的控制点定义，结合形态学膨胀操作赋予恒定厚度，形成二进制掩码。随后从ImageNet数据集中随机选取前景与背景纹理，通过高斯模糊的阿尔法蒙版进行混合，确保血管区域保留前景纹理而非血管区域维持背景特征。这种构建策略固定几何先验的同时系统化地多样化纹理，促使模型学习形状特征而非依赖表面纹理。

使用方法

该数据集主要用于预训练深度分割模型以注入形状先验知识。研究人员首先在VessShape合成图像上训练模型，通过交叉熵损失优化网络参数，使模型接触无限变化的几何结构与纹理组合。预训练完成后，模型可直接应用于零样本分割任务，或在目标域（如DRIVE视网膜数据集或VessMAP脑皮层数据集）进行少量样本微调。微调时仅需4至10张标注图像即可实现快速域适应，显著提升数据利用效率。这种使用方法突破了传统依赖大规模标注数据的限制，为医疗图像分析提供了高效且可扩展的解决方案。

背景与挑战

背景概述

血管语义分割作为医学影像分析的核心任务，其发展长期受限于标注数据稀缺与模型跨模态泛化能力不足的困境。2025年，巴西圣卡洛斯联邦大学的Wesley N. Galvão与Cesar H. Comin团队提出VessShape数据集，旨在通过合成图像注入形状先验知识，突破传统卷积神经网络对纹理特征的过度依赖。该研究聚焦于血管的管状与分支几何特性，构建了结合程序化生成结构与多样化纹理的大规模二维合成数据，为少样本学习与零样本泛化提供了新的方法论基础。

当前挑战

血管分割领域面临标注成本高昂与跨域泛化困难的双重挑战：现有数据集如DRIVE和CHASE DB1仅包含数十张标注图像，难以支撑数据驱动模型的训练；不同成像模态（如视网膜眼底摄影与脑皮层显微成像）间的纹理差异导致模型迁移性能显著下降。在数据构建层面，VessShape需平衡几何真实性与纹理多样性，通过贝塞尔曲线生成管状结构时需控制曲率参数以模拟生物血管拓扑，同时采用ImageNet纹理库进行前景背景融合，避免模型对特定纹理产生过拟合。

常用场景

经典使用场景

在医学图像分析领域，血管分割模型常面临标注数据稀缺与跨模态泛化能力不足的挑战。VessShape通过生成包含贝塞尔曲线构建的管状几何结构与多样化纹理的合成图像，为模型预训练提供了理想平台。其经典应用场景体现在利用合成数据引导卷积神经网络聚焦血管的形态特征，而非表层纹理，从而在视网膜眼底图像和脑皮层显微图像等不同模态数据上实现高效的小样本分割。

解决学术问题

该数据集有效解决了血管分割中因标注数据有限导致的模型过拟合问题，以及传统方法对纹理特征过度依赖造成的域适应障碍。通过注入强形状先验，VessShape使模型在仅需4-10个标注样本的情况下，在DRIVE和VessMAP等真实数据集上达到优异的分割性能，显著提升了模型对血管分支结构、管径变化等几何特征的感知能力，为零样本跨域泛化提供了理论支撑。

实际应用

在临床实践中，VessShape驱动的分割模型可快速适配不同成像设备获取的血管图像，如眼科诊断中的视网膜血管分析、神经科学中的脑微血管观测等场景。其零样本能力允许模型在未经过特定训练的情况下，直接处理荧光显微镜图像与眼底照片，显著降低了医疗机构对大规模标注数据的依赖，为便携式医疗设备的实时血管分析提供了技术基础。

数据集最近研究