S-SYNTH
收藏arXiv2025-04-06 更新2025-04-09 收录
下载链接:
https://github.com/marinbenc/dermatoscopy_colorimetry_eval
下载链接
链接失效反馈官方服务:
资源简介:
S-SYNTH数据集是由 Faculty of Electrical Engineering, Computer Science and Information Technology, Osijek 创建的合成数据集,包含10,000张皮肤镜图像和分割掩模,通过改变黑色素含量、病变形状、毛发模型和18种不同的光照条件生成。该数据集用于评估皮肤颜色测量方法的性能,特别是对光照条件的稳健性和不变性。
The S-SYNTH dataset is a synthetic dataset created by the Faculty of Electrical Engineering, Computer Science and Information Technology, Osijek. It contains 10,000 dermoscopic images and segmentation masks, which are generated by varying melanin content, lesion shapes, hair models and 18 different lighting conditions. This dataset is used to evaluate the performance of skin color measurement methods, particularly their robustness and invariance to lighting conditions.
提供机构:
Faculty of Electrical Engineering, Computer Science and Information Technology, Osijek, Croatia
创建时间:
2025-04-06
搜集汇总
数据集介绍

构建方式
S-SYNTH数据集通过合成渲染技术构建,包含10,000张皮肤镜图像及分割掩膜,精确控制黑色素含量、病灶形态、毛发模型及18种光照条件等参数。采用分层抽样策略确保各生成参数的均衡分布,并通过CIE-Lab色彩空间转换和ITA公式计算实现客观量化。数据生成过程基于公开的皮肤镜图像渲染系统,其核心优势在于可精确指定渲染时的真实黑色素含量,为光照不变性研究提供可控实验环境。
特点
该数据集具有多维度参数化特性,其核心价值体现在三个方面:通过预设黑色素分数建立与Fitzpatrick类型的直接映射,确保标签不受光照干扰;包含临床常见的18种光照变化场景,系统性评估算法鲁棒性;提供精确分割掩膜支持最优分割假设验证。区别于真实临床数据,合成机制消除了采集设备差异带来的噪声,但保留了毛发遮挡、病灶异质性等关键干扰因素,为肤色测量方法提供标准化测试平台。
使用方法
研究者可通过三种路径利用该数据集:基于分割掩膜提取健康皮肤区域进行传统色度分析,采用k-means聚类实现无监督颜色量化,或训练带有高斯模糊正则化的深度网络。建议优先验证算法在18种光照条件下的性能波动,并通过Bland-Altman分析比较不同方法的系统性偏差。数据集特别适用于开发光照不变的肤色测量模型,其合成标签可支持Fitzpatrick分类器的预训练,但需注意通过真实临床数据验证迁移效果。
背景与挑战
背景概述
S-SYNTH数据集由克罗地亚奥西耶克电气工程、计算机科学与信息技术学院的Marin Benčević等人于2024年创建,旨在解决皮肤镜图像中肤色测量的关键问题。该数据集通过精确控制黑色素含量、病变形状、毛发模型及18种不同光照条件,为评估肤色测量方法的鲁棒性提供了标准化平台。其核心贡献在于首次实现了对皮肤黑色素含量的定量控制,弥补了临床图像数据缺乏可靠肤色标注的空白,对消除AI在皮肤病诊断中的肤色偏见具有里程碑意义。数据集采用Fitzpatrick分型和个体类型学角度(ITA)双重量化标准,为肤色相关研究提供了多维度的评估框架。
当前挑战
在领域问题层面,S-SYNTH面临肤色测量方法对光照条件敏感性的核心挑战,现有技术如基于分块的方法在特定光照下产生系统性偏差。数据构建过程中,研究者需克服合成图像与真实临床数据间的域适应问题,包括毛发建模的解剖学准确性、病变形状的多样性模拟等。多变量控制要求精确协调黑色素含量参数化与18种光照条件的物理渲染,确保生成图像的生物力学合理性。此外,将连续黑色素分数离散化为Fitzpatrick类型时,需解决类型边界处的标签模糊问题,这对神经网络模型的训练稳定性构成显著挑战。
常用场景
经典使用场景
S-SYNTH数据集在皮肤科图像分析领域具有重要价值,其经典使用场景主要围绕皮肤颜色测量的方法评估。通过精确控制合成图像中的黑色素含量、病变形状和光照条件,该数据集为研究人员提供了一个标准化的测试平台,用于评估不同颜色测量技术的鲁棒性和一致性。特别是在评估光照不变性方面,S-SYNTH数据集通过18种不同的光照条件,为研究光照对皮肤颜色估计的影响提供了丰富的数据支持。
解决学术问题
S-SYNTH数据集解决了皮肤科图像分析中的多个关键学术问题。首先,它填补了公开数据集中缺乏精确皮肤颜色测量数据的空白,使得研究人员能够基于已知的黑色素含量进行方法评估。其次,该数据集通过系统评估四种颜色测量方法(基于分割、基于补丁、颜色量化和神经网络),揭示了不同方法在光照不变性方面的表现差异,为设计公平可靠的皮肤颜色估计方法提供了科学依据。此外,该数据集还促进了关于AI公平性和皮肤颜色偏差的研究。
衍生相关工作
S-SYNTH数据集已经衍生出多项经典研究工作。基于该数据集,研究人员开发了新的皮肤颜色测量方法,如改进的颜色量化技术和基于分割的ITA估计方法。该数据集还被用于评估深度神经网络在皮肤颜色分类中的表现,推动了光照不变性模型的研究。此外,相关研究还探讨了皮肤颜色偏差在皮肤病变分类中的影响,为AI公平性研究提供了重要案例。这些工作不仅扩展了S-SYNTH数据集的应用范围,也为皮肤科图像分析领域树立了新的研究标杆。
以上内容由遇见数据集搜集并总结生成



