ssynth_data
收藏S-SYNTH 数据集概述
数据集简介
S-SYNTH 是一个开源的、灵活的皮肤模拟框架,用于快速生成合成皮肤模型和图像。该框架通过数字渲染一个解剖学启发的多层、多组件皮肤和生长性病变模型,能够生成高度详细的 3D 皮肤模型和多样人类皮肤色调的合成图像,完全控制底层参数和图像形成过程。
框架详情
S-SYNTH 可以生成带有注释(包括分割掩码)的合成皮肤图像,具有以下变化:
- 毛发伪影
- 血液分数
- 病变形状
- 黑色素体分数
- 每像素样本(用于渲染)
- 光照条件
数据集来源
- 论文: https://arxiv.org/abs/2408.00191
- 代码: https://github.com/DIDSR/ssynth-release
- 数据: https://huggingface.co/datasets/didsr/ssynth_data
数据集用途
S-SYNTH 旨在通过生成合成皮肤数据来增强有限的患者数据集,并识别 AI 性能趋势。
直接用途
- 评估皮肤病分析任务中的 AI 性能趋势
- 估计皮肤外观(如肤色、毛发存在、病变形状和血液分数)对 AI 病变分割性能的影响
- 缓解错误标记示例和有限患者数据集的限制
- 用于训练或测试预训练的 AI 模型
超出范围的用途
- 不能替代真实患者示例来做出性能判断
数据集结构
S-SYNTH 数据集按参数组织成目录结构。每个文件夹包含两个版本的配对皮肤图像和病变分割掩码(裁剪和未裁剪),图像被裁剪以确保病变大小的多样性。裁剪大小在 crop_size.txt 文件中提供。
数据加载
可以使用以下代码直接下载或访问数据: python from datasets import load_dataset data_test = load_dataset("didsr/ssynth_data", split="output_10k") print(data_test)
偏差、风险和限制
模拟测试受限于对象模型和采集系统中的参数变化。如果模拟示例未捕捉到真实患者的变异性,可能会误判模型性能。详细讨论请参见论文。
如何使用
数据集旨在展示 S-SYNTH 皮肤模型可以模拟的变体类型。关联的预生成数据集可用于增强有限的真实患者训练数据集,用于皮肤分割任务。
引用
@article{kim2024ssynth, title={Knowledge-based in silico models and dataset for the comparative evaluation of mammography AI for a range of breast characteristics, lesion conspicuities and doses}, author={Kim, Andrea and Saharkhiz, Niloufar and Sizikova, Elena and Lago, Miguel, and Sahiner, Berkman and Delfino, Jana G., and Badano, Aldo}, journal={International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI)}, volume={}, pages={}, year={2024} }




