ssynth_data

Hugging Face2024-08-02 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/didsr/ssynth_data

下载链接

链接失效反馈

官方服务：

资源简介：

S-SYNTH 是一个开源的、灵活的皮肤模拟框架，用于快速生成合成皮肤模型和图像，通过数字渲染一个解剖学启发的多层、多组分皮肤和生长性病变模型。该框架允许生成高度详细的3D皮肤模型和多样人类皮肤色调的数字渲染合成图像，具有对底层参数和图像形成过程的完全控制。S-SYNTH 可以用于生成带有注释（包括分割掩码）的合成皮肤图像，具有多种变化，如毛发伪影、血液分数、病变形状、黑色素分数、每像素样本（用于渲染）和光照条件。该数据集旨在通过生成合成皮肤数据来增强有限的病人数据集并识别AI性能趋势。

S-SYNTH is an open-source, flexible skin simulation framework designed for rapid generation of synthetic skin models and images, which digitally renders anatomically inspired multi-layered, multi-component skin and growing lesion models. This framework enables the creation of highly detailed 3D skin models and digitally rendered synthetic images across a diverse range of human skin tones, with full control over underlying parameters and the image formation process. S-SYNTH can be used to generate synthetic skin images with annotations including segmentation masks, featuring various variations such as hair artifacts, blood fraction, lesion shape, melanin fraction, samples per pixel (for rendering), and lighting conditions. This dataset aims to augment limited patient datasets and identify AI performance trends by generating synthetic skin data.

创建时间：

2024-08-02

原始信息汇总

S-SYNTH 数据集概述

数据集简介

S-SYNTH 是一个开源的、灵活的皮肤模拟框架，用于快速生成合成皮肤模型和图像。该框架通过数字渲染一个解剖学启发的多层、多组件皮肤和生长性病变模型，能够生成高度详细的 3D 皮肤模型和多样人类皮肤色调的合成图像，完全控制底层参数和图像形成过程。

框架详情

S-SYNTH 可以生成带有注释（包括分割掩码）的合成皮肤图像，具有以下变化：

毛发伪影
血液分数
病变形状
黑色素体分数
每像素样本（用于渲染）
光照条件

数据集来源

论文: https://arxiv.org/abs/2408.00191
代码: https://github.com/DIDSR/ssynth-release
数据: https://huggingface.co/datasets/didsr/ssynth_data

数据集用途

S-SYNTH 旨在通过生成合成皮肤数据来增强有限的患者数据集，并识别 AI 性能趋势。

直接用途

评估皮肤病分析任务中的 AI 性能趋势
估计皮肤外观（如肤色、毛发存在、病变形状和血液分数）对 AI 病变分割性能的影响
缓解错误标记示例和有限患者数据集的限制
用于训练或测试预训练的 AI 模型

超出范围的用途

不能替代真实患者示例来做出性能判断

数据集结构

S-SYNTH 数据集按参数组织成目录结构。每个文件夹包含两个版本的配对皮肤图像和病变分割掩码（裁剪和未裁剪），图像被裁剪以确保病变大小的多样性。裁剪大小在 crop_size.txt 文件中提供。

数据加载

可以使用以下代码直接下载或访问数据： python from datasets import load_dataset data_test = load_dataset("didsr/ssynth_data", split="output_10k") print(data_test)

偏差、风险和限制

模拟测试受限于对象模型和采集系统中的参数变化。如果模拟示例未捕捉到真实患者的变异性，可能会误判模型性能。详细讨论请参见论文。

如何使用

数据集旨在展示 S-SYNTH 皮肤模型可以模拟的变体类型。关联的预生成数据集可用于增强有限的真实患者训练数据集，用于皮肤分割任务。

引用

@article{kim2024ssynth, title={Knowledge-based in silico models and dataset for the comparative evaluation of mammography AI for a range of breast characteristics, lesion conspicuities and doses}, author={Kim, Andrea and Saharkhiz, Niloufar and Sizikova, Elena and Lago, Miguel, and Sahiner, Berkman and Delfino, Jana G., and Badano, Aldo}, journal={International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI)}, volume={}, pages={}, year={2024} }

搜集汇总

数据集介绍

构建方式

S-SYNTH数据集通过数字渲染技术构建，基于解剖学启发的多层多组分皮肤模型和病变生长模型，生成高度详细的3D皮肤模型和合成图像。该框架允许用户完全控制底层参数和图像生成过程，生成多样化的皮肤色调、毛发伪影、血液分数、病变形状等变化的合成皮肤图像，并附带分割掩码注释。数据集的构建过程通过模拟不同光照条件、病变旋转角度等参数，确保了数据的多样性和真实性。

特点

S-SYNTH数据集的特点在于其高度可控性和多样性。通过灵活的参数设置，用户可以生成不同皮肤色调、毛发密度、病变形状和血液分数的合成图像。数据集提供了裁剪和未裁剪版本的图像及其对应的分割掩码，确保病变大小的多样性。此外，数据集还包含详细的参数文件夹结构，便于用户根据需求选择特定条件下的图像进行实验。这种设计使得S-SYNTH成为评估AI模型在皮肤病学分析任务中性能的理想工具。

使用方法

S-SYNTH数据集主要用于增强有限的真实患者数据集，并评估AI模型在皮肤病学任务中的性能趋势。用户可以通过Hugging Face数据加载器直接访问数据集，或下载预生成的数据集。数据集适用于训练或测试预训练的AI模型，特别是在皮肤病变分割任务中。通过模拟不同皮肤外观和病变特征，S-SYNTH能够帮助研究人员识别AI模型在不同条件下的性能变化，并减少因数据标签错误或数据量不足带来的影响。

背景与挑战

背景概述

S-SYNTH数据集是由Andrea Kim、Niloufar Saharkhiz、Elena Sizikova等研究人员于2024年共同开发的一个开源皮肤模拟框架，旨在通过数字渲染生成高度详细的三维皮肤模型和合成图像。该数据集的核心研究问题在于解决皮肤病学分析任务中真实患者数据不足的问题，特别是针对不同肤色、毛发、病变形状等多样性的皮肤图像生成。S-SYNTH的推出为皮肤病学领域的研究提供了重要的数据支持，尤其是在AI模型训练和性能评估方面，显著提升了模型在病变分割任务中的鲁棒性和泛化能力。

当前挑战

S-SYNTH数据集在构建过程中面临多重挑战。首先，生成高度逼真的合成皮肤图像需要精确模拟皮肤的多层结构和病变的动态变化，这对模型的复杂度和计算资源提出了极高要求。其次，尽管S-SYNTH能够生成多样化的皮肤图像，但其模拟结果仍可能无法完全捕捉真实患者数据的复杂性和变异性，这可能导致AI模型在实际应用中的性能评估存在偏差。此外，数据集的使用范围受到限制，不能完全替代真实患者数据用于临床决策，这进一步凸显了其在真实世界应用中的局限性。

常用场景

经典使用场景

S-SYNTH数据集在皮肤病学研究中具有广泛的应用，尤其是在皮肤病变分割任务中。通过生成高度详细的3D皮肤模型和数字渲染的合成图像，研究人员可以模拟不同肤色、毛发、病变形状和血液分数等参数的变化，从而评估和比较不同AI模型在皮肤病分析任务中的表现。这一数据集的使用场景主要集中在皮肤病学AI模型的训练和测试，特别是在数据稀缺的情况下，通过合成数据增强真实患者数据集。

实际应用

在实际应用中，S-SYNTH数据集被广泛用于皮肤病学AI模型的开发和测试。医疗机构和研究机构可以利用该数据集生成大量合成皮肤图像，用于训练和验证AI模型，从而提高皮肤病诊断的准确性和效率。此外，该数据集还可用于模拟不同光照条件和皮肤特征，帮助开发更鲁棒的皮肤病诊断工具。

衍生相关工作

S-SYNTH数据集的推出催生了一系列相关研究工作，特别是在皮肤病学AI模型的性能评估和优化方面。基于该数据集的研究成果已被应用于多个皮肤病学AI模型的开发，推动了皮肤病诊断技术的进步。此外，该数据集还为皮肤病学领域的虚拟临床试验提供了重要支持，帮助研究人员在模拟环境中评估新医疗设备的性能。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集