five

eSkinHealth

收藏
arXiv2025-08-26 更新2025-08-28 收录
下载链接:
https://arxiv.org/pdf/2508.18608.pdf
下载链接
链接失效反馈
官方服务:
资源简介:
eSkinHealth是一个针对被忽视的热带皮肤病(NTDs)的多模态数据集,收集于科特迪瓦和加纳。该数据集包含5623张图片,涵盖了47种不同的皮肤病,其中包含了患者元数据和确诊标签。eSkinHealth的特点是专注于西非人群中NTDs和罕见情况。此外,该数据集还包含了语义病变掩码、实例特定的视觉字幕和临床概念。eSkinHealth为全球皮肤病学提供了宝贵的资源,旨在促进更公平、准确和可解释的AI工具的开发。

eSkinHealth is a multimodal dataset focused on neglected tropical diseases (NTDs), collected in Côte d'Ivoire and Ghana. The dataset contains 5623 images covering 47 distinct dermatological conditions, and includes patient metadata and confirmed diagnostic labels. A prominent feature of eSkinHealth is its specialization in NTDs and rare dermatological cases among West African populations. Additionally, the dataset provides semantic lesion masks, instance-specific visual captions, and clinical concepts. eSkinHealth serves as a valuable resource for global dermatology, aiming to promote the development of more equitable, accurate, and interpretable AI tools.
提供机构:
图卢兹大学
创建时间:
2025-08-26
搜集汇总
数据集介绍
main_image_url
构建方式
在皮肤被忽视热带病高发的科特迪瓦和加纳地区,eSkinHealth数据集通过训练有素的当地医护人员使用智能平板设备采集临床图像,严格遵循远程与现场诊断相结合的双重验证机制。每位病例由两位资深皮肤科医生独立诊断,分歧案例引入第三位专家仲裁,部分病例辅以PCR检测和DPP快速诊断测试以确保标签准确性。该构建流程融合了实地医疗场景的真实性与专家诊断的权威性,为AI模型提供了高可信度的学习样本。
特点
eSkinHealth聚焦于西非人群特有的皮肤被忽视热带病及罕见病症,涵盖47类疾病、5623张临床图像和1639个病例,其独特性体现在多模态标注体系上:除患者元数据与诊断标签外,还包含由多模态大语言模型生成、经皮肤科医生验证的实例级视觉描述与临床概念,以及基于Segment Anything模型生成的语义病灶掩模。该数据集首次实现了对热带病医学特征的结构化编码与视觉-文本信息的深度融合。
使用方法
该数据集支持多种计算机视觉与医疗AI研究任务,包括基于图像的疾病分类、概念瓶颈模型开发以及视觉-语言模型微调。研究者可依据病例级划分的训练-测试集进行模型验证,利用临床概念向量实现可解释诊断,或借助语义掩模推进病灶定位分析。其多模态特性尤其适用于少样本学习与零样本分类场景,为资源有限地区的皮肤病诊断工具开发提供基准数据支撑。
背景与挑战
背景概述
eSkinHealth数据集由杜兰大学与科特迪瓦、加纳的学术机构于2025年联合创建,专注于皮肤被忽视热带病(NTDs)的智能诊断研究。该数据集包含西非地区1,639个病例的5,623张临床图像,涵盖47种皮肤疾病,特别关注资源匮乏地区的罕见病症表征。其创新性在于采用多模态标注框架,整合了病变分割掩码、视觉描述文本和临床概念标签,为促进全球皮肤科医疗公平性提供了关键数据支撑。
当前挑战
该数据集主要解决皮肤被忽视热带病诊断中的样本稀缺性与地域代表性不足问题,其构建面临双重挑战:一是西非地区医疗资源有限导致高质量图像采集困难,需训练当地医护人员进行标准化拍摄;二是疾病表征多样性高且与常见皮肤病存在视觉相似性,需通过多轮专家验证确保标注准确性。此外,基于基础模型的半自动标注流程需协调AI生成效率与临床医学严谨性之间的平衡。
常用场景
经典使用场景
在热带皮肤病研究领域,eSkinHealth数据集为AI驱动的诊断模型开发提供了关键支持。该数据集通过整合西非地区现场采集的临床图像与多模态注释,成为训练和验证皮肤 neglected tropical diseases(NTDs)识别算法的核心资源。其独特价值在于覆盖了47种皮肤疾病,尤其聚焦于资源匮乏地区罕见的皮肤NTDs表现,为构建高精度分类模型提供了不可替代的数据基础。
实际应用
在实际医疗场景中,eSkinHealth可直接应用于资源有限地区的远程皮肤病诊断系统。其包含的西非人群临床图像与详细病变描述,能够辅助开发移动端诊断工具,提升社区医疗工作者对皮肤NTDs的早期识别能力。此外,该数据集支持的多模态AI模型可集成至 telehealth 平台,为加纳、科特迪瓦等 endemic regions 提供 scalable 的诊断支持,减少对专业皮肤科医生的依赖。
衍生相关工作
该数据集催生了多项经典研究工作,尤其是在AI-专家协作范式的创新应用上。基于其多模态注释结构,研究者开发了结合 Segment Anything Model (SAM) 的自动病变分割流程,以及利用 Multimodal Large Language Models (MLLMs) 生成实例级临床描述的方法。这些工作显著提升了皮肤病变标注的效率与可扩展性,并为后续研究如视觉-语言模型在皮肤病学的适配(如 LaBO 概念驱动分类)提供了基准框架。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作