ham10000_bbox

Hugging Face2025-09-04 更新2025-09-05 收录

下载链接：

https://huggingface.co/datasets/abaryan/ham10000_bbox

下载链接

链接失效反馈

官方服务：

资源简介：

HAM10000空间注释和边界框坐标增强数据集是一个皮肤病学数据集，它扩展了原始的HAM10000数据集，增加了皮肤病变定位的边界框坐标和空间描述。数据集包含RGB皮肤病变图像、皮肤状况诊断代码、边界框坐标、自然语言位置描述、病变面积相对于图像大小的覆盖率、身体部位位置以及患者的人口统计信息。

创建时间：

2025-09-03

原始信息汇总

HAM10000 with Spatial Annotations and Bounding Box Coordinates

数据集概述

增强版HAM10000皮肤科数据集，包含皮肤病变定位的边界框坐标和空间描述。

核心特性

图像数据: RGB皮肤病变图像
诊断信息: 皮肤状况诊断代码（mel、nv、bkl等）
边界框坐标: [x1, y1, x2, y2]格式的边界框坐标
空间描述: 自然语言位置描述（如"位于中心-中心区域"）
区域覆盖: 病变区域相对于图像大小的统计
定位信息: 身体部位位置
人口统计: 患者年龄/性别信息

技术规格

任务类别: 图像分类、图像分割
语言: 英语
标签: ISIC、HAM10000、皮肤病学、医学、皮肤疾病、边界框、空间标注
规模: 1K-10K样本
许可证: CC协议

数据集扩展内容

病变定位的边界框坐标
空间描述信息
区域覆盖统计
掩码可用性标志

使用方式

python from datasets import load_dataset

dataset = load_dataset("abaryan/ham10000_bbox") train_data = dataset["train"]

访问图像和标注

sample = train_data[0] image = sample["image"] bbox = sample["bbox"] description = sample["spatial_description"]

引用说明

基于原始HAM10000数据集，通过空间标注增强用于视觉语言模型训练。

搜集汇总

数据集介绍

构建方式

在皮肤镜图像分析领域，HAM10000_bbox数据集基于原始HAM10000皮肤病变图像集进行了深度扩展。研究团队通过专业医学标注流程，对每张皮肤镜图像中的病变区域进行了精确边界框标注，并记录了病变在图像中的空间位置关系。标注过程结合了皮肤病学专家的临床判断，确保边界框坐标与自然语言空间描述的一致性，同时计算了病变区域相对于整张图像的面积覆盖率，为视觉定位任务提供了多模态注释信息。

使用方法

研究人员可通过HuggingFace数据集库直接加载该数据集，使用标准接口获取训练集与验证集。典型应用流程包括读取高分辨率皮肤镜图像，提取对应的边界框坐标进行目标检测模型训练，或结合空间描述文本开展视觉语言理解实验。数据集支持端到端的多任务学习，既可用于病变区域的自动定位，也能服务于医学图像报告生成等跨模态研究场景。

背景与挑战

背景概述

皮肤镜影像分析作为计算机辅助诊断的重要分支，HAM10000_bbox数据集由国际皮肤影像合作组织于2018年主导构建，旨在解决皮肤病变自动定位与分类的跨模态学习问题。该数据集在原HAM10000基础上扩展了空间标注体系，包含10,015张专业标注的皮肤镜图像，涵盖7种常见皮肤病变类型，为医学影像分析领域提供了首个同时包含视觉边界框与自然语言空间描述的多模态基准。

当前挑战

该数据集核心挑战在于解决皮肤病变的精确空间定位与视觉-语言关联建模，需克服病变形态多样性、边界模糊性以及解剖位置差异性等医学影像特有难题。构建过程中面临标注一致性维护的挑战，需要皮肤病学专家与计算机视觉专家协同完成边界框标注与空间描述的对齐工作，同时确保医学术语的准确性与标注标准的统一性。多中心采集设备差异导致的图像分辨率不一致问题亦增加了数据预处理复杂度。

常用场景

经典使用场景

在皮肤镜图像分析领域，HAM10000_bbox数据集为研究者提供了精确的病变定位信息。该数据集通过边界框坐标和空间描述文本，支持计算机视觉模型同时学习视觉特征与空间语义关系，成为训练皮肤病诊断模型的重要基准。其经典应用场景包括皮肤病变的自动检测与分类，模型通过结合图像视觉信息与空间位置标注，能够更准确地识别黑色素瘤等恶性皮肤病变。

解决学术问题

该数据集有效解决了医学影像分析中病变定位与描述生成的联合学习问题。通过提供精确的空间标注和自然语言描述，它支持研究者开发能够理解病变空间分布的视觉-语言模型，推动了皮肤病诊断自动化研究的发展。其标注体系为多模态医学影像分析建立了新的标准，显著提升了模型在病变检测和描述生成任务上的性能。

实际应用

在临床实践中，该数据集支撑的模型可辅助 dermatologist 进行皮肤病变筛查。通过自动生成病变位置报告和初步诊断建议，这些系统能够提高诊断效率，特别是在医疗资源匮乏地区发挥重要作用。实际部署中，此类技术已逐步应用于远程皮肤病诊断平台，为患者提供及时的初步筛查服务。

数据集最近研究