danielfdias98/derm-reasoning-full-reasoning
收藏Hugging Face2026-04-28 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/danielfdias98/derm-reasoning-full-reasoning
下载链接
链接失效反馈官方服务:
资源简介:
这是一个名为皮肤病学推理数据集—完整推理的数据集,是danielfdias98/derm-reasoning的一个独立变体,可直接用于训练而无需选择配置。每条数据包含结构化的临床推理链(诊断、观察、形态、颜色、纹理、边界、位置、大小和推理)。数据集包含25,637条训练数据和2,849条验证数据,适用于非商业研究用途,许可证为CC-BY-NC-SA 4.0。数据集的任务类别包括图像文本到文本和视觉问答,标签涵盖医学、皮肤病学、视觉语言等领域。
language: [英语]
license: CC-BY-NC-SA-4.0
task_categories: [图像-文本转文本、视觉问答(Visual Question Answering,VQA)]
size_categories: [10千<样本数量<100K]
tags: [医疗、皮肤病学(Dermatology)、视觉语言(Vision-Language)、视觉语言模型(Vision-Language Model,VLM)微调、公平性]
pretty_name: 皮肤病推理数据集——完整推理版本
# 皮肤病推理数据集——完整推理版本
本数据集是[danielfdias98/derm-reasoning](https://huggingface.co/datasets/danielfdias98/derm-reasoning)的**完整推理**消融变体,现已作为独立仓库重新发布,可直接接入训练管线而无需额外选择配置文件。
每一条数据的助手回复均包含:**结构化思维链(Chain-of-Thought)临床推理内容(诊断结果+观察项+形态特征+颜色属性+纹理特征+边界特征+发病部位+皮损大小+推理过程)**。
## 快速加载
python
from datasets import load_dataset
ds = load_dataset("danielfdias98/derm-reasoning-full-reasoning")
print(ds) # 数据集字典 {训练集: 25637, 验证集: 2849}
## 姊妹仓库
其互补消融变体仓库为[danielfdias98/derm-reasoning-label-only](https://huggingface.co/datasets/danielfdias98/derm-reasoning-label-only)。二者采用完全相同的训练/验证划分比例(95:5,随机种子=42)与图像集,仅助手回复的内容密度存在差异。
## 图像来源
整合后的上游仓库包含完整的单来源署名表格与图像再分发划分规则(含可公开再分发图像集与完整私有图像集)。如需标准自述文件、引用信息及`download_images.py`脚本,请访问[danielfdias98/derm-reasoning](https://huggingface.co/datasets/danielfdias98/derm-reasoning)。
## 许可证
CC-BY-NC-SA 4.0(与源数据集SkinCAP中最严格的许可条款保持一致)。仅允许非商业性研究使用。
## 引用
bibtex
@misc{dias2026derm-reasoning,
author = {Ferreira Dias, Daniel},
title = {Dermatology Reasoning Dataset: Structured chain-of-thought annotations across five public sources},
year = {2026},
howpublished = {url{https://huggingface.co/datasets/danielfdias98/derm-reasoning}},
}
提供机构:
danielfdias98



