vi-dermatology-VQA-dataset
收藏Hugging Face2026-04-20 更新2026-04-21 收录
下载链接:
https://huggingface.co/datasets/AnhHao0107/vi-dermatology-VQA-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个越南语的医学视觉问答(VQA)数据集,专注于图像-文本到文本的转换任务。数据集规模小于1,000个样本,包含从ham10000、dermnet和SIIM-ISIC(来自Kaggle)等来源收集的医学图像数据。问答对是使用'gemma-4-31b-it'和'gemma-4-26b-a4b-it'模型生成的,因此用户在使用前需要仔细核查其准确性。数据集适用于医学领域的视觉问答研究,但由于内容涉及专业医学信息,不适合所有受众。
创建时间:
2026-04-17
原始信息汇总
数据集概述
基本描述
- 数据集名称: vi-dermatology-VQA-dataset
- 主要用途: 视觉问答(Visual Question Answering)与图像文本到文本(Image-Text-to-Text)任务。
- 领域: 医学(皮肤科)。
- 语言: 越南语(vi)。
- 数据规模: 小于1K样本(n<1K)。
- 许可协议: Apache 2.0。
- 内容警告: 包含不适合所有受众的内容(not-for-all-audiences)。
数据来源与构建
- 源数据集: 数据来源于Kaggle平台的ham10000、dermnet和SIIM-ISIC数据集。
- 问答对生成: 使用"gemma-4-31b-it"和"gemma-4-26b-a4b-it"模型生成问答对。
- 重要说明: 所有问答对均由人工智能生成,使用前需仔细核查。
数据集结构
- 具体的数据字段、划分标准及数据点间关系等信息暂未提供(More Information Needed)。
使用说明
- 直接用途: 暂未明确说明(More Information Needed)。
- 超范围用途: 暂未明确说明(More Information Needed)。
注意事项与限制
- 主要风险: 问答内容为AI生成,可能存在偏差或不准确。
- 使用建议: 用户应了解该数据集存在的风险、偏差和局限性。
其他信息
- 策划方: 信息缺失(More Information Needed)。
- 资助方: 信息缺失(More Information Needed)。
- 共享方: 信息缺失(More Information Needed)。
- 数据集仓库: 信息缺失(More Information Needed)。
- 相关论文: 信息缺失(More Information Needed)。
- 演示: 信息缺失(More Information Needed)。
- 数据收集与处理细节: 信息缺失(More Information Needed)。
- 源数据生产者: 信息缺失(More Information Needed)。
- 标注信息: 信息缺失(More Information Needed)。
- 个人与敏感信息: 信息缺失(More Information Needed)。
- 引用格式: 信息缺失(More Information Needed)。
- 术语表: 信息缺失(More Information Needed)。
- 数据集卡片作者与联系方式: 信息缺失(More Information Needed)。
搜集汇总
数据集介绍

构建方式
在皮肤病理学视觉问答领域,vi-dermatology-VQA-dataset的构建体现了数据合成的前沿方法。该数据集整合了HAM10000、DermNet和SIIM-ISIC等公开医学图像资源,作为视觉基础。问答对的生成则依托Gemma-4-31B-IT和Gemma-4-26B-A4B-IT等先进语言模型,通过自动化流程产生与图像相关的医学问答文本。这种构建方式巧妙地将权威医学图像库与大规模语言模型的生成能力相结合,为越南语皮肤科视觉问答研究提供了结构化的多模态数据基础。
特点
该数据集的核心特点在于其专注于越南语皮肤病理学的视觉问答任务,填补了该语言在专业医学视觉理解领域的空白。数据规模虽不足千例,但内容高度专业化,涵盖多种皮肤疾病的图像与对应问答。值得注意的是,所有问答对均由人工智能模型生成,这既体现了高效的数据生产能力,也提示使用者需谨慎验证内容的医学准确性。数据集的标签明确标注其医疗属性和受众限制,确保了在专业场景下的合规使用。
使用方法
该数据集主要适用于训练和评估越南语医疗视觉问答模型,为研究人员提供了测试跨模态理解能力的基准。在使用过程中,建议将图像与对应的问答对作为输入输出对,用于微调多模态模型或进行零样本评估。鉴于问答内容为AI生成,使用者需结合医学专业知识对答案进行双重校验,避免直接应用于临床决策。数据集的小规模特性使其更适合作为补充数据或特定任务的验证集,在模型开发中发挥探索性作用。
背景与挑战
背景概述
在医学人工智能领域,皮肤科视觉问答任务旨在通过结合医学图像与自然语言问题,辅助临床诊断与医学教育。vi-dermatology-VQA-dataset作为专注于越南语的皮肤科视觉问答数据集,其构建依托于HAM10000、DermNet及SIIM-ISIC等公开皮肤影像资源,并利用Gemma系列大语言模型生成问答对。尽管具体创建时间、研究人员及机构信息尚不明确,该数据集的核心研究问题聚焦于提升非英语医学视觉语言模型的跨模态理解能力,为资源有限语言的医疗AI应用提供关键数据支持,有望推动区域性医疗智能化进程。
当前挑战
该数据集面临的挑战主要体现在领域问题与构建过程两方面。在领域问题上,皮肤科视觉问答需克服医学图像细微病变特征识别与复杂临床语境理解的难题,同时要求模型具备高精度医学知识推理能力,以应对诊断中的多样性与不确定性。构建过程中,依赖AI生成问答对可能引入语义偏差或事实错误,需严格验证数据质量;此外,整合多源异构皮肤影像数据时,需处理数据标准化、隐私保护及跨语言适配等挑战,确保数据集的可靠性与实用性。
常用场景
经典使用场景
在皮肤病学领域,视觉问答任务对于辅助诊断具有关键意义。vi-dermatology-VQA-dataset作为越南语皮肤病视觉问答数据集,其经典使用场景在于训练和评估多模态医学人工智能模型,特别是针对皮肤病变图像的自动化问答系统。该数据集通过结合图像与文本问题,使模型能够学习从视觉特征中提取医学相关信息,并生成准确的越南语回答,从而模拟临床医生在诊断过程中的推理与交互。
实际应用
在实际应用中,vi-dermatology-VQA-dataset可用于开发智能皮肤病诊断辅助系统,特别是在越南语医疗环境中。这类系统能够帮助基层医疗工作者或患者初步评估皮肤病变,通过上传图像并提问获取即时分析,缓解专业 dermatologist 资源不足的压力。此外,它还可集成到医学教育平台,用于培训医学生识别皮肤病特征,提升诊断技能与临床决策效率。
衍生相关工作
基于该数据集,相关经典工作主要集中在多模态医学AI模型的优化与评估。例如,研究人员可能开发适配越南语的视觉-语言预训练模型,如改进的ViLT或BLIP架构,以提升皮肤病问答的准确性。同时,该数据集也催生了针对医学VQA的对抗性测试、偏差分析以及跨语言迁移学习的研究,进一步推动了皮肤病学领域人工智能技术的稳健性与公平性发展。
以上内容由遇见数据集搜集并总结生成



