BoKelvin/SLAKE

Hugging Face2024-02-28 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/BoKelvin/SLAKE

下载链接

链接失效反馈

资源简介：

--- license: cc-by-4.0 task_categories: - visual-question-answering language: - en - zh tags: - medical --- # Dataset Info: SLAKE: A Semantically-Labeled Knowledge-Enhanced Dataset for Medical Visual Question Answering [ISBI 2021 oral] Project Page: [click](https://www.med-vqa.com/slake/) Corresponding Authors: [Bo Liu](boliu.kelvin@gmail.com), Xiao-Ming Wu Any questions, please contact us. Thank you! ## Modification: In the Huggingface Repo, we have changed the name of ___validate.json___ to ___validation.json___ to better display in the Dataset Card.

SLAKE is a semantically-labeled knowledge-enhanced dataset for medical visual question answering, supporting both English and Chinese. It aims to improve the performance of visual question answering systems in the medical field by providing rich semantic labels and knowledge-enhanced information. The dataset was presented as an oral report at ISBI 2021 and has undergone filename standardization modifications in the Huggingface repository.

提供机构：

BoKelvin

原始信息汇总

数据集信息

数据集名称

SLAKE: A Semantically-Labeled Knowledge-Enhanced Dataset for Medical Visual Question Answering

发布会议

ISBI 2021 oral

任务类别

visual-question-answering

语言

英语 (en)
中文 (zh)

许可证

cc-by-4.0

修改说明

在Huggingface Repo中，将文件名validate.json更改为validation.json，以便在Dataset Card中更好地显示。

AI搜集汇总

数据集介绍

构建方式

在医学视觉问答领域，BoKelvin/SLAKE数据集的构建采用了语义标注与知识增强的策略。该数据集通过集成医学图像与相应的语义信息，构建了一个包含细粒度标注的问答对集合，旨在提升模型在理解医学图像并进行精准问答的能力。

特点

SLAKE数据集的特点在于其深度整合了医学领域的知识库，使得数据集中的每一个问答对都具备了丰富的语义信息。此外，该数据集支持中英双语，提供了视觉问答任务所需的多维度信息，有利于模型的跨语言学习和应用。

使用方法

使用SLAKE数据集时，用户可以依据数据集提供的语义标签和知识增强信息，进行视觉问答模型的训练和评估。数据集中的___validation.json___文件用于模型的验证，用户可以通过Huggingface提供的平台方便地加载和利用这些数据进行相关研究。

背景与挑战

背景概述

在医学视觉问题解答领域，数据集的构建一直是研究的热点与难点。SLAKE数据集，由Bo Liu与Xiao-Ming Wu等研究人员于2021年推出，旨在为医学视觉问题解答提供语义标注与知识增强的数据集。该数据集结合了医学领域的专业知识和计算机视觉技术，通过提供具有挑战性的视觉问题及其答案，对促进医学图像分析、自然语言处理等领域的发展具有重要意义。

当前挑战

SLAKE数据集面临的挑战主要在于两个方面：一是医学视觉问题解答本身具有高度的专业性和复杂性，如何确保数据集在涵盖广泛医学知识的同时，保持问题的准确性和合理性；二是构建过程中，如何实现知识增强，即在数据集中融入丰富的医学知识，提升数据集的实用性和研究价值。此外，数据集的构建还需克服标注一致性、数据隐私保护等实际问题。

常用场景

经典使用场景

在医学视觉问题回答的领域中，SLAKE数据集以其丰富的语义标签和知识增强特性，成为研究者的首选。该数据集通过结合图像和文本信息，为构建医学视觉问答系统提供了坚实的基础，使得研究者能够训练模型准确理解医学图像内容并回答相关问题。

衍生相关工作

基于SLAKE数据集，研究者们开展了一系列相关工作，如开发更为高效的医学视觉问答模型、构建集成知识库的问答系统等。这些工作进一步扩展了SLAKE数据集的应用范围，推动了医学人工智能领域的发展。

数据集最近研究