five

OmniMedVQA|医学图像分析数据集|视觉问答数据集

收藏
arXiv2024-04-21 更新2024-06-21 收录
医学图像分析
视觉问答
下载链接:
https://github.com/OpenGVLab/Multi-Modality-Arena
下载链接
链接失效反馈
资源简介:
OmniMedVQA是一个专为医学领域设计的大型全面评估基准,包含12种不同模态和超过20个独特的人体解剖区域。该数据集由上海人工智能实验室创建,旨在解决现有医学图像数据集的多样性和覆盖范围不足的问题。OmniMedVQA包含118,010张真实医疗场景中的图像,确保与医学领域的要求和评估大型视觉语言模型(LVLMs)的适用性相符。数据集的创建过程涉及收集多个医学分类数据集,并利用强大的上下文推理能力将这些数据转换为视觉问答(VQA)格式。OmniMedVQA的应用领域广泛,旨在全面评估LVLMs在医学挑战中的基本能力,推动医学领域LVLMs的发展和应用。
提供机构:
上海人工智能实验室
创建时间:
2024-02-14
AI搜集汇总
数据集介绍
main_image_url
构建方式
OmniMedVQA数据集的构建基于73个不同的医学数据集,涵盖12种不同的成像模态和超过20个解剖区域。所有图像均来源于真实的医疗场景,确保了数据集与医疗领域需求的紧密契合。构建过程中,首先收集了大量的医学分类数据集,然后利用GPT的强大上下文推理能力,将这些数据转换为视觉问答(VQA)格式。此外,为了增加数据集的多样性和评估能力,还通过ChatGPT-3.5 API对问题进行了重新表述,并生成了错误选项,从而构建了多选题问答对。
特点
OmniMedVQA数据集的主要特点包括:1)涵盖了12种不同的成像模态,如MRI、CT、X光等,确保了数据集的高度多样性;2)所有图像均来源于真实的医疗场景,与实际应用紧密相关;3)覆盖了超过20个不同的解剖区域,从大脑到四肢,为评估不同的大型视觉语言模型(LVLMs)提供了全面的基础;4)通过生成错误选项,将数据集转换为多选题问答对,便于评估模型的响应准确性。
使用方法
OmniMedVQA数据集可用于评估和训练大型视觉语言模型(LVLMs)在医疗领域的应用。使用者可以通过提供的图像和问答对进行模型的训练和验证,评估模型在不同成像模态和解剖区域上的表现。此外,数据集的多选题格式便于进行模型的准确性评估,通过计算问答得分和基于前缀的得分,可以全面评估模型的内在知识和避免幻觉生成的能力。
背景与挑战
背景概述
OmniMedVQA数据集由香港大学和上海人工智能实验室的研究团队于2024年推出,旨在评估大型视觉-语言模型(LVLMs)在医疗领域的潜力。该数据集整合了73个不同的医疗数据集,涵盖12种成像模态和超过20个解剖区域,确保了数据的真实性和多样性。OmniMedVQA的核心研究问题在于解决现有LVLMs在处理复杂医疗图像和多模态数据时的不足,特别是在视觉问答(VQA)任务中的表现。该数据集的推出对推动医疗领域的人工智能应用具有重要意义,为研究人员提供了一个全面的评估基准。
当前挑战
OmniMedVQA数据集面临的挑战主要体现在两个方面。首先,解决领域问题的挑战在于如何使LVLMs在医疗图像分类和问答任务中达到高准确性和鲁棒性,尤其是在处理多模态和多解剖区域的复杂数据时。其次,构建过程中的挑战包括数据集的多样性和真实性保证,以及如何有效地将大量医疗分类数据转换为VQA格式。此外,评估现有LVLMs在医疗专用模型和通用模型之间的性能差异,以及如何提升医疗专用模型的表现,也是该数据集需要解决的重要问题。
常用场景
经典使用场景
OmniMedVQA 数据集在医学领域的大规模视觉问答(VQA)任务中展现了其经典应用场景。该数据集通过整合来自 73 个不同医学数据集的图像,涵盖 12 种成像模态和 20 多个解剖区域,为评估大型视觉语言模型(LVLMs)在医学图像理解中的表现提供了全面的基准。其经典应用包括但不限于医学图像的自动诊断、疾病分类、解剖结构识别以及病理特征的定量分析,这些任务对于提升医疗诊断的准确性和效率具有重要意义。
解决学术问题
OmniMedVQA 数据集解决了医学领域中视觉语言模型评估的学术难题。传统医学 VQA 数据集的局限性在于数据量小、模态单一和解剖区域覆盖不全,这限制了模型在实际应用中的泛化能力和鲁棒性。OmniMedVQA 通过提供大规模、多模态和多解剖区域的图像数据,填补了这一空白,使得研究人员能够更全面地评估和改进视觉语言模型在医学图像理解中的性能,推动了该领域的技术进步。
衍生相关工作
OmniMedVQA 数据集的发布催生了一系列相关研究工作,推动了医学视觉语言模型的发展。例如,基于该数据集的研究论文探讨了如何优化模型以提高其在多模态医学图像上的表现,以及如何通过引入更多的医学知识来增强模型的诊断能力。此外,还有研究致力于开发新的评估指标和方法,以更准确地衡量模型在实际医学应用中的性能。这些工作不仅提升了模型的技术水平,也为未来的医学AI应用奠定了坚实的基础。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

WideIRSTD Dataset

WideIRSTD数据集包含七个公开数据集:SIRST-V2、IRSTD-1K、IRDST、NUDT-SIRST、NUDT-SIRST-Sea、NUDT-MIRSDT、Anti-UAV,以及由国防科技大学团队开发的数据集,包括模拟陆基和太空基数据,以及真实手动标注的太空基数据。数据集包含具有各种目标形状(如点目标、斑点目标、扩展目标)、波长(如近红外、短波红外和热红外)、图像分辨率(如256、512、1024、3200等)的图像,以及不同的成像系统(如陆基、空基和太空基成像系统)。

github 收录

Yahoo Finance

Dataset About finance related to stock market

kaggle 收录

UAV123

从低空无人机捕获的视频与流行的跟踪数据集 (如OTB50,OTB100,VOT2014,VOT2015,TC128和ALOV300) 中的视频本质上不同。因此,我们提出了一个新的数据集 (UAV123),其序列来自空中视点,其子集用于长期空中跟踪 (UAV20L)。我们新的UAV123数据集包含总共123个视频序列和超过110K帧,使其成为仅次于ALOV300的第二大对象跟踪数据集。所有序列都用直立的边界框完全注释。数据集可以很容易地与视觉跟踪器基准集成。它包括无人机数据集的所有边界框和属性注释。还请使用包含序列和跟踪器配置的修改后的文件 “configSeqs.m” 和 “configTrackers.m” 下载修改后的跟踪器基准。另外,请注意,文件 “perfPlot.m” 已根据本文中描述的属性进行了修改以进行评估。

OpenDataLab 收录

Solar Radiation Data

该数据集包含全球多个地点的太阳辐射数据,涵盖了不同时间段和气象条件下的辐射强度。数据包括直接辐射、散射辐射和总辐射等指标,适用于太阳能资源评估和气候研究。

www.nrel.gov 收录