MEDICAT

Name: MEDICAT
Creator: 艾伦人工智能研究所
Published: 2020-10-13 03:56:08
License: 暂无描述

arXiv2020-10-13 更新2024-06-21 收录

下载链接：

https://github.com/allenai/medicat

下载链接

链接失效反馈

官方服务：

资源简介：

MEDICAT是由艾伦人工智能研究所创建的一个包含217,060张医学图像的数据集，来源于131,410篇开放获取的生物医学论文。该数据集不仅包括图像，还包含图像的标题、内联引用以及手动标注的子图像和子标题，其中75%的图像为复合图像。MEDICAT的创建旨在解决医学图像检索和图像与文本对齐的挑战，特别关注子图像与子标题的匹配问题。数据集的应用领域包括医学图像分析和学术搜索引擎的图像检索功能，旨在提高医学图像与文本关系的理解和应用。

MEDICAT is a dataset developed by the Allen Institute for Artificial Intelligence, which contains 217,060 medical images sourced from 131,410 open-access biomedical papers. Beyond the raw images, the dataset also provides image captions, inline citations, as well as manually annotated sub-images and sub-captions, with 75% of the images being composite images. MEDICAT was created to address the challenges of medical image retrieval and image-text alignment, with a particular focus on the matching task between sub-images and their corresponding sub-captions. Its application areas include medical image analysis and image retrieval functions for academic search engines, aiming to improve the understanding and practical application of the relationships between medical images and text.

提供机构：

艾伦人工智能研究所

创建时间：

2020-10-13

搜集汇总

数据集介绍

构建方式

MEDICAT数据集的构建基于从PubMed Central中提取的开放获取生物医学论文，涵盖了217,000张图像和131,000篇论文。数据集包括图像的标题、内联引用（覆盖74%的图像），以及手动注释的子图像和子标题。通过匹配提取的图像与S2ORC语料库中的相应图像，进一步提取内联引用，确保数据集的丰富性和多样性。此外，通过应用图像分类器（如ResNet-101）对图像进行过滤，确保数据集中的图像主要为医学图像，从而提高了数据集的专业性和准确性。

使用方法

MEDICAT数据集适用于多种医学图像分析任务，包括但不限于子图像与子标题的对齐、图像与文本的匹配以及医学图像的自动分析。研究者可以利用数据集中的图像、标题和内联引用来训练和验证模型，以提高其在医学文献理解中的应用能力。数据集的开源性质也使得研究者能够自由访问和使用这些资源，推动医学图像分析领域的发展。

背景与挑战

背景概述

MEDICAT数据集由Allen Institute for AI、University of Washington等机构的研究人员于近期创建，专注于医学图像与文本关系的理解。该数据集包含217,000张从131,000篇开放获取的生物医学论文中提取的图像，涵盖了图像标题、内联引用以及手动注释的子图像和子标题。MEDICAT的创建旨在解决科学文献中图像检索和图像与文本对齐的挑战，特别是在医学领域，图像与文本的关联对于图像检索和医学图像分析系统的开发至关重要。该数据集的引入不仅丰富了现有的医学图像数据资源，还为研究图像与文本在科学文献中的复杂关系提供了新的视角。

当前挑战

MEDICAT数据集面临的挑战主要集中在子图像与子标题的对齐任务上。由于科学文献中的复合图像（约占75%）包含多个子图像，且这些子图像的引用方式多样，如通过空间位置或成对描述，因此准确对齐子图像与子标题变得极为复杂。此外，数据集构建过程中遇到的挑战还包括从大量开放获取的论文中提取和匹配图像与文本，以及确保手动注释的准确性和一致性。这些挑战不仅影响了数据集的质量，也对后续的图像与文本匹配任务提出了高要求。

常用场景

经典使用场景

MEDICAT数据集的经典使用场景在于其能够支持医学图像与文本之间复杂关系的理解与分析。具体而言，该数据集通过提供医学图像、图像标题、子图像及其对应的子标题，以及内联引用，使得研究者能够深入探讨医学文献中图像与文本的关联性。例如，研究者可以利用MEDICAT进行子图像与子标题的对齐任务，从而提升图像检索的精确度，特别是在处理复合图像时，这一任务显得尤为重要。

解决学术问题

MEDICAT数据集解决了医学文献中图像与文本对齐的学术难题。传统方法主要关注图像内容的分类，而忽视了图像与文本之间的复杂关系。MEDICAT通过提供详细的子图像和子标题对齐信息，填补了这一研究空白，使得研究者能够更精确地理解医学图像在文献中的作用。此外，该数据集还通过内联引用提供了额外的上下文信息，这对于训练医学图像分析系统具有重要意义。

实际应用

在实际应用中，MEDICAT数据集可用于开发和优化医学图像检索系统。例如，当医生或研究人员需要通过文本查询快速找到相关的医学图像时，MEDICAT提供的图像与文本对齐信息可以显著提高检索的准确性和效率。此外，该数据集还可用于训练自动化的医学图像分析工具，通过结合图像和文本信息，提升诊断和研究的可靠性。

数据集最近研究