Radiology Objects in COntext (ROCO)

github2024-05-18 更新2024-05-31 收录

下载链接：

https://github.com/razorx89/roco-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

ROCO数据集是一个大规模的医学和多模态成像数据集，包含从PubMed Central Open Access FTP镜像自动检测的非复合图像。每张图像都附有下载链接和标题，以及从图像标题中提取的关键词、相应的UMLS语义类型和UMLS概念唯一标识符。该数据集可用于构建图像标题生成模型、图像分类和标记的分类模型或基于内容的图像检索系统。

The ROCO dataset is a large-scale medical and multimodal imaging dataset, comprising non-compound images automatically detected from the PubMed Central Open Access FTP mirror. Each image is accompanied by a download link and a title, along with keywords extracted from the image title, corresponding UMLS semantic types, and UMLS concept unique identifiers. This dataset can be utilized to construct image caption generation models, classification and tagging models for image classification, or content-based image retrieval systems.

创建时间：

2018-09-03

原始信息汇总

数据集概述

名称: Radiology Objects in COntext (ROCO)

类型: 大型医学和多模态影像数据集

来源: 来自PubMed Central Open Access FTP镜像的出版物图像

内容:

图像下载链接及其标题
图像标题中提取的关键词
对应的UMLS Semantic Types (SemTypes) 和 UMLS Concept Unique Identifiers (CUIs)

用途:

构建图像标题生成模型
图像分类和标记的分类模型
基于内容的图像检索系统

相关活动: 用作ImageCLEF 2019中概念检测任务的开发数据

引用:

引用文献: "Radiology Objects in COntext (ROCO): A Multimodal Image Dataset"
作者: O. Pelka, S. Koitka, J. Rückert, F. Nensa, C.M. Friedrich
发表于: MICCAI Workshop on Large-scale Annotation of Biomedical Data and Expert Label Synthesis (LABELS) 2018
DOI: 10.1007/978-3-030-01364-6_20

搜集汇总

数据集介绍

构建方式

Radiology Objects in COntext (ROCO)数据集的构建基于PubMed Central Open Access FTP镜像中的出版物，通过自动检测非复合图像，筛选出放射学和非放射学图像。每张图像均附有下载链接及其描述性标题。此外，数据集还提供了从图像标题中提取的关键词，以及相应的UMLS语义类型（SemTypes）和UMLS概念唯一标识符（CUIs）。这种多模态数据的整合，为构建图像描述生成模型、图像分类和标记模型以及基于内容的图像检索系统提供了丰富的资源。

特点

ROCO数据集的显著特点在于其多模态性质，不仅包含医学图像，还结合了详细的文本描述和语义信息。这种多模态数据的结合，使得该数据集在医学图像分析领域具有广泛的应用潜力。此外，数据集的规模和多样性，使其成为开发和验证各种机器学习模型的理想选择，特别是在图像描述生成、分类和检索等任务中。

使用方法

使用ROCO数据集时，用户可以通过克隆GitHub仓库并运行提供的Python脚本（如fetch.py）来下载图像。为了优化下载过程，用户可以根据网络条件调整并行下载的进程数。对于Windows用户，确保安装了wget工具，并将其路径添加到系统环境变量中，或通过WSL安装Ubuntu。数据集适用于构建图像描述生成模型、图像分类和标记模型，以及基于内容的图像检索系统，为医学图像分析提供了强大的支持。

背景与挑战

背景概述

Radiology Objects in COntext (ROCO)数据集是由O. Pelka, S. Koitka, J. Rückert, F. Nensa, C.M. Friedrich等研究人员在2018年创建的，该数据集旨在为医学影像领域提供一个大规模的多模态图像资源。ROCO数据集的核心研究问题是如何有效地整合医学影像与其对应的文本描述，以支持图像标注、分类和基于内容的图像检索等任务。该数据集的构建基于PubMed Central开放存取FTP镜像中的出版物，通过自动检测非复合图像并分类为放射学或非放射学图像。ROCO数据集的推出，极大地推动了医学影像分析领域的发展，特别是在图像与文本多模态数据处理方面，为后续研究提供了丰富的资源和基准。

当前挑战

ROCO数据集在构建过程中面临的主要挑战包括：首先，从海量的医学文献中自动筛选和分类相关图像，确保数据的准确性和代表性；其次，提取和关联图像的文本描述，包括关键词、UMLS语义类型和概念唯一标识符，这一过程需要高度的自动化和精确性。此外，数据集的下载和处理过程中，用户可能遇到网络连接问题或下载错误，需要通过调整下载进程数或安装特定软件来解决。在应用层面，ROCO数据集面临的挑战是如何有效地利用这些多模态数据来训练和评估生成模型、分类模型和基于内容的图像检索系统，确保这些模型在实际医学应用中的准确性和可靠性。

常用场景

经典使用场景

在医学影像分析领域，Radiology Objects in COntext (ROCO) 数据集以其多模态特性成为构建生成模型和分类模型的理想选择。该数据集不仅包含丰富的医学影像，还附带详细的图像描述、关键词以及UMLS语义类型和概念唯一标识符。这些信息使得ROCO数据集在图像标注、分类和基于内容的图像检索系统中具有广泛应用。

衍生相关工作

ROCO数据集的发布催生了多项相关研究工作，特别是在医学影像分析和自然语言处理交叉领域。例如，基于ROCO数据集的研究已应用于图像标注模型的改进，以及多模态数据融合技术的探索。此外，该数据集还激发了在ImageCLEF 2019等国际竞赛中的创新应用，推动了医学影像分析技术的进步。

数据集最近研究