photonmz/roco-instruct-65k
收藏数据集卡片 "roco-instruct-65k"
数据集描述
数据集概述
"roco-instruct-65k" 数据集源自 Radiology Objects in COntext (ROCO) 数据集,这是一个大规模的医学和多模态成像集合。图像来自 PubMed Central Open Access FTP 镜像上可用的出版物。该数据集经过重新格式化,用于 LLaVA 模型 在 BabyDoctor 项目 中,专注于放射图像的深度分析和诊断。它包括标题、关键词、UMLS 语义类型(SemTypes)和 UMLS 概念唯一标识符(CUIs),并支持图像标题生成模型、图像分类模型和基于内容的图像检索系统的创建。主要使用英语,涵盖医学成像领域,特别是放射学。
支持的任务和排行榜
image-classification:该数据集可用于训练图像分类模型,涉及将图像分类为放射学或非放射学。该任务的成功通常通过高准确性来衡量,有一个活跃的排行榜可以在 ImageCLEFmed Caption 2019 和 CrowdAI 找到。
语言
数据集完全由英语的医学文本组成。
数据集结构
数据实例
数据集以对话格式结构化,其中人类提供图像并给出分析指令,模型以诊断响应。数据集中的典型实例如下:
json { conversations: [ { "from": "human", "value": "The following image is a radiology scan. Deeply analyze and diagnose this image. <image>" }, { "from": "gpt", "value": "Computed tomography scan in axial view showing obliteration of the left maxillary sinus" } ], image: "ROCO_00002.jpg", id: "00002" }
数据字段
conversations:包含人类和模型之间关于图像的交互的列表。image:包含图像文件名称的字符串。id:表示交互唯一标识符的字符串。
数据分割
数据集分为训练、验证和测试集。具体分割大小如下:
| train | validation | test | |
|---|---|---|---|
| 数据实例 | 65000 | 8200 | 8200 |
数据集创建
策划理由
"roco-instruct-65k" 数据集的创建旨在促进能够对放射图像进行深度分析和诊断的 AI 模型的发展,这是自动化医学成像解释的关键步骤。
引用信息
@photomz 将此数据集上传到 HuggingFace。使用此数据集时,请引用原始的 ROCO 论文。
O. Pelka, S. Koitka, J. Rückert, F. Nensa, C.M. Friedrich, "Radiology Objects in COntext (ROCO): A Multimodal Image Dataset". MICCAI Workshop on Large-scale Annotation of Biomedical Data and Expert Label Synthesis (LABELS) 2018, September 16, 2018, Granada, Spain. Lecture Notes on Computer Science (LNCS), vol. 11043, pp. 180-189, Springer Cham, 2018. doi: 10.1007/978-3-030-01364-6_20




