Medical Images, Captions, and Textual References Dataset医学影像和标题的语篇照应数据集MedICaT
收藏阿里云天池2026-06-09 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/86602
下载链接
链接失效反馈官方服务:
资源简介:
MedICaT is a dataset of medical images, captions, subfigure-subcaption annotations, and inline textual references. Figures and captions are extracted from open access articles in PubMed Central and corresponding reference text is derived from S2ORC. 本数据集主要用于研究医学影像与标题、子图或子标题标注的内联语篇照应问题。图表和标题均由PubMed Central上开源文章摘取,对应的照应语篇则来自S2ORC。
MedICaT是一款涵盖医学图像、图注、子图-子图注标注以及内联文本照应的医学数据集。其图像与图注均提取自PubMed Central(PubMed中心)的开放获取文章,对应的参考文本源自S2ORC。本数据集主要用于探究医学图像与图注、子图或子图注标注之间的内联语篇照应关系。
提供机构:
阿里云天池
创建时间:
2020-12-21
搜集汇总
数据集介绍

背景与挑战
背景概述
MedICaT数据集是一个包含医学影像、标题、子图标注和内联语篇照应的专业数据集,主要用于研究医学影像与文本的关联性。数据集规模庞大,包含21.7万张影像和7507个子图标注,覆盖93%的医学影像类型,且74%的影像附带参考文本。
以上内容由遇见数据集搜集并总结生成



