SCICAP
收藏魔搭社区2025-11-18 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/SCICAP
下载链接
链接失效反馈官方服务:
资源简介:
displayName: SCICAP
license:
- CC BY-NC-SA 4.0
mediaTypes:
- Text
paperUrl: https://arxiv.org/pdf/2110.11624v2.pdf
publishDate: "2021"
publishUrl: https://github.com/tingyaohsu/SciCap
publisher:
- Pennsylvania State University
tags:
- Patterning
taskTypes:
- Image Captioning
---
# 数据集介绍
## 简介
SciCap一种基于计算机科学arXiv论文的大型图形字幕数据集,2010年发表,2020年。SCICAP包含超过416k个图形,这些图形集中在从290,000多篇论文中提取的一个显性图形类型-图形图。
## 引文
```
@article{hsu2021scicap,
title={Scicap: Generating captions for scientific figures},
author={Hsu, Ting-Yao and Giles, C Lee and Huang, Ting-Hao'Kenneth'},
journal={arXiv preprint arXiv:2110.11624},
year={2021}
}
```
## Download dataset
:modelscope-code[]{type="git"}
displayName: SCICAP
license:
- CC BY-NC-SA 4.0
mediaTypes:
- 文本
paperUrl: https://arxiv.org/pdf/2110.11624v2.pdf
publishDate: "2021"
publishUrl: https://github.com/tingyaohsu/SciCap
publisher:
- 宾夕法尼亚州立大学(Pennsylvania State University)
tags:
- 模式建模(Patterning)
taskTypes:
- 图像字幕(Image Captioning)
---
# 数据集介绍
## 简介
SciCap是一款基于计算机科学领域arXiv论文的大型科学图形字幕数据集,相关工作始于2010年,最终于2020年完成。SCICAP共收录超过41.6万个图形,所有图形均从29万余篇学术论文中提取,且均属于一类主流图形类型——图形图(graph diagram)。
## 引文
@article{hsu2021scicap,
title={Scicap:科学图形的字幕生成},
author={Hsu, Ting-Yao and Giles, C Lee and Huang, Ting-Hao'Kenneth'},
journal={arXiv预印本 arXiv:2110.11624},
year={2021}
}
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-14



