FineCapEval
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/j-min/CLIP-Caption-Reward
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为FineCapEval,是一个用于评估字幕的全新数据集,其特点在于采用了细粒度的评估标准,包括整体、背景、物体和关系等四个方面。该数据集由1,000张图片组成,总共包含5,000个跨越这四个标准的注释。在构建此数据集时,研究人员收集了图片,并让人类标注员编写包含背景、物体、关系以及一个综合描述的详细字幕。规模上,数据集包含了1,000张图片和5,000个注释,其任务是进行图像字幕评估。
提供机构:
Research Paper Authors



