five

NLVR2

收藏
arXiv2019-07-21 更新2024-06-21 收录
下载链接:
http://lil.nlp.cornell.edu/nlvr/
下载链接
链接失效反馈
官方服务:
资源简介:
NLVR2是一个用于研究自然语言和图像联合推理的数据集,特别关注语义多样性、组合性和视觉推理挑战。该数据集包含107,292个英文句子与网络照片配对,任务是确定自然语言标题是否与一对照片相符。数据集通过使用视觉丰富的图像集和比较与对比任务来诱导语言多样性。定性分析表明,数据需要组合性联合推理,包括数量、比较和关系。评估使用最先进的视觉推理方法显示,数据提出了强大的挑战。

NLVR2 is a dataset designed for investigating joint reasoning over natural language and images, with a particular focus on semantic diversity, compositionality and visual reasoning challenges. It comprises 107,292 English sentences paired with pairs of web photographs, and the core task is to determine whether a natural language caption matches the corresponding pair of photographs. The dataset induces linguistic diversity by leveraging visually rich image sets and comparative as well as contrastive tasks. Qualitative analysis reveals that the data demands compositional joint reasoning, including quantity, comparative and relational reasoning. Evaluations using state-of-the-art visual reasoning methods demonstrate that this dataset poses substantial challenges.
提供机构:
康奈尔大学计算机科学系和纽约康奈尔理工学院
创建时间:
2018-11-02
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作