HNC
收藏HNC 数据集概述
数据集名称
HNC
语言
英语
数据集大小
10M < n < 100M
数据集描述
HNC 是一个自动创建的数据集,包含用于图像文本匹配(ITM)训练的硬负样本描述,旨在实现视觉和语言(VL)领域中的细粒度跨模态理解。此外,还提供了一个手动创建的挑战性测试集,用于基准测试模型在具有不同层次组合复杂性的细粒度跨模态不匹配方面的性能。
数据集下载
可以从 DaRUS 下载自动生成的训练和验证集以及人工标注的测试集:下载链接
引用
bibtex @inproceedings{hnc, title = "{HNC}: Leveraging Hard Negative Captions towards Models with Fine-Grained Visual-Linguistic Comprehension Capabilities", author = {D{"o}nmez, Esra and Tilli, Pascal and Yang, Hsiu-Yu and Vu, Ngoc Thang and Silberer, Carina}, booktitle = "Proceedings of the 27th Conference on Computational Natural Language Learning (CoNLL)", year = "2023", address = "Singapore", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/2023.conll-1.24", doi = "10.18653/v1/2023.conll-1.24", pages = "364--388", }




