VD-Ref
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/VD-Ref
下载链接
链接失效反馈官方服务:
资源简介:
常规短语接地旨在将给定标题中提到的名词短语定位到其相应的图像区域,最近取得了巨大的成功。显然,唯一的名词短语基础不足以理解跨模式的视觉语言。在这里,我们还考虑代词来扩展任务。首先,我们构建一个短语数据集,该短语的基础包括名词短语和代词到图像区域。基于数据集,我们使用该行的最新文学模型来测试短语接地的性能。然后,我们使用核心参考信息来增强基线接地模型,这可能会帮助我们完成任务,并使用图卷积网络对核心参考结构进行建模。有趣的是,在我们的数据集上进行的实验表明,代词比名词短语更容易接地,其中可能的原因可能是这些代词的歧义要少得多。此外,我们具有核心参考信息的最终模型可以显著提高接地性能
提供机构:
OpenDataLab
创建时间:
2022-11-18
搜集汇总
数据集介绍

背景与挑战
背景概述
VD-Ref是一个扩展了常规短语接地任务的数据集,不仅涵盖名词短语,还包含代词,旨在促进跨模态视觉语言理解。该数据集用于测试并增强基线模型,实验表明代词接地比名词短语更容易,且通过整合共指信息和图卷积网络可显著提升接地性能。
以上内容由遇见数据集搜集并总结生成



