five

VD-Ref

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/VD-Ref
下载链接
链接失效反馈
官方服务:
资源简介:
常规短语接地旨在将给定标题中提到的名词短语定位到其相应的图像区域,最近取得了巨大的成功。显然,唯一的名词短语基础不足以理解跨模式的视觉语言。在这里,我们还考虑代词来扩展任务。首先,我们构建一个短语数据集,该短语的基础包括名词短语和代词到图像区域。基于数据集,我们使用该行的最新文学模型来测试短语接地的性能。然后,我们使用核心参考信息来增强基线接地模型,这可能会帮助我们完成任务,并使用图卷积网络对核心参考结构进行建模。有趣的是,在我们的数据集上进行的实验表明,代词比名词短语更容易接地,其中可能的原因可能是这些代词的歧义要少得多。此外,我们具有核心参考信息的最终模型可以显著提高接地性能
提供机构:
OpenDataLab
创建时间:
2022-11-18
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作