five

VRD (Visual Relationship Detection dataset)

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/VRD
下载链接
链接失效反馈
官方服务:
资源简介:
一个包含 5000 张图像和 3799.3 万个关系的数据集。该数据集包含 100 个对象类别和 70 个将这些对象连接在一起的谓词类别。视觉关系捕捉图像中对象对之间的各种交互(例如“骑自行车的人”和“推自行车的人”)。因此,可能的关系集非常大,很难为所有可能的关系获得足够的训练样本。由于这个限制,以前关于视觉关系检测的工作集中在预测少数关系上。尽管大多数关系并不频繁,但它们的对象(例如“man”和“bicycle”)和谓词(例如“riding”和“push”)独立出现的频率更高。我们提出了一个模型,该模型使用这种洞察力单独训练对象和谓词的视觉模型,然后将它们组合在一起以预测每个图像的多个关系。我们通过利用语义词嵌入中的语言先验来微调预测关系的可能性,从而改进先前的工作。我们的模型可以扩展以从几个示例中预测数千种类型的关系。此外,我们将预测关系中的对象定位为图像中的边界框。我们进一步证明了理解关系可以改进基于内容的图像检索。
提供机构:
OpenDataLab
创建时间:
2022-04-29
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作