Cops-Ref
收藏arXiv2020-03-01 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2003.00403v1
下载链接
链接失效反馈官方服务:
资源简介:
Cops-Ref数据集由香港大学创建,专注于组合指称表达理解,旨在通过复杂的语言表达识别图像中的特定对象。该数据集包含148,712条表达式,基于真实世界图像,强调视觉真实性和语义丰富性。数据集的创建过程中,设计了六种逻辑形式,灵活结合丰富的视觉信息生成具有不同组合性的表达式。Cops-Ref的应用领域包括视觉问答和视觉对话,旨在解决模型在复杂视觉场景中理解和定位对象的问题。
提供机构:
香港大学
创建时间:
2020-03-01



