five

VisDial (Visual Dialog)

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/VisDial
下载链接
链接失效反馈
官方服务:
资源简介:
Visual Dialog (VisDial) 数据集包含基于 MS COCO 数据集图像的人工注释问题。该数据集是通过配对 Amazon Mechanical Turk 上的两个主题来讨论图像而开发的。一个人被分配了“提问者”的工作,另一个人担任“回答者”。提问者只能看到图像的文本描述(即来自 MS COCO 数据集的图像标题),而原始图像对提问者仍然是隐藏的。他们的任务是询问关于这个隐藏图像的问题,以“更好地想象场景”。回答者看到图像、标题并回答提问者提出的问题。他们两人最多可以通过提问和回答问题来继续对话10轮。 VisDial v1.0 在 MS COCO(2017 训练集)上包含 123K 对话,用于训练拆分,2K 对话与验证图像用于验证拆分,以及 8K 对话在测试集上用于测试标准集。之前发布的 v0.5 和 v0.9 版本的 VisDial 数据集(对应于 MS COCO 的旧拆分)被认为已弃用。
提供机构:
OpenDataLab
创建时间:
2022-06-07
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作