CLEVR-Dialog
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/CLEVR-Dialog
下载链接
链接失效反馈官方服务:
资源简介:
CLEVR-Dialog 是一个大型诊断数据集,用于研究视觉对话中的多轮推理。具体来说,作者构建了一个对话语法,该语法基于来自 CLEVR 数据集的图像的场景图。这种组合产生了一个数据集,其中视觉对话的所有方面都被完全注释。 CLEVR-Dialog 总共包含 5 个 10 轮对话实例,用于大约 85k CLEVR 图像,总计 425 万对问答对。 CLEVR-Dialog 用于对标准视觉对话模型的性能进行基准测试;特别是关于视觉共指分辨率(作为共指距离的函数)。这是对视觉对话模型的第一次此类分析,如果没有这个数据集是不可能的。 CLEVR-Dialog 旨在帮助为视觉对话的未来模型的开发提供信息。
提供机构:
OpenDataLab
创建时间:
2022-08-19



