ActivityNet-FOIL
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/ActivityNet-FOIL
下载链接
链接失效反馈官方服务:
资源简介:
为了测试EMScore对识别包含不准确视觉概念的箔片标题的敏感性,我们遵循foil-COCO数据集来更改ActivityNet-Entities测试数据集,以构建ActivityNet-箔片数据集。在ActivityNet-实体中,每个视频都有两个相应的段落。我们使用两个段落中的一个来构建正确的箔对,并使用另一个作为基于参考的度量的参考。每个段落在不同的时间戳中有大约3个句子,每个句子中的视觉概念都基于注释边界框。通过用类似但错误的概念替换原始视觉概念来创建箔标题。我们的数据生成过程有三个主要步骤: 首先,我们收集所有视觉概念,并过滤掉低频概念。然后,我们将属于同一超级类别的单词配对在一起 (例如river-pool,shirt-shoe,catdog)。最后,我们获得了2,191个正确的箔对,其中每个视觉概念有大约13个箔对。其次,我们将原始正确字幕中的视觉概念替换为配对的箔候选,以构建候选箔字幕。每个正确的标题都有多个候选箔标题。第三,对于每个正确的标题,我们通过选择最低的困惑度候选来挖掘最困难的箔标题。最后,我们创建1900正确的箔片段落对,箔片段落中的至少一个标题包含箔片视觉概念。如图4所示,每个视频包含一个正确的箔段落对。我们计算每个指标的准确性,即为正确的候选段落相对于箔分配更高的分数。
提供机构:
OpenDataLab
创建时间:
2023-02-13
搜集汇总
数据集介绍

背景与挑战
背景概述
ActivityNet-FOIL是一个基于ActivityNet-Entities测试数据集构建的数据集,旨在评估EMScore对识别包含错误视觉概念的箔片标题的敏感性。通过替换原始视觉概念为类似但错误的候选词,生成了1900个正确-箔片段落对,每个视频包含一对,用于计算指标准确性。该数据集于2022年由多所中国高校和机构发布,相关资源可在GitHub和CVPR论文中获取。
以上内容由遇见数据集搜集并总结生成



