ActivityNet-FOIL

Name: ActivityNet-FOIL
Creator: OpenDataLab
Published: 2026-05-17 09:30:41
License: 暂无描述

OpenDataLab2026-05-17 更新2024-05-09 收录

下载链接：

https://opendatalab.org.cn/OpenDataLab/ActivityNet-FOIL

下载链接

链接失效反馈

官方服务：

资源简介：

为了测试EMScore对识别包含不准确视觉概念的箔片标题的敏感性，我们遵循foil-COCO数据集来更改ActivityNet-Entities测试数据集，以构建ActivityNet-箔片数据集。在ActivityNet-实体中，每个视频都有两个相应的段落。我们使用两个段落中的一个来构建正确的箔对，并使用另一个作为基于参考的度量的参考。每个段落在不同的时间戳中有大约3个句子，每个句子中的视觉概念都基于注释边界框。通过用类似但错误的概念替换原始视觉概念来创建箔标题。我们的数据生成过程有三个主要步骤: 首先，我们收集所有视觉概念，并过滤掉低频概念。然后，我们将属于同一超级类别的单词配对在一起 (例如river-pool，shirt-shoe，catdog)。最后，我们获得了2,191个正确的箔对，其中每个视觉概念有大约13个箔对。其次，我们将原始正确字幕中的视觉概念替换为配对的箔候选，以构建候选箔字幕。每个正确的标题都有多个候选箔标题。第三，对于每个正确的标题，我们通过选择最低的困惑度候选来挖掘最困难的箔标题。最后，我们创建1900正确的箔片段落对，箔片段落中的至少一个标题包含箔片视觉概念。如图4所示，每个视频包含一个正确的箔段落对。我们计算每个指标的准确性，即为正确的候选段落相对于箔分配更高的分数。

提供机构：

OpenDataLab

创建时间：

2023-02-13

搜集汇总

数据集介绍

背景与挑战

背景概述

ActivityNet-FOIL是一个基于ActivityNet-Entities测试数据集构建的数据集，旨在评估EMScore对识别包含错误视觉概念的箔片标题的敏感性。通过替换原始视觉概念为类似但错误的候选词，生成了1900个正确-箔片段落对，每个视频包含一对，用于计算指标准确性。该数据集于2022年由多所中国高校和机构发布，相关资源可在GitHub和CVPR论文中获取。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集