2023 Video Similarity Dataset

Name: 2023 Video Similarity Dataset
Creator: Meta AI
Published: 2023-06-16 04:34:43
License: 暂无描述

arXiv2023-06-16 更新2024-06-21 收录

下载链接：

https://github.com/facebookresearch/vsc2022

下载链接

链接失效反馈

官方服务：

资源简介：

2023视频相似性数据集是由Meta AI和Czech Technical University in Prague共同创建，专注于视频复制检测与定位问题。该数据集包含约40,000个视频，旨在通过模拟真实场景中的‘针在干草堆’设置，评估视频复制检测和定位的准确性。数据集通过多种视频编辑和转换技术生成，以确保数据的真实性和挑战性。应用领域包括内容审核、版权保护和媒体识别，旨在解决视频内容重复和误导性使用的问题。

The 2023 Video Similarity Dataset was jointly developed by Meta AI and the Czech Technical University in Prague, focusing on the task of video copy detection and localization. This dataset contains approximately 40,000 videos, aiming to evaluate the accuracy of video copy detection and localization by simulating the "needle in a haystack" setting in real-world scenarios. The dataset is generated using a variety of video editing and transformation techniques to ensure its authenticity and challenging nature. Its application areas include content moderation, copyright protection and media recognition, aiming to solve the problems of video content duplication and misleading usage.

提供机构：

Meta AI

创建时间：

2023-06-16

搜集汇总

数据集介绍

构建方式

2023 Video Similarity Dataset 旨在解决视频复制检测和定位问题，包括两个相关任务：确定查询视频是否与参考视频共享内容（“检测”）以及在视频中定位共享内容（“定位”）。该数据集通过从 YFCC100M 视频集中筛选具有创造共用许可的视频并去除自然发生的复制内容构建而成。为了保护隐私，数据集的视频被去除了音频轨道，并对可识别的人物进行了模糊处理。此外，数据集还包含了一系列人工标注的具有挑战性的负面样本。为了模拟现实世界的场景，数据集的视频被应用了多种变换，包括颜色修改、添加覆盖、堆叠视频、像素修改、空间更新和时序更新等。最终，数据集被划分为训练集、验证集和测试集，每个集合都包含未编辑的参考视频和一组查询视频，其中一些查询视频包含来自一个或多个参考视频的复制部分。

使用方法

2023 Video Similarity Dataset 可以用于视频复制检测和定位任务的评估。研究者可以使用数据集中的训练集和验证集来训练和评估他们的模型，并使用测试集来验证模型的泛化能力。数据集还提供了基线方法和评估代码，方便研究者进行实验。此外，数据集还包含了一个视频相似度挑战，旨在推动视频复制检测和定位领域的研究。

背景与挑战

背景概述

视频内容在网络上的传播日益广泛，这使得视频拷贝检测和定位成为一项重要的任务。该任务旨在识别查询视频是否与参考视频共享内容（检测），并进一步确定共享内容在视频中的时间范围（定位）。2023 Video Similarity Dataset 数据集旨在评估视频拷贝检测和定位方法，并模拟了现实世界中的“大海捞针”场景，其中大部分查询和参考视频都是“干扰项”，不包含拷贝内容。该数据集由 Meta AI、VRG、Czech Technical University in Prague 和 Centre for Research & Technology Hellas 的研究人员于 2023 年创建，旨在推动视频拷贝检测领域的研究，并为内容审核、版权保护、虚假信息识别等应用提供技术支持。

当前挑战

视频拷贝检测和定位面临着诸多挑战。首先，实际系统需要处理海量数据，这增加了误报的风险，并要求系统具有高精度。其次，视频可能经过各种转换，例如裁剪、添加滤镜、改变分辨率等，这使得拷贝检测变得更加困难。此外，拷贝片段可能只包含原始视频的一小部分，需要系统具有局部化拷贝片段的能力。最后，数据集构建过程中需要考虑隐私保护，例如去除音频轨道和模糊识别出的个人图像。

常用场景

经典使用场景

视频相似度检测在内容审核、版权保护和虚假信息识别等领域发挥着重要作用。该数据集可用于训练和评估视频复制检测和定位算法，帮助平台识别和删除侵权内容，保护原创者权益，并识别和过滤虚假信息。

解决学术问题

该数据集解决了视频复制检测和定位中存在的挑战，例如大规模数据集带来的高精度要求、视频内容的复杂性和多样性、以及用户对视频进行的各种编辑和转换。通过提供包含各种编辑和转换的视频数据，该数据集有助于研究人员开发更鲁棒的算法，并评估算法在不同场景下的性能。

实际应用

该数据集的实际应用场景包括：内容审核、版权保护、虚假信息识别、视频推荐和搜索结果去重等。例如，平台可以使用该数据集训练算法，自动识别和删除侵权视频，保护原创者权益；也可以使用该数据集训练算法，识别和过滤虚假信息，维护平台的健康生态。

数据集最近研究