SoccerHigh

Name: SoccerHigh
Creator: Universitat Pompeu Fabra 巴塞罗那，西班牙
Published: 2025-09-01 20:49:51
License: 暂无描述

arXiv2025-09-01 更新2025-11-24 收录

下载链接：

https://github.com/IPCV/SoccerHigh/tree/main/dataset

下载链接

链接失效反馈

官方服务：

资源简介：

SoccerHigh 是一个专门为自动足球视频摘要任务创建的数据集。该数据集包括来自西班牙、法国和意大利联赛的237场比赛的剪辑边界，使用来自 SoccerNet 数据集的广播镜头。这个数据集旨在作为足球视频摘要任务的基准，包含了与完整比赛视频对齐的摘要视频。此外，还提出了一个针对此任务设计的基线模型，该模型在测试集上达到了0.3956的F1分数。为了更客观地评估生成的内容，还提出了一种新的度量标准，该标准受目标摘要长度的限制。数据集和代码可在 arXiv 上找到。

SoccerHigh is a dataset specifically created for the automatic soccer video summarization task. This dataset includes clip boundaries of 237 matches from the Spanish, French, and Italian football leagues, using broadcast shots from the SoccerNet dataset. This dataset is designed as a benchmark for the soccer video summarization task, containing summarization videos aligned with full match videos. Additionally, a baseline model tailored for this task was proposed, which achieved an F1 score of 0.3956 on the test set. To evaluate the generated content more objectively, a new evaluation metric constrained by the target summary length was also put forward. The dataset and code are available on arXiv.

提供机构：

Universitat Pompeu Fabra 巴塞罗那，西班牙

创建时间：

2025-09-01

搜集汇总

数据集介绍

构建方式

在体育视频分析领域，SoccerHigh数据集通过半自动化流程构建，整合了来自SoccerNet的237场完整比赛广播视频与官方制作的精华片段。该流程首先采用基于k近邻算法的镜头边界检测技术对精华视频进行初始分割，随后利用DINOv2等视觉骨干网络提取帧级特征，通过滑动窗口计算特征距离实现精华镜头与广播视频段的精准对齐，最终辅以人工校验确保时序对应关系的准确性。

特点

该数据集涵盖西班牙、法国和意大利三大欧洲足球联赛的赛事内容，呈现了多样化的编辑风格与摘要时长分布。其特色在于同时包含比赛实况镜头与主观视角内容（如观众反应、教练特写），且约16%的摘要时长用于非比赛阶段片段，充分体现了体育视频摘要的叙事复杂性。通过标准化训练集、验证集和测试集划分，为模型泛化能力评估提供了结构化基准。

使用方法

研究者在模型开发过程中可基于完整比赛视频输入，采用分块处理策略提取时空特征。通过Transformer架构建模长程依赖关系，结合分类与回归双分支头预测关键镜头及其边界偏移。评估阶段引入基于真实摘要时长的约束性指标，通过非极大值抑制筛选高置信度片段，确保生成摘要与人工编辑逻辑的一致性。

背景与挑战

背景概述

SoccerHigh数据集由庞培法布拉大学Artur Díaz-Juan等研究人员于2025年构建，旨在解决体育视频自动摘要领域缺乏标准化基准的难题。该数据集基于SoccerNet公开赛事视频，整合了西班牙、法国和意大利三大联赛共237场完整比赛与官方精彩集锦的精准对齐，首次实现了足球视频摘要任务的系统化数据支持。其核心研究聚焦于通过半自动标注流程建立比赛视频与摘要片段间的时序映射，为多媒体内容分析领域提供了关键基础设施，显著推动了体育视频智能处理技术的发展。

当前挑战

足球视频摘要面临领域问题与构建过程双重挑战：在任务层面需应对长视频冗余度高、即时回放干扰及编辑风格多样性等难题，传统方法难以平衡客观事件与主观叙事需求；构建过程中，标注工作需克服广播视频与摘要片段间的视角差异，如回放镜头角度变化、观众反应片段缺失等问题。尽管采用DINOv2特征提取与kNN分割策略优化对齐精度，但跨联赛编辑规范差异仍对模型泛化能力构成持续考验。

常用场景

经典使用场景

在体育视频分析领域，SoccerHigh数据集为足球视频自动摘要任务提供了标准化评估基准。该数据集通过将完整比赛录像与专业制作的精彩集锦进行帧级对齐，支持模型从长达90分钟的原始视频中精准识别关键片段，如进球瞬间、球员特写和观众反应等具有叙事价值的镜头。其涵盖西甲、意甲和法甲三大联赛的237场比赛，充分体现了不同编辑风格对摘要内容的影响，为研究多模态时序理解提供了真实场景。

实际应用

在体育传媒产业中，该数据集支撑的自动摘要技术可大幅提升内容制作效率。媒体机构能够基于模型生成的候选片段快速合成赛事集锦，满足社交媒体平台对即时短视频内容的需求。同时，该技术还可应用于个人化摘要生成，根据观众偏好定制包含特定球队或球员的精彩瞬间，为体育数据服务商提供智能内容生产解决方案。

衍生相关工作

该数据集的发布推动了足球视频理解领域的系列创新。基于其构建的基线模型首次将VideoMAEv2等视频Transformer架构引入摘要任务，启发了多模态特征融合的新方向。后续研究在此基础上扩展了社交媒体导向的摘要生成框架，结合SoccerNet的动作识别数据，形成了从事件检测到叙事构建的完整技术链条，为体育视频分析社区提供了可复现的研究基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集