ExposureEngine Dataset
收藏arXiv2025-10-06 更新2025-10-08 收录
下载链接:
https://huggingface.co/datasets/SimulaMet-HOST/ExposureEngine
下载链接
链接失效反馈官方服务:
资源简介:
ExposureEngine数据集由Oslo Metropolitan University和SimulaMet共同创建,用于体育转播中的定向徽标检测和赞助商可见性分析。该数据集包含从2024年瑞典精英足球联赛中选取的1103帧视频,这些视频涵盖了670个独特的赞助商徽标,并使用定向边界框(OBB)进行了标注。数据集的大小、数据量和Tokens数未在论文中明确提及,但数据来源为2024年瑞典男子精英足球联赛的季节性专业足球精彩剪辑。数据集创建过程包括从视频中选取代表性帧、使用OBB进行徽标标注以及将数据集分为训练集、验证集和测试集。该数据集旨在解决传统方法在动态相机角度和透视畸变下徽标检测不准确的问题,并为赞助商可见性分析提供准确的数据支持。
The ExposureEngine Dataset was co-developed by Oslo Metropolitan University and SimulaMet for oriented logo detection and sponsor visibility analysis in sports broadcasting. It comprises 1103 video frames selected from the 2024 Swedish Elite Football League, covering 670 unique sponsor logos annotated with oriented bounding boxes (OBBs). The dataset size, total data volume and token count are not explicitly specified in the accompanying paper, while its source is the seasonal professional football highlight clips from the 2024 Swedish Men's Elite Football League. The dataset creation workflow includes selecting representative frames from videos, annotating logos with OBBs, and splitting the dataset into training, validation and test subsets. This dataset aims to address the inaccurate logo detection issue of traditional methods under dynamic camera angles and perspective distortions, and provide accurate data support for sponsor visibility analysis.
提供机构:
Oslo Metropolitan University, Norway
创建时间:
2025-10-06
原始信息汇总
ExposureEngine 数据集概述
基本信息
- 许可证: MIT
- 任务类别: 目标检测
- 语言: 英语
- 标签: 定向标志检测、定向目标检测、赞助商可见性、标志、检测
- 数据集名称: ExposureEngine
核心特性
- 提供专业足球转播中赞助商标志的高质量定向边界框多边形标注
- 支持旋转感知检测,捕捉旋转、倾斜和透视效果
- 适用于赞助商可见性测量、标志跟踪和旋转感知检测
数据集构成
- 数据源: 来自2024年瑞典精英足球联赛的97个广播精彩片段
- 帧数: 1,103个精选帧(以1 FPS采样)
- 标注: 670个独特赞助商标志,包含OBB多边形坐标(YOLO格式)
- 覆盖范围: 32场比赛 · 16支球队 · 多样事件:进球、射门、黄牌、越位、换人
- 数据划分: 训练/验证/测试 = 80/10/10
应用场景
- 体育赞助分析和报告
- 基于YOLO的OBB训练和基准测试
- 广播中品牌可见性测量
- 社交媒体和OTT平台的内容适配
快速开始
python from datasets import load_dataset
dataset = load_dataset("SimulaMet-HOST/ExposureEngine") print(dataset)
引用
如需使用本数据集,请引用: ExposureEngine: Oriented Logo Detection and Sponsor Visibility Analytics in Sports Broadcasts.
联系方式
- 邮箱: mehdi@forzasys.com
搜集汇总
数据集介绍

构建方式
在体育广播赞助分析领域,传统水平边界框方法难以准确捕捉旋转或倾斜的商标,导致曝光度量失真。ExposureEngine数据集基于2024年瑞典顶级足球联赛的97个专业比赛片段构建,通过每秒1帧的采样策略获取原始帧,并经过去重筛选与人工审核,最终形成1,103帧高质量图像。每帧均采用定向边界框进行精细标注,覆盖670个独特商标类别,标注过程通过Label Studio工具动态扩展图形变体类别,并转换为YOLO OBB格式,划分为80-10-10的训练、验证与测试集,为旋转感知检测提供几何精确的基础。
特点
该数据集显著特点在于其定向边界框标注体系,能够紧密贴合商标的实际几何形状,有效避免背景像素的误包含,从而提升空间测量的准确性。数据源自真实足球广播环境,涵盖多样化的体育场、球队与摄像机条件,包括运动模糊、遮挡及透视变形等挑战性场景。商标类别呈现长尾分布,既有出现超过500次的高频赞助商,也有仅出现一次的稀有商标,反映了实际广播曝光的不均衡性。作为首个公开的足球广播OBB商标数据集,它支持检测基准测试与可见性分析,为领域研究提供了关键资源。
使用方法
数据集适用于训练与评估旋转感知的商标检测模型,如YOLOv11等架构,通过定向边界框回归实现商标的精确定位。用户可加载图像与对应的OBB标签文件,利用训练好的模型进行帧级商标检测,并输出多边形坐标与类别信息。检测结果可直接集成到分析流水线中,计算曝光时长、屏幕覆盖率等指标,或通过语言驱动代理层进行自然语言查询与报告生成。数据集的标准化格式确保与主流深度学习框架兼容,支持从模型开发到部署的全流程应用。
背景与挑战
背景概述
在体育营销领域,赞助商可见性量化是评估投资回报的核心任务,传统依赖人工标注的方法存在主观性强、效率低下的局限。2025年,由挪威SimulaMet与奥斯陆大都会大学联合发布的ExposureEngine数据集,聚焦于足球转播中旋转logo的定向检测问题。该数据集基于2024年瑞典顶级联赛的1103帧图像,标注了670类赞助商logo的定向边界框,旨在通过几何精确的检测模型解决动态镜头角度导致的标识形变问题,为体育媒体分析提供了首个公开的旋转标注基准。
当前挑战
该数据集致力于攻克体育转播中旋转logo检测的几何对齐难题,传统水平边界框因忽略视角形变会导致曝光度量失真。构建过程中面临多重挑战:数据采集需平衡镜头视角多样性与标识长尾分布,标注过程需处理标识旋转、遮挡及尺度变化;模型训练需通过Varifocal Loss缓解类别不平衡,并优化旋转IoU损失以实现跨场景泛化。此外,从检测结果到价值评估的转化还需结合事件上下文与多平台分发特性,构建完整的分析链条。
常用场景
经典使用场景
在体育营销分析领域,ExposureEngine数据集主要应用于赞助商标识的旋转感知检测任务。该数据集通过定向边界框标注方式,精准捕捉足球转播视频中因摄像机角度变化产生的倾斜、扭曲商标标识,为计算机视觉模型提供几何精确的训练样本。其典型应用场景包括实时监测品牌标识在比赛画面中的出现频率、持续时间和空间分布,为赞助商价值评估建立数据基础。
解决学术问题
该数据集有效解决了传统水平边界框在旋转物体检测中的几何失准问题。通过引入定向边界框标注体系,显著提升了标识检测的几何精度,克服了因透视变形导致的背景像素误包含现象。在学术层面,该工作推进了旋转物体检测在体育视频分析领域的应用边界,为长尾分布下的细粒度标识识别提供了新的基准范式,促进了计算机视觉与体育营销的跨学科融合。
衍生相关工作
该数据集催生了多项创新性研究工作,包括基于Varifocal Loss的长尾分布优化算法、结合事件元数据的赞助价值加权模型,以及面向垂直视频格式的感兴趣区域分析框架。在技术演进路径上,衍生出将定向检测与多智能体系统结合的全栈解决方案,为后续研究提供了可扩展的基准平台和标准化评估体系。
以上内容由遇见数据集搜集并总结生成



