ALOS数据集
收藏arXiv2019-04-16 更新2024-06-21 收录
下载链接:
https://www.adaptcentre.ie/case-studies/ai-based-advert-creation-system-fornext-generation-publicity
下载链接
链接失效反馈官方服务:
资源简介:
ALOS数据集是由ADAPT中心数字内容技术创建的,专注于户外场景中的广告定位。该数据集包含8065张来自Mapillary平台的街景风格图像,每张图像都附有高质量的手动标注,用于广告牌位置的精确标注。数据集的创建过程涉及与Mapillary合作,筛选出包含广告牌的图像,并进行手动标注。ALOS数据集主要应用于广告和市场营销领域,特别是产品植入和嵌入式营销,旨在通过机器学习技术提高广告定位的准确性。
The ALOS Dataset was developed by the Digital Content Technology team at the ADAPT Centre, focusing on advertising localization in outdoor scenes. It comprises 8065 street-view style images sourced from the Mapillary platform, with each image paired with high-quality manual annotations for precise labeling of billboard locations. The dataset construction process involved collaboration with Mapillary to filter out images containing billboards and carry out manual annotation work. Primarily applied in the advertising and marketing domains, especially product placement and embedded marketing, the ALOS Dataset aims to enhance the accuracy of advertising localization via machine learning techniques.
提供机构:
ADAPT中心数字内容技术
创建时间:
2019-04-16
搜集汇总
数据集介绍

构建方式
在户外场景广告牌检测领域,ALOS数据集的构建体现了严谨的工程化流程。其核心图像源来自众包地理标记平台Mapillary,该平台提供了大量街景风格的仪表盘摄像头图像。研究者首先利用平台内置的广告牌检测过滤器进行初步筛选,但鉴于平台对“广告牌”的定义较为宽泛,包含了非目标标识物,因此进行了严格的人工二次标注。标注过程要求精确定位广告牌的四角顶点,并遵循一系列质量控制标准:图像需具备良好对比度与可读文本,分辨率不低于800×600像素;广告牌形状限定为四边形凸多边形,透视畸变角度需控制在15度以内;同时,遮挡面积不得超过广告牌区域的10%,且广告牌不得占据图像绝大部分画面。通过这套多阶段筛选与标注体系,最终构建了适用于广告定位任务的高质量图像语料库。
使用方法
ALOS数据集主要服务于计算机视觉领域的语义分割任务,特别是户外广告牌的像素级定位。使用者可将其划分为训练集、验证集与测试集,用于训练和评估深度学习模型。论文中已基于该数据集对全卷积网络(FCN)、金字塔场景解析网络(PSPNet)以及U-Net等经典分割架构进行了基准测试,为后续研究提供了性能参照。在实际应用中,研究者可利用数据集提供的高质量像素级标注真值,以监督学习方式训练定制化的广告检测模型。训练时需注意输入图像的尺寸调整与数据增强策略,以适配不同网络架构。评估阶段则可采用像素精度、平均精度、平均交并比及频率加权交并比等标准分割指标,量化模型在复杂户外场景下的广告定位精度与泛化能力。
背景与挑战
背景概述
在数字媒体与计算机视觉领域,户外广告的精准定位技术对于嵌入式营销与产品植入具有关键意义。ALOS数据集由ADAPT SFI研究中心与华为爱尔兰研究中心的研究团队于2019年联合创建,旨在解决户外场景中广告牌自动定位的核心研究问题。该数据集依托Mapillary众包平台的地理标记图像,构建了首个大规模、高质量标注的广告牌图像库,涵盖了不同尺寸、遮挡状态及数量的广告牌实例,为深度学习模型在语义分割任务中的训练与评估提供了重要基础。其发布显著推动了广告检测算法的研究进展,并为营销行业的智能化应用提供了数据支撑。
当前挑战
ALOS数据集致力于解决户外场景中广告牌的语义分割与定位问题,其核心挑战在于广告牌形态的多样性、复杂背景干扰以及部分遮挡情况下的精准识别。在构建过程中,研究团队面临数据筛选与标注的严峻考验:首先,Mapillary平台提供的图像包含大量非广告牌标识,需通过人工标注确保广告牌四角坐标的精确性;其次,数据集中广告牌的尺寸比例、透视变形与遮挡程度需满足严格标准,如透视角度限制在15度以内、遮挡不超过10%,这增加了数据清洗与质量控制难度。此外,数据分布的多样性,如单图像中广告牌数量最多达18个,也对模型的鲁棒性提出了更高要求。
常用场景
经典使用场景
在计算机视觉领域,广告牌检测与定位是嵌入式营销技术的关键环节。ALOS数据集作为首个大规模户外场景广告牌标注数据集,其经典使用场景集中于为深度学习模型提供训练与评估基准。研究者利用该数据集训练语义分割网络,如全卷积网络(FCN)、金字塔场景解析网络(PSPNet)和U-Net,以精确识别图像中广告牌的位置与轮廓。这些模型通过学习数据集中高质量的人工标注边界框,能够实现像素级的广告牌区域分割,为自动化广告植入系统奠定基础。
解决学术问题
ALOS数据集有效解决了户外场景中广告牌检测缺乏标准化基准的学术难题。在计算机视觉研究中,大规模标注数据的缺失限制了广告定位算法的发展。该数据集通过提供涵盖不同尺寸、遮挡状态和视角变化的广告牌图像,并附带精确的四角标注,使得研究者能够系统评估模型在复杂真实环境下的性能。它促进了语义分割、实例分割等方向的方法创新,尤其为轻量级网络在特定目标检测任务上的优化提供了实证依据,推动了广告定位技术从理论探索向实用化迈进。
实际应用
在实际应用层面,ALOS数据集直接服务于下一代智能化广告投放系统。市场营销与广告代理机构可利用基于该数据集训练的模型,在视频后期制作中自动定位原有广告牌位置,实现新广告内容的无缝替换。这种技术显著提升了产品植入的效率与精准度,使动态广告植入能够适应不同地区、不同场景的户外视频素材。此外,该数据集也可用于增强现实(AR)广告、户外媒体监测等衍生应用,为数字广告产业的自动化与个性化发展提供技术支持。
数据集最近研究
最新研究方向
在计算机视觉与数字营销交叉领域,ALOS数据集作为首个大规模户外广告牌定位数据集,正推动着嵌入式广告技术的革新。当前研究聚焦于利用深度学习模型实现广告牌的精准语义分割,以支持自动化产品植入。前沿探索涉及轻量化网络架构的优化,旨在提升模型在复杂户外场景中的鲁棒性与实时性。该数据集亦关联增强现实广告、智能城市视觉感知等热点,为广告动态替换与场景理解提供了关键数据基础,具有显著的产业应用价值。
相关研究论文
- 1The ALOS Dataset for Advert Localization in Outdoor ScenesADAPT中心数字内容技术 · 2019年
以上内容由遇见数据集搜集并总结生成



