CA-sup

Name: CA-sup
Creator: 四川大学
Published: 2023-08-15 13:04:26
License: 暂无描述

arXiv2023-08-15 更新2024-06-21 收录

下载链接：

https://github.com/JianghaiSCU/RealSH

下载链接

链接失效反馈

官方服务：

资源简介：

本研究提出了一种名为CA-sup的数据集，由四川大学和Megvii Technology联合创建。该数据集包含80万对图像，用于监督式单应性学习。数据集通过迭代框架生成，结合了内容一致性模块和质量评估模块，确保数据质量。该数据集旨在解决传统监督学习方法中训练数据不足的问题，通过提供高质量的训练样本，提升单应性估计网络的性能，使其更好地适应真实世界场景。

提供机构：

四川大学

创建时间：

2023-07-28

搜集汇总

数据集介绍

构建方式

CA-sup数据集依托于一个迭代式深度框架构建，其核心在于将数据生成与网络训练相互促进。首先，给定无标签的真实世界图像对，利用预估计的主平面掩膜和单应性矩阵，并结合随机采样的真实单应性作为标签，生成一幅新目标图像。该过程通过融合源图像的主平面区域与目标图像的非主平面区域，确保生成图像对同时满足标签准则和真实运动准则。随后，引入内容一致性模块消除伪影，并通过质量评估模块筛选高质量样本，用于训练单应性估计网络。经多轮迭代，数据集质量与网络性能同步提升，最终形成包含80万对训练样本的CA-sup数据集。

使用方法

CA-sup数据集专为监督式单应性估计任务设计。使用时，可直接将图像对及其对应的真实单应性标签输入任意监督式网络，如DHN、LocalTrans或IHN，以4个角点偏移向量作为训练目标。该数据集与现有框架高度兼容，无需修改网络结构即可替代传统合成数据集，提升模型在真实场景中的泛化能力。此外，研究者可基于CA-sup数据集进行微调或迭代训练，利用其提供的80万对高质量样本，使网络在CA-unsup和GHOF等基准测试中达到最优性能，平均点匹配误差低至0.34。

背景与挑战

背景概述

单应性估计作为计算机视觉领域的基石性任务，广泛应用于高动态范围成像、图像拼接与视频稳像等场景。传统方法依赖特征提取与匹配，在纹理匮乏或动态前景等复杂场景中易失效。随着深度学习的发展，基于学习的方法通过无关键点估计策略展现出更强鲁棒性，然而监督方法长期受限于缺乏高质量标注数据的困境，其合成训练集往往仅满足标签一致性而忽略真实场景中的视差与运动，导致泛化能力受限。为突破这一瓶颈，四川大学与旷视科技等机构的研究人员于2023年提出CA-sup数据集，通过迭代式框架从无标注真实图像对中生成同时满足标签与真实感准则的训练样本，推动监督单应性学习迈向新高度。

当前挑战

CA-sup数据集所面临的挑战主要体现于两大层面。其一，在领域问题层面，监督单应性估计长期受制于合成数据与真实场景间的域差异，现有数据集如MS-COCO仅通过单图像扭曲生成配对，缺乏动态物体与场景视差，导致模型在低纹理、弱光照及大前景等复杂场景中性能骤降。其二，在构建过程中，如何从无标注的真实图像对中提取可靠的 dominant 平面掩膜与单应性矩阵以生成高质量训练样本成为核心难题，早期迭代中合成图像常存在伪影与边界不连续，需引入内容一致性模块与质量评估模块进行筛选与优化，同时迭代框架的计算开销与收敛上限亦构成工程挑战。

常用场景

经典使用场景

CA-sup数据集专为监督式单应性估计任务而设计，其核心应用场景在于为深度学习模型提供兼具真实感与标注精度的训练样本。在计算机视觉领域中，单应性估计广泛服务于图像拼接、视频稳像及高动态范围成像等任务，而传统监督方法受限于合成数据缺乏真实场景中的视差与动态物体运动。CA-sup通过迭代框架从未标注的真实图像对中生成训练数据，使得图像对的主平面可由真实单应性矩阵精确对齐，同时保留非主平面区域的实际运动，从而弥合了合成数据与真实世界之间的鸿沟，为监督学习提供了高质量、高泛化能力的训练基础。

解决学术问题

该数据集解决了监督式单应性估计中长期存在的训练数据匮乏与泛化能力不足的学术难题。传统监督方法依赖从单张图像经人工单应性变换合成的数据，这类数据虽满足标注准则，却缺乏真实场景中的动态物体与景深视差，导致模型在现实环境中性能骤降。CA-sup通过生成同时满足标注准则与真实感准则的图像对，使监督模型能够学习到真实运动表征，在低纹理、低光照、大前景等挑战性场景中显著提升估计精度。其迭代优化策略更实现了数据集质量与网络性能的协同提升，为监督式方法在复杂真实场景中的落地提供了关键支撑。

实际应用

在实际应用中，CA-sup数据集可赋能多种依赖精确图像对齐的视觉系统。例如，在智能驾驶领域，车辆行驶过程中连续帧间的单应性估计可用于实时环境感知与路径规划；在移动摄影中，高质量的图像拼接与视频稳像功能需依赖鲁棒的单应性估计以消除抖动与视差伪影；在安防监控场景下，多视角图像融合与全景生成同样受益于精确的单应性矩阵。CA-sup所生成的真实感训练数据能够使监督模型在低光照、雨雪、雾霾等恶劣条件下仍保持稳健性能，从而推动相关技术从实验室走向实际部署。

数据集最近研究