CAMotion

Name: CAMotion
Creator: 中山大学·网络空间安全学院; 南洋理工大学·计算与数据科学学院; 北京邮电大学·计算机学院（国家示范性软件学院）
Published: 2026-04-09 22:23:46
License: 暂无描述

arXiv2026-04-09 更新2026-04-11 收录

下载链接：

https://www.camotion.focuslab.net.cn

下载链接

链接失效反馈

官方服务：

资源简介：

CAMotion是由中山大学等机构联合构建的大规模视频伪装目标检测基准数据集，涵盖151种生物物种的474段野外环境视频。该数据集包含149,319帧图像（其中30,028帧具有精细像素级标注），通过生物学分类体系构建12大类50子类的多层次标注体系，提供掩膜和边界框双重标注。数据采集经过互联网视频筛选、多轮人工校验等严格流程，特别标注了边缘模糊、遮挡等八大挑战属性。该数据集旨在解决现有视频伪装检测数据规模小、物种单一的问题，为深度学习模型在复杂动态环境中的鲁棒性评估提供重要基准。

CAMotion is a large-scale video camouflaged object detection benchmark dataset jointly constructed by Sun Yat-sen University and other institutions. It includes 474 wild-environment videos covering 151 biological species. This dataset contains 149,319 image frames, among which 30,028 frames have fine pixel-level annotations. A multi-level annotation system with 12 major categories and 50 sub-categories is built based on the biological classification taxonomy, providing dual annotations of masks and bounding boxes. The data collection follows strict procedures including internet video screening and multiple rounds of manual verification, and eight challenge attributes such as edge blur and occlusion are specifically annotated. This dataset aims to address the issues of small scale and single-species distribution in existing video camouflaged object detection datasets, and serves as an important benchmark for evaluating the robustness of deep learning models in complex dynamic environments.

提供机构：

中山大学·网络空间安全学院; 南洋理工大学·计算与数据科学学院; 北京邮电大学·计算机学院（国家示范性软件学院）

创建时间：

2026-04-09

原始信息汇总

CAMotion 数据集概述

数据集简介

CAMotion 是一个用于野外伪装运动目标检测的高质量基准数据集。该数据集旨在解决现有视频伪装目标检测数据集规模和多样性受限的问题，以满足数据驱动型深度学习算法的深度分析和广泛评估需求。数据集涵盖了广泛的物种，并包含多种具有挑战性属性的序列，如边缘不确定、遮挡、运动模糊和形状复杂性等。

关键统计信息

图像帧总数: 149,319 帧
标注帧数: 30,028 帧
涵盖物种数: 151 种
规模对比: 图像帧总数是 MoCA-Mask 数据集的 6.51 倍；标注帧数是其 6.40 倍；物种数是其 3.43 倍。

数据集特征与属性

数据集从多个角度提供了序列标注细节和统计分布，支持对伪装目标在不同挑战性场景下运动特性的深入分析。

标注属性

为便于深入分析各种挑战性场景下的伪装视频，每个伪装帧根据以下八个属性进行分类：

属性缩写	属性名称	描述
MO	多目标	图像包含至少两个目标。
BO	大目标	目标面积与图像面积之比 ≥ 0.15。
SO	小目标	目标面积与图像面积之比 ≤ 0.02。
UE	边缘不确定	目标周围的背景区域具有相似的颜色和纹理。
OC	遮挡	目标被部分遮挡。
SC	形状复杂	目标包含细长部分（例如动物足部）。
OV	出视野	目标部分离开相机视野。
MB	运动模糊	由于目标或相机的运动导致目标区域模糊。

数据内容与结构

数据示例

数据集包含多种物种的序列，例如：亚马逊叶鱼、蝙蝠鱼、猫、小丑鱼、普通章鱼、欧亚麻鸦、叶尾壁虎、叶海龙、嘲鸫、苔藓拟态竹节虫、兰花螳螂、椒花蛾、侏儒海马、雪豹、雪鸮、白鼬等。

数据结构

数据集按序列组织，分为训练集和测试集。每个序列文件夹内包含以下子文件夹：

Imgs: 存放原始图像（.jpg 格式）。
GT: 存放像素级真值标注（.png 格式）。
Edge: 存放边缘标注（.png 格式）。
BBox: 存放边界框标注（.txt 格式）。

评估基准

在 CAMotion 数据集上对 18 种 COD/VCOD 模型进行了综合实验评估。

评估指标: S 度量、加权 F 度量、平均 E 度量、MAE、平均 Dice 系数、平均 IoU。
主要发现: 尽管这些模型在现有 COD 数据集上表现良好，但在 CAMotion 基准上性能显著下降。如何跨视频帧准确识别伪装目标，同时减轻随时间推移的错误累积，仍然是一个关键挑战。

获取与使用

获取地址: Google Drive, Baidu Netdisk
使用限制: 仅可用于非商业研究目的。

引用格式

如果 CAMotion 对您的研究有帮助，请引用以下论文：

@article{yao2026camotion, title={C{AM}otion: A High-Quality Benchmark for Camouflaged Moving Object Detection in the Wild}, author={Siyuan Yao and Hao Sun and Ruiqi Yu and Xiwei Jiang and Wenqi Ren and Xiaochun Cao}, journal={arXiv preprint arXiv:2604.08287}, year={2026} }

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，视频伪装目标检测（VCOD）因数据规模与多样性不足而面临发展瓶颈。为突破这一限制，CAMotion数据集通过生物学启发的分层分类体系构建，首先依据关键词在互联网上检索并收集了超过4000个初始视频，经过质量评估与无关内容过滤，最终筛选出包含151个物种的474个高质量视频序列，总计约15万帧。为确保标注精度，研究团队采用多轮反馈流程，由五名标注员手动绘制像素级掩码，并经由专家审核与反复修订，最终对其中30,028帧提供了掩码与边界框标注，同时为每个序列标注了八种挑战属性，如不确定边缘、遮挡与运动模糊等，从而建立了规模与质量均显著超越现有基准的数据集。

特点

CAMotion数据集的核心特点体现在其大规模、高多样性与精细的属性标注上。该数据集包含约15万视频帧，规模达到现有最大VCOD数据集的六倍以上，并涵盖从哺乳动物、昆虫到鱼类等12个生物类别，进一步细分为50个子类与151个物种，确保了物种与场景的广泛多样性。此外，数据集为每个序列系统标注了八种挑战属性，包括不确定边缘、小目标、遮挡与形状复杂性等，这些属性分布与真实世界中伪装目标的隐蔽特性高度吻合。数据统计分析进一步显示，其中93.4%的目标呈现运动或形变，且局部颜色对比度普遍较低，凸显了其在动态复杂场景下检测的高难度与评估的全面性。

使用方法

CAMotion数据集为视频伪装目标检测算法的训练与评估提供了标准化基准。在模型训练中，研究者可利用其提供的359个训练序列（共23,253标注帧）进行端到端学习，或结合COD10K等图像数据集进行预训练以提升模型泛化能力。在评估阶段，115个测试序列（共6,775标注帧）可用于全面衡量模型在多种挑战属性下的性能，常用指标包括S-measure、加权F-measure与平均IoU等。该数据集支持跨数据集泛化分析、基于属性的性能剖析以及类别级别的深入评估，有助于揭示现有模型在时空一致性保持与伪装判别能力之间的权衡，从而推动更鲁棒、实用的VCOD算法发展。

背景与挑战

背景概述

在计算机视觉领域，伪装物体检测是一项极具挑战性的任务，其核心在于识别与背景高度相似、难以察觉的目标。随着深度学习技术的快速发展，视频伪装物体检测逐渐成为研究热点，旨在利用连续帧间的时序信息提升检测性能。然而，现有视频伪装物体检测数据集在规模和多样性方面存在显著局限，难以满足数据驱动型深度模型的训练需求。为突破这一瓶颈，中山大学、北京邮电大学及南洋理工大学的研究团队于2026年联合构建了CAMotion数据集。该数据集涵盖了野外环境中151个物种的474个视频序列，包含约15万帧图像，其中3万余帧提供了精细的像素级标注。CAMotion不仅规模远超现有同类数据集，还引入了基于生物学启发的层次化分类体系，并标注了八类挑战性属性，为深入分析伪装物体的运动特性提供了高质量基准，有力推动了视频伪装物体检测领域的研究进展。

当前挑战

CAMotion数据集旨在解决视频伪装物体检测这一核心领域问题，其面临的挑战主要体现在两个方面。首先，在任务层面，由于伪装物体与背景在颜色、纹理上高度相似，且视频中目标外观和背景会随时间动态变化，导致准确识别与分割极为困难。现有模型往往难以在伪装判别能力与跨帧时序一致性之间取得平衡，易出现错误累积或目标丢失。其次，在数据集构建过程中，挑战同样严峻。大规模视频数据的收集与筛选需确保物种和场景的多样性，而像素级标注工作则异常耗时费力，尤其对于边缘模糊、形状复杂或存在遮挡的小目标，需要多轮人工校验与反馈修正才能保证标注质量。此外，为视频序列定义并标注多种挑战属性（如运动模糊、出镜等）也增加了构建的复杂性。

常用场景

经典使用场景

在计算机视觉领域，伪装物体检测一直是一项极具挑战性的任务，尤其在动态视频序列中，物体与背景的高度相似性使得精准识别变得尤为困难。CAMotion数据集以其大规模、高质量的标注和丰富的物种多样性，为视频伪装物体检测研究提供了经典的评估基准。该数据集广泛应用于训练和测试深度学习模型，特别是在评估模型在复杂动态场景下的鲁棒性方面，研究者利用其包含的多种挑战属性，如不确定边缘、遮挡和运动模糊，来深入分析模型性能的边界与局限。

解决学术问题

CAMotion数据集的构建有效解决了视频伪装物体检测领域长期存在的若干学术问题。首先，它突破了以往数据集规模有限的瓶颈，为数据驱动型深度学习算法提供了充足的训练样本，从而促进了模型泛化能力的深入研究。其次，通过涵盖151个物种和12个生物类别，该数据集极大地丰富了场景与对象的多样性，使得对算法在真实野外环境下的性能评估更为全面和可靠。此外，其精细的属性标注为分析伪装物体在不同挑战性场景中的运动特性提供了可能，推动了对于时空一致性建模与伪装判别能力之间平衡关系的理论探索。

衍生相关工作

CAMotion数据集的发布催生并促进了视频伪装物体检测领域一系列相关经典工作的进展。基于该数据集进行的基准评估，揭示了现有静态COD方法与视频VCOD方法在判别能力与时间一致性之间的固有权衡，这一发现直接引导了后续研究致力于设计能够兼顾两者的统一框架。例如，像ZoomNeXt这类方法通过模仿人类视觉的缩放机制并利用时序信息，在CAMotion上展现了改进的时序一致性处理能力。同时，该数据集也激励了研究者探索如何更有效地融合外观线索与运动信息，例如EMIP方法显式地利用预训练光流模型来处理运动线索，而CamSAM2等研究则尝试将强大的基础分割模型SAM2的泛化能力适配到VCOD任务中，这些工作都得益于CAMotion提供的丰富、多样的评估环境。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集