UCCD
收藏arXiv2026-05-06 更新2026-05-08 收录
下载链接:
https://github.com/G124556/ptnet
下载链接
链接失效反馈官方服务:
资源简介:
UCCD是由电子科技大学构建的大规模无人机城市建筑变化检测与描述数据集,包含9000对高分辨率(6cm/像素)低空无人机图像及45000条标注语句,覆盖徐州地区7天间隔的建筑动态变化。数据通过滑动窗口裁剪为1024×1024子图,并采用LightGlue算法进行像素级配准,过滤变化区域不足0.8%的样本以确保质量。该数据集专注于细粒度城市施工场景(如违建扩张、用地变迁),为联合变化检测与语义描述任务提供首个低空无人机基准,支持城市规划审计与智能监测应用。
UCCD is a large-scale unmanned aerial vehicle (UAV) urban building change detection and description dataset developed by the University of Electronic Science and Technology of China (UESTC). It contains 9000 pairs of high-resolution (6 cm/pixel) low-altitude UAV images and 45000 annotated statements, covering dynamic building changes over a 7-day interval in the Xuzhou area. The dataset is cropped into 1024×1024 sub-images via a sliding window, and pixel-level registration is performed using the LightGlue algorithm. Samples with change regions accounting for less than 0.8% are filtered out to ensure data quality. Focused on fine-grained urban construction scenarios such as illegal construction expansion and land use transitions, this dataset provides the first low-altitude UAV benchmark for the joint task of change detection and semantic description, supporting applications including urban planning auditing and intelligent monitoring.
提供机构:
电子科技大学
创建时间:
2026-05-06
原始信息汇总
数据集概述
本数据集专为无人机城市建筑影像的遥感变化描述任务设计,支持联合变化检测与变化描述。
数据格式
数据集采用以下目录结构:
split_3_images/ ├── train/ │ ├── A/ # 变化前图像 │ ├── B/ # 变化后图像 │ └── Label/ # 二值变化掩码 ├── val/ └── test/
- A 目录:存储变化前的图像。
- B 目录:存储变化后的图像。
- Label 目录:存储二值变化掩码(变化区域标注)。
标注文件
- 文件名:
wanzhengbanbe.json - 内容:每对图像对包含来自5个不同视觉语言模型(VLM)的5个描述文本。
- 训练样本扩增:每个图像对扩展为5个独立的训练样本(每个描述对应一个样本)。
- 评估方式:在评估时,单个预测结果会与全部5个参考描述进行评分。
数据集使用
原型库构建(训练前执行一次)
bash python scripts/build_prototypes.py --dataset uccd
- 对训练集差异特征(来自CLIP第12层)执行K-means聚类。
- 应用RBF空间插值。
- 原型库保存至
./cache/prototypes_uccd.pt。
训练
单GPU训练命令:
bash python train.py --dataset uccd
关键参数说明:
| 参数 | 说明 |
|---|---|
--dataset |
选择数据集:uccd 或 whu_cdc |
--output_dir |
保存检查点和日志的路径 |
--resume |
恢复训练的检查点路径 |
--batch_size |
覆盖默认批次大小 |
--img_size |
覆盖默认输入分辨率 |
--no_wandb |
禁用wandb日志记录 |
测试
bash python test.py --dataset uccd --checkpoint outputs/ptnet_uccd/best_model.pt --split test --save_predictions
搜集汇总
数据集介绍

构建方式
UCCD数据集的构建源于城市施工监测场景对高分辨率遥感影像变化描述的需求。数据采集于中国江苏省徐州市,利用DJI无人机以天底视角获取原始分辨率为3024×4032像素、空间分辨率达6厘米/像素的影像对,时间间隔约为7天。通过LightGlue算法实现像素级配准后,采用滑动窗口策略裁剪为1024×1024像素的子图像,并舍弃变化区域占比小于0.8%的样本,最终获得9000对高质量影像。数据集以7:1:2的比例划分为训练集、验证集和测试集,涵盖建筑建造/拆除/翻新、临时结构搭建、太阳能设施安装、地面硬化及植被变化等多维变化类型。文本标注采用多模型协作自动化策略,选取GPT-5 Mini等五种主流视觉语言大模型分别生成描述,并通过人工校验确保一致性,共计45000条标注句子。
使用方法
UCCD数据集主要面向遥感图像变化描述与检测的联合任务,使用者可通过公开的GitHub仓库获取数据与源代码。在实验中,推荐将图像对输入至基于CLIP视觉编码器与Qwen2-1.5B-Instruct语言模型的框架中,利用原型引导的跨时相交互模块建模变化语义,并通过任务自适应多头门控解耦检测与描述的特征需求。训练时采用AdamW优化器,在两块NVIDIA A100 GPU上以总批次32、学习率1e-4进行200轮迭代,并通过动态权重平衡优化多任务损失。评估指标方面,变化描述采用BLEU、METEOR、ROUGE-L及CIDEr-D,变化检测使用IoU与F1分数,使用者可依据论文中的基线结果复现实验并在实际城市施工监测场景中迁移应用。
背景与挑战
背景概述
遥感影像变化描述旨在通过自然语言精准刻画双时相影像中的场景演变,其意义超越了传统二值变化检测的局限,为城市监测、土地利用审计等任务提供了可解释的语义信息。在此背景下,由电子科技大学高玉鹏等人于2026年提出的UCCD数据集,聚焦于城市施工场景,首次构建了基于低空无人机平台的大规模基准。该数据集包含9000对高分辨率影像(6厘米/像素)及45000条人工审核的标注语句,覆盖建筑拆建、临时设施安装、植被变化等多种变化类型,填补了现有卫星数据集在城市动态细节与标注规模上的不足,为推进遥感变化描述研究提供了高质量数据支撑。
当前挑战
现有方法面临两重核心挑战:其一,遥感变化描述需同时完成变化检测与描述生成,但二者对特征表示的需求存在本质冲突——检测追求空间精度,而描述侧重语义抽象,简单共享特征或并行分支设计无法化解这一粒度不匹配问题;其二,既有数据集多聚焦自然灾害或农业变化,样本分辨率低且场景单一,难以捕捉城市施工中违法扩建、细粒度土地利用转换等动态细节。此外,构建UCCD本身亦具挑战:需对间隔约7天的无人机影像进行像素级配准,并精确标注变化区域及多模型协作生成的描述文本,同时确保90%以上的标注一致性以保障质量。
常用场景
经典使用场景
在遥感图像变化描述领域,UCCD数据集以其高分辨率无人机影像和丰富的城市施工场景标注,成为推动细粒度变化理解与语言生成研究的关键基石。研究人员借助该数据集,能够系统性地训练与评估模型在双时相图像中精准识别建筑翻新、临时设施搭建、土地硬化等复杂变动类型,并生成符合空间语义的自然语言描述。其九千对1024×1024像素的高质量图像对与四万五千句多模态协作标注,为探索变化检测与描述联合建模提供了前所未有的数据支撑。
解决学术问题
该数据集有效填补了现有遥感变化描述基准在城市施工场景覆盖不足的空白,解决了传统数据集分辨率低、变化类型单一、标注规模有限等长期困境。依托UCCD,学术界得以深入探讨隐式特征差分难以建模结构化变化语义的根本难题,以及变化检测的空间精确性与描述生成的语义抽象性之间的表征冲突。这些突破推动了原型引导学习与任务自适应解耦等创新方法的涌现,显著提升了模型在复杂城市环境下的时空语义对齐能力。
实际应用
在城市规划与智慧治理实践中,UCCD数据集赋能了一系列自动化遥感监测应用,尤其适用于违章建筑巡检、施工进度追踪及土地利用变更审计等关键场景。无人机搭载该数据集训练的模型,可实时解析高分辨率影像中的细微变动,自动生成图文并茂的巡查报告,极大降低了人工判读成本。此外,其在应急响应中亦能快速定位灾后重建区域的变化细节,为决策制定提供可解释的语义证据,推动遥感信息从专业解译走向普惠应用。
数据集最近研究
最新研究方向
在遥感图像变化描述领域,当前前沿研究方向聚焦于从粗粒度的二值变化检测向具备语义理解能力的细粒度变化描述演进,尤其注重在高分辨率城市场景中实现变化检测与变化描述的联合建模。UCCD数据集的提出正是响应这一趋势,其以低空无人机影像为核心,构建了包含9000对高分辨率图像和45000条标注语句的大规模基准,覆盖建筑施工、拆除、光伏设施安装等多样化的城市动态变化类型,填补了现有卫星基准在细粒度城市监测方面的空白。该数据集配合所提出的PTNet框架,通过可学习原型建模结构化变化语义、任务自适应门控解耦特征冲突以及检测引导的空间先验注入,在WHU-CDC和UCCD上均取得了领先性能,推动了城市变化理解从二值掩码向空间感知、语义丰富的描述范式的实质性跨越,为智慧城市监测、非法建筑识别等热点应用提供了坚实的数据与方法论支撑。
相关研究论文
- 1UAV as Urban Construction Change Monitor: A New Benchmark and Change Captioning Model电子科技大学 · 2026年
以上内容由遇见数据集搜集并总结生成



