CSeg

Hugging Face2025-08-13 更新2025-08-14 收录

下载链接：

https://huggingface.co/datasets/hoskerelab/CSeg

下载链接

链接失效反馈

官方服务：

资源简介：

CSeg（变更分割）数据集是一个大规模、多视角、文本指导的变更检测数据集。包含超过50万个数据点，CSeg用于训练ViewDelta模型，该模型可以将文本提示与两个图像之间的相关变更关联起来。数据集分为测试集和训练集，每个集合都包含图像和标签。标签是文本指导的，指示两个图像之间的变化。数据集的结构包括图像A、图像B和标签的路径。

创建时间：

2025-08-11

原始信息汇总

CSeg数据集概述

基本信息

许可证: MIT
任务类别: 图像分割
语言: 英文
数据集名称: CSeg
规模: 100K < n < 1M

数据集描述

CSeg（Change Segmentation）是一个大规模、多视角、文本引导的变化检测数据集。包含超过50万个数据点，用于训练ViewDelta模型以关联文本提示与两幅图像之间的相关变化。

数据集下载

bash wget https://huggingface.co/datasets/hoskerelab/CSeg/resolve/main/download.sh bash download.sh

数据集结构

数据集包含以下文件和目录结构：

cseg_test.csv 和 cseg_train.csv：分别提供测试集和训练集的Image A、Image B及其标签的路径。
cseg/ 目录结构：
- test/ 和 train/ 子目录：
  - image_a/：存储第一幅图像
  - image_b/：存储第二幅图像
  - label/：存储变化标签

引用

bibtex @misc{varghese2025viewdeltatextpromptedchangedetection, title={ViewDelta: Text-Prompted Change Detection in Unaligned Images}, author={Subin Varghese and Joshua Gao and Vedhus Hoskere}, year={2025}, eprint={2412.07612}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2412.07612}, }

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，变化检测任务对数据质量提出了严苛要求。CSeg数据集通过精心设计的采集流程，构建了包含50万数据点的大规模样本库。该数据集采用非对齐图像对作为输入，每对图像均配有精确的像素级变化标注和文本描述提示，数据来源涵盖多视角、多时相的遥感及街景图像，确保了样本的多样性和代表性。

特点

作为文本引导的变化检测基准数据集，CSeg展现出三大核心优势：其一是规模优势，超50万样本量位居同类数据集前列；其二是多模态特性，同时包含视觉图像和语义文本的双重标注；其三是视角多样性，数据集收录了不同拍摄角度、不同时间跨度的非对齐图像对，为模型泛化能力测试提供了理想平台。

使用方法

研究者可通过官方提供的下载脚本便捷获取CSeg数据集，其目录结构清晰划分为训练集和测试集。每个样本包含原始图像对（image_a/image_b）及对应的变化掩膜（label），配套的CSV文件详细记录了数据路径映射关系。该数据集特别适用于端到端的变化检测模型训练，用户可结合文本提示信息，开发基于深度学习的跨视角差异分析算法。

背景与挑战

背景概述

CSeg数据集作为一项专注于变化分割任务的大规模视觉数据集，由Subin Varghese等研究人员于2025年提出，旨在解决非对齐图像中基于文本提示的变化检测问题。该数据集由Hoskerelab团队构建，包含超过50万个数据点，为训练ViewDelta模型提供了丰富的多视角图像对及其对应的文本描述标签。其创新性在于将自然语言处理与计算机视觉相结合，推动了跨模态理解在变化检测领域的发展，为遥感监测、智能安防等应用场景提供了新的研究范式。

当前挑战

CSeg数据集面临的挑战主要体现在两个方面：领域问题层面，非对齐图像间的视角差异导致变化区域难以准确定位，且文本提示与视觉变化的语义对齐存在显著歧义；数据构建层面，大规模图像对的精确标注需要耗费巨量人工成本，而多源数据的采集过程中视角、光照等变量的控制亦极具复杂性。这些挑战使得模型在理解细粒度变化和泛化到未见场景时仍存在性能瓶颈。

常用场景

经典使用场景

在计算机视觉领域，CSeg数据集为图像变化检测任务提供了丰富的资源。其经典使用场景包括训练和评估文本引导的变化检测模型，如ViewDelta，通过对比两幅未对齐图像，识别并分割出文本提示所指定的变化区域。这一过程不仅要求模型理解图像内容，还需将文本语义与视觉变化精准关联。

解决学术问题

CSeg数据集有效解决了变化检测研究中未对齐图像匹配和文本引导分割的难题。传统方法受限于严格的对齐要求和固定的语义类别，而CSeg通过大规模多样化数据和文本提示，推动了跨视角变化检测的泛化能力，为弱监督学习和多模态理解提供了新的研究范式。

衍生相关工作

围绕CSeg衍生的经典工作包括ViewDelta框架及其变体，这些模型通过引入注意力机制和跨模态对齐策略，进一步提升了文本引导变化检测的精度。后续研究还探索了基于CSeg的零样本迁移能力，将其扩展至医疗影像对比等新兴场景。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集