five

ChangeChat-105k

收藏
arXiv2025-07-30 更新2025-08-01 收录
下载链接:
https://github.com/hanlinwu/DeltaVLM
下载链接
链接失效反馈
官方服务:
资源简介:
ChangeChat-105k 是一个大规模的指令遵循数据集,由北京外国语大学信息科学与技术学院的研究人员构建。该数据集包含 105,107 个指令-响应对,通过结合基于规则的方法和 ChatGPT 的上下文学习能力生成,覆盖了六种交互类型:变化描述、分类、量化、定位、开放式问答和多轮对话。ChangeChat-105k 旨在支持遥感图像变化分析(RSICA)任务,该任务结合了变化检测和视觉问答的优势,以实现对双时相遥感图像中变化的多轮、指令引导的探索。

ChangeChat-105k is a large-scale instruction-following dataset constructed by researchers from the School of Information Science and Technology, Beijing Foreign Studies University. This dataset contains 105,107 instruction-response pairs, generated by integrating rule-based methods and ChatGPT's in-context learning capabilities, covering six interaction types: change description, classification, quantification, localization, open-ended question answering, and multi-turn dialogue. ChangeChat-105k is designed to support the Remote Sensing Image Change Analysis (RSICA) task, which combines the strengths of change detection and visual question answering to enable multi-turn, instruction-guided exploration of changes in bi-temporal remote sensing images.
提供机构:
北京外国语大学信息科学与技术学院
创建时间:
2025-07-30
原始信息汇总

RSICA数据集概述

数据集简介

  • 数据集名称:RSICA(Interactive Remote Sensing Image Change Analysis)
  • 研究领域:遥感图像变化分析

数据集特点

  • 任务类型:交互式遥感图像变化分析(提出新任务)
  • 包含内容:新型数据集
  • 相关方法:提出新方法

应用方向

  • 遥感图像分析
  • 变化检测
  • 交互式图像处理
搜集汇总
数据集介绍
main_image_url
构建方式
ChangeChat-105k数据集通过混合规则驱动与GPT辅助的流程构建,整合了LEVIR-CC和LEVIR-MCI的标注数据。结构化任务(如目标计数、定位)采用OpenCV轮廓检测等规则方法生成精确标注,而开放型任务(开放式问答、多轮对话)则基于ChatGPT的上下文学习能力,通过人工设计的种子示例和提示模板生成多样化指令-响应对。该流程最终形成包含105,107组数据的六类交互任务体系,涵盖变化描述、分类、量化、定位及复杂推理。
特点
作为首个支持交互式遥感变化分析的大规模指令数据集,ChangeChat-105k具有多模态、多任务协同的鲜明特点。其双时相图像对与自然语言指令的耦合,支持从像素级变化检测到语义级因果推理的完整分析链条。数据集特别设计了渐进式难度递增的多轮对话任务,通过思维链(CoT)机制引导模型实现从变化识别到归因分析的递进推理。不同于传统静态标注,该数据集通过指令的动态适配性,可激发模型对光照差异、季节变化等干扰因素的鲁棒性理解。
使用方法
使用ChangeChat-105k时需遵循任务导向的分阶段策略。对于基础变化检测任务,可直接加载预处理的图像对与二分类标签进行模型微调。开放型任务需结合指令模板库,通过提示工程将用户查询映射到六类任务范式。评估阶段建议采用任务特异性指标组:变化描述用BLEU/CIDEr,量化任务用MAE/RMSE,定位任务则采用网格化F1-score。多轮对话需通过会话历史缓存机制维持上下文一致性,其响应质量可通过人工设计的推理深度指标进行量化分析。
背景与挑战
背景概述
ChangeChat-105k是由北京外国语大学信息科学技术学院的吴翰林团队于2024年构建的大规模遥感图像变化分析数据集。该数据集作为DeltaVLM模型的核心支撑,开创性地将变化检测与视觉问答相结合,形成了遥感图像变化分析(RSICA)这一全新研究范式。数据集包含105,107条指令-响应对,涵盖变化描述、分类、量化、定位、开放式问答和多轮对话六种交互类型,通过基于规则的方法与GPT辅助流程混合生成。其创新性体现在首次实现了双时相遥感影像的交互式、多任务分析能力,显著提升了传统遥感解译的灵活性和实用性。该数据集基于LEVIR-CC和LEVIR-MCI基准构建,但通过引入指令跟随机制,将静态变化分析扩展为动态可交互的智能解译系统,对推动遥感智能解译向人机协同方向发展具有里程碑意义。
当前挑战
ChangeChat-105k致力于解决遥感领域双时相影像的语义级变化理解与交互分析难题。在领域问题层面,传统方法受限于单次变化掩膜或静态描述,无法应对用户查询驱动的多轮分析需求;同时通用视觉语言模型因领域差异在遥感场景表现欠佳。数据集构建过程中面临三重挑战:一是双时相影像的跨模态对齐需克服传感器差异、光照变化等干扰因素;二是多类型指令生成需平衡结构化任务规则与开放式问题的语义多样性;三是变化语义的细粒度标注涉及道路、建筑等目标的精确量化与定位,需开发基于OpenCV的自动化标注流程。此外,保持变化描述与视觉证据的一致性,以及多轮对话的上下文连贯性,都对数据质量提出了更高要求。
常用场景
经典使用场景
ChangeChat-105k数据集在遥感图像变化分析领域具有广泛的应用场景,特别是在多时相遥感图像的交互式变化分析中。该数据集支持六种交互类型,包括变化描述、分类、量化、定位、开放式问答和多轮对话。研究人员可以利用该数据集进行多任务、多轮对话的遥感图像变化分析,从而实现对地表覆盖变化的精准解读。
实际应用
在实际应用中,ChangeChat-105k数据集为灾害管理、森林砍伐监测和环境监测等领域提供了有力支持。例如,在灾害管理中,救援人员可以通过交互式问答快速获取受灾区域的变化信息;在环境监测中,研究人员可以利用该数据集量化特定地物的变化情况,从而评估环境政策的实施效果。这些应用显著提升了遥感数据的利用效率和决策支持能力。
衍生相关工作
ChangeChat-105k数据集衍生了一系列经典工作,尤其是在遥感视觉语言模型(VLM)领域。基于该数据集提出的DeltaVLM模型通过其创新的双时相视觉编码器和视觉差异感知模块,在遥感图像变化分析任务中取得了最先进的性能。此外,该数据集还促进了RSGPT、GeoChat和RSLLaVA等模型的发展,推动了遥感领域多模态交互式分析的进步。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作