five

CC-Foundation|遥感图像数据集|变化检测数据集

收藏
arXiv2024-11-18 更新2024-11-20 收录
遥感图像
变化检测
下载链接:
https://github.com/Meize0729/CCExpert
下载链接
链接失效反馈
资源简介:
CC-Foundation数据集是由北京航空航天大学创建的高质量多样化数据集,专门用于遥感图像变化描述任务。该数据集包含200,000对多时相遥感图像和120万条自然语言描述,涵盖了广泛的场景和变化类型。数据集的创建过程结合了多种开源数据集的优化、基于变化检测数据集的扩展以及领域专家的注释,确保了数据集的多样性和挑战性。CC-Foundation数据集主要应用于环境监测和灾害管理等领域,旨在通过提供精确和深入的变化描述来增强对动态地表变化的监测和理解。
提供机构:
北京航空航天大学
创建时间:
2024-11-18
原始信息汇总

CCExpert 数据集概述

数据集介绍

CCExpert 数据集是一个用于遥感变化描述的大型数据集,名为 "CC-Foundation Dataset"。该数据集旨在支持多模态语言学习模型(MLLM)在遥感变化描述任务中的能力提升。

数据集下载

数据集的部分内容已开源,可通过以下链接下载:

数据处理步骤

  1. 下载并解压数据集:从上述链接下载数据集,并解压压缩包。
  2. 生成JSON文件:使用 add_sbsolute_path_to_all_json.py 脚本生成包含所有JSON数据文件的子文件夹,并将图像路径从相对路径转换为绝对路径。
  3. 更新YAML文件:使用 add_CC_Foundation_local_absolute_path_to_yaml.py 脚本将CC-Foundation的绝对路径添加到模板YAML文件中,以便查找相应的JSON标注文件。

数据集使用许可

使用该数据集时,请遵守各自数据集的许可协议。

AI搜集汇总
数据集介绍
main_image_url
构建方式
CC-Foundation数据集的构建方式体现了对多样化和高质数据的追求。首先,该数据集整合了多个开源的变化描述数据集,如CLVER-Change、ImageEdit-Request、Spot-the-diff、stvchrono、Vismin和LEVIR-CC,这些数据集经过大型语言模型(如GPT-4o)的进一步精炼和优化,以提升标注的准确性和表达的多样性。其次,基于变化检测数据集(如ChangeSim和SYSU-CD),利用变化掩码作为提示,通过多轮对话生成详细的变化描述。最后,引入SECOND数据集,该数据集包含多种语义变化图像对,并由领域专家进行精细标注,以增强数据集的多样性和挑战性。
特点
CC-Foundation数据集的显著特点在于其大规模、多样性和高质量。该数据集包含200,000对图像和120万条标注,涵盖了从自然图像到遥感图像的广泛领域。通过整合和优化多个开源数据集,并结合大型语言模型和专家标注,数据集不仅在数量上达到大规模,而且在标注质量和多样性上也达到了高水平。这种多样性和高质量的标注使得数据集在支持遥感图像变化描述任务上具有显著优势。
使用方法
CC-Foundation数据集主要用于支持多模态大语言模型(MLLM)在遥感图像变化描述任务中的继续预训练。使用该数据集时,首先需要对模型进行多阶段的预训练,以确保模型能够深度整合差异感知模块和预训练的MLLM。具体步骤包括:第一阶段,仅训练差异捕捉和注入模块,冻结图像编码器和大语言模型的参数;第二阶段,解冻所有模型参数,优化语言模型对图像特征的理解和文本生成;第三阶段,在特定领域数据上进行训练,以确保模型在实际应用中达到最佳性能。通过这种三阶段的训练策略,CC-Foundation数据集能够显著提升模型在遥感图像变化描述任务中的表现。
背景与挑战
背景概述
CC-Foundation数据集由北京航空航天大学的研究团队创建,旨在推动遥感图像变化描述(RSICC)领域的发展。该数据集包含200,000对图像和120万条描述,涵盖了多种地表变化,如建筑物的新增或消失。其核心研究问题是如何利用多模态大语言模型(MLLMs)的长期序列理解和推理能力,生成自然语言描述,详细说明多时相遥感图像之间的变化。CC-Foundation数据集的构建不仅为RSICC任务提供了丰富的数据支持,还显著提升了模型在该领域的性能,推动了遥感图像变化分析技术在环境监测和灾害管理中的应用。
当前挑战
CC-Foundation数据集在构建过程中面临多重挑战。首先,如何有效地整合和优化来自多个开源数据集的数据,确保数据的高质量和多样性,是一个重要问题。其次,利用GPT-4o生成变化描述时,如何确保生成的描述准确且符合实际变化,也是一个技术难题。此外,数据集的构建需要大量的计算资源和时间,如何在有限的资源下高效地完成数据集的构建和优化,是另一个挑战。最后,如何设计有效的训练策略,确保模型能够充分利用数据集中的信息,提升其在实际应用中的表现,也是一项关键挑战。
常用场景
经典使用场景
CC-Foundation数据集在遥感图像变化描述领域中具有经典应用场景,主要用于生成多时相遥感图像之间的自然语言描述,详细描述变化对象的类别、位置和动态(如新增或消失)。该数据集通过提供高质量、多样化的图像对和相应的描述,支持多模态大语言模型(MLLMs)在遥感图像变化描述任务中的预训练和微调,从而提升模型对长序列理解和推理的能力。
解决学术问题
CC-Foundation数据集解决了当前多模态大语言模型在遥感图像变化描述任务中缺乏全面数据支持的问题。通过提供20万对图像和120万条描述,该数据集显著增强了模型的基础能力,避免了因数据不足导致的模型内在知识破坏和性能受限。这不仅提升了模型的泛化能力,还为相关领域的学术研究提供了丰富的数据资源。
衍生相关工作
基于CC-Foundation数据集,衍生了许多相关工作,包括但不限于改进的多模态大语言模型架构设计、差异感知集成模块的优化以及三阶段渐进式训练策略的研究。这些工作不仅提升了模型在遥感图像变化描述任务中的性能,还推动了多模态学习在其他跨模态任务中的应用,如图像描述和视觉问答。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

Pima Indians Diabetes Database

该项目使用的数据集是Pima Indians Diabetes Database,来源于UCI机器学习库。该数据集包含多个医学预测变量和一个目标变量,即Outcome,用于指示患者是否患有糖尿病(1)或未患(0)。

github 收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录

WorldClim

WorldClim是一个全球气候数据集,提供了全球范围内的气候数据,包括温度、降水、生物气候变量等。数据集的分辨率从30秒到10分钟不等,适用于各种尺度的气候分析和建模。

www.worldclim.org 收录