five

ChangeNet|变化检测数据集|遥感图像分析数据集

收藏
arXiv2024-04-12 更新2024-06-21 收录
变化检测
遥感图像分析
下载链接:
https://github.com/jankyee/ChangeNet
下载链接
链接失效反馈
资源简介:
ChangeNet数据集是由中国科学技术大学和阿里巴巴集团联合创建的,专注于多时相非对称变化检测的大型数据集。该数据集包含31,000对多时相图像,覆盖100个中国城市的复杂场景,并具有6个像素级标注类别。ChangeNet不仅适用于二值变化检测(BCD)和语义变化检测(SCD)任务,还特别强调了实际应用中的视角和形状畸变,旨在推动变化检测算法的实际应用。数据集的创建过程涉及从WayBack平台获取2014至2022年的0.3米分辨率图像,并通过高效的标注策略进行处理,以确保高质量的标注和较低的成本。ChangeNet的应用领域包括土地资源管理、城市化监测和土地退化评估等,旨在解决现有数据集在数量、时相和实用性方面的不足。
提供机构:
中国科学技术大学
创建时间:
2023-12-29
AI搜集汇总
数据集介绍
main_image_url
构建方式
ChangeNet数据集通过利用WayBack平台提供的0.3米分辨率图像,从2014年至2022年期间采集了来自中国100个城市的31,000对多时相图像。每个城市随机选择100个不重叠的区域进行数据采集,最终形成31,805个图像集,平均每个图像集包含四张图像。为了高效标注,研究团队设计了一种增量标注策略,仅对按时间顺序排列的图像对进行标注,显著减少了标注工作量。此外,通过模型辅助的标注方法,生成的参考掩码帮助标注者更高效地完成像素级分类标注,涵盖了6个类别。
特点
ChangeNet数据集在数量、时相跨度和实用性方面显著优于现有变化检测数据集。它包含31,000对多时相图像,覆盖6个时相,分辨率达到0.3米,且图像尺寸为1900×1200。数据集涵盖了100个城市的复杂场景,包含大量真实世界中的视角畸变,特别适合于二值变化检测(BCD)和语义变化检测(SCD)任务。此外,ChangeNet引入了“非对称变化检测”任务,反映了实际遥感图像采集中的视角和形状畸变,提升了数据集的实用性和挑战性。
使用方法
ChangeNet数据集适用于二值变化检测(BCD)和语义变化检测(SCD)任务。对于BCD任务,研究者可以利用数据集中的图像对来检测地表覆盖变化区域;对于SCD任务,数据集提供了详细的像素级分类标注,帮助识别变化区域的类别信息。研究者可以通过基准测试方法对数据集进行评估,验证其算法在复杂场景和多时相图像中的表现。此外,数据集的预训练模型在其他变化检测数据集上的表现也展示了其广泛的适用性和潜在的研究价值。
背景与挑战
背景概述
随着遥感技术的快速发展,变化检测(Change Detection, CD)作为一项关键任务,旨在通过双时态或多时态遥感影像识别地表变化信息,广泛应用于土地资源管理、城市化进程监测等领域。然而,现有变化检测数据集在数量、时序长度和实用性方面存在显著不足,难以满足实际应用需求。为此,中国科学技术大学、阿里巴巴集团和上海交通大学联合推出了ChangeNet数据集,该数据集包含31,000对多时态图像,覆盖100个城市,具有6个像素级标注类别,且包含大量实际场景中的视角畸变,适用于二值变化检测(BCD)和语义变化检测(SCD)任务。ChangeNet的推出不仅填补了现有数据集的空白,还提出了‘非对称变化检测’这一新任务,推动了变化检测算法在实际应用中的发展。
当前挑战
ChangeNet数据集的构建面临多重挑战。首先,多时态图像的采集和标注成本高昂,导致现有数据集数量有限,且时序长度较短,难以全面反映地表变化。其次,现有数据集在不同时态的图像采集过程中,由于设备参数、天气条件等因素的差异,图像之间存在视角和形状的畸变,而现有数据集通常假设图像在像素级别上严格对称,这限制了算法在实际应用中的表现。此外,ChangeNet数据集的标注工作复杂,需要对多时态图像进行逐像素的精细标注,且需考虑不同时态图像之间的变化关系,进一步增加了标注的难度。这些挑战不仅推动了数据集的构建,也为变化检测算法的研究提出了更高的要求。
常用场景
经典使用场景
ChangeNet数据集在多时相变化检测领域中具有经典的使用场景,特别适用于二值变化检测(BCD)和语义变化检测(SCD)任务。该数据集包含了31,000对多时相图像,涵盖了从2014年到2022年的六个时间阶段,适用于分析城市化、土地沙漠化等长期变化过程。其丰富的标注信息和复杂的场景变化,使得ChangeNet成为验证和开发变化检测算法的重要基准。
实际应用
ChangeNet数据集在实际应用中具有广泛的前景,特别是在城市规划、环境监测和灾害评估等领域。通过分析多时相图像中的变化,可以有效监测城市扩张、土地利用变化和自然灾害的影响。此外,数据集中包含的真实世界视角畸变,使得算法在实际应用中更具鲁棒性,能够应对复杂的现实场景,提升变化检测技术的实用性和可靠性。
衍生相关工作
基于ChangeNet数据集,衍生了一系列经典工作,推动了变化检测领域的研究进展。例如,研究者们提出了多种基于深度学习的变化检测模型,如ChangeSTAR和ChangeFormer,这些模型在ChangeNet上进行了基准测试,展示了其在处理复杂变化场景中的优越性能。此外,ChangeNet还启发了对非对称变化检测的研究,进一步拓展了变化检测的应用范围和深度。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国1km分辨率逐月降水量数据集(1901-2024)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2024.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

13_Gitovu.rar

:unav

DataCite Commons 收录

Kaggle Financial Statement Data

该数据集包含公司财务报表的数据,涵盖了多个公司的财务信息,如资产负债表、利润表和现金流量表等。数据以CSV格式提供,便于分析和处理。

www.kaggle.com 收录

AerialMegaDepth

AerialMegaDepth数据集是由卡内基梅隆大学研究者创建的,该数据集结合了伪合成渲染和真实地面图像,旨在推进从地面和空中视角的图像中学习几何重建和视图合成任务。数据集通过将3D城市级网格的伪合成渲染与来自MegaDepth的真实地面级图像在统一坐标系中注册,包含了137个地标和132,137个地理注册图像。该数据集在具有挑战性的地面-空中场景中,显著提高了基于学习的方法在多视图几何预测和新型视图合成任务上的性能。

arXiv 收录

TimeExtractor

该数据集由JioNLP创建,旨在微调大型语言模型(LLMs)以从文本中提取时间实体,并将其标准化为JSON格式。数据集分为两部分:general.json包含从各种新闻来源提取的样本,smartspeaker.json包含从语音助手获取的样本。提取过程首先从文本中提取原始时间实体字符串,然后通过大型模型进行标准化处理,最终结果可以输入到JioNLP的时间解析模块jio.parse中进行处理,以获得准确可靠的结果。数据集目前规模较小,未来可以通过添加各种类型的文本来扩展。

huggingface 收录